Экспоненциально модифицированное распределение Гаусса - Exponentially modified Gaussian distribution
Функция плотности вероятности | |||
Кумулятивная функция распределения | |||
Параметры | μ ∈ р - среднее значение гауссовой составляющей σ2 > 0 - дисперсия гауссовой составляющей λ > 0 - коэффициент экспоненциальной составляющей | ||
---|---|---|---|
Поддерживать | Икс ∈ р | ||
CDF | , куда | ||
Иметь в виду | |||
Режим | |||
Дисперсия | |||
Асимметрия | |||
Бывший. эксцесс | |||
MGF | |||
CF |
В теория вероятности, экспоненциально модифицированное гауссово распределение (ЭМГ, также известный как exGaussian распределение) описывает сумму независимых нормальный и экспоненциальный случайные переменные. Бывшая гауссовская случайная величина Z может быть выражено как Z = Икс + Y, куда Икс и Y независимы, Икс гауссово со средним μ и дисперсия σ2, и Y экспоненциально от скорости λ. Он имеет характерный положительный перекос от экспоненциальной составляющей.
Его также можно рассматривать как взвешенную функцию сдвинутой экспоненты, причем вес является функцией нормального распределения.
Определение
В функция плотности вероятности (pdf) экспоненциально измененного нормальное распределение является[1]
где erfc - это дополнительная функция ошибок определяется как
Эта функция плотности выводится через свертка нормального и экспоненциальный функции плотности вероятности.
Альтернативные формы вычислений
Альтернативная, но эквивалентная форма распределения ЭМГ используется для описания формы пика в хроматография.[2] Это выглядит следующим образом
- (1)
куда
- - амплитуда гауссиана,
- - время релаксации экспоненты.
Эта функция не может быть вычислена для некоторых значений параметров (например, τ = 0) из-за арифметического переполнения. Альтернативная, но эквивалентная форма записи функции была предложена Делли:[3]
- (2)
куда это масштабированная дополнительная функция ошибок
В случае этой формулы также возможно арифметическое переполнение, область переполнения отличается от первой формулы, за исключением очень малого τ.
При малых τ целесообразно использовать асимптотику второй формулы:
- (3)
Решение об использовании формулы принимается на основании параметра :
- за z <0 должно быть выполнено вычисление[2] по первой формуле,
- для 0 ≤ z ≤ 6.71·107 (в случае формат с плавающей запятой двойной точности ) по второй формуле,
- и для z > 6.71·107 по третьей формуле.
Режим (положение вершины, наиболее вероятное значение) вычисляется[2] с использованием производной формулы 2; противоположность масштабированная дополнительная функция ошибок erfcxinv () используется для расчета. Приблизительные значения также предлагает Калембет.[2] Хотя значение моды выше, чем у исходного гауссиана, вершина всегда находится на исходном (неизмененном) гауссиане.
Оценка параметров
Есть три параметра: иметь в виду нормального распределения (μ), стандартное отклонение нормального распределения (σ) и экспоненциальный спад параметр (τ = 1 / λ). Форма K = τ / σ также иногда используется для характеристики распределения. В зависимости от значений параметров распределение может иметь форму от почти нормальной до почти экспоненциальной.
Параметры распределения можно оценить по выборочным данным с помощью метод моментов следующее:[4][5]
куда м выборочное среднее, s - стандартное отклонение выборки, а γ1 это перекос.
Решение этих параметров дает:
Рекомендации
Ратклифф предположил, что в выборке должно быть не менее 100 точек данных, прежде чем оценки параметров следует считать надежными.[6] Винсент усреднение может использоваться с меньшими выборками, так как эта процедура лишь незначительно искажает форму распределения.[7] Эти точечные оценки могут использоваться в качестве начальных значений, которые могут быть уточнены более мощными методами, включая максимальная вероятность.
Доверительные интервалы
В настоящее время нет опубликованных таблиц, доступных для тестирования значимости с этим распределением. Распределение может быть смоделировано путем формирования суммы двух случайных величин, одна из которых получена из нормального распределения, а другая - из экспоненты.
Перекос
Ценность непараметрический перекос
этого распределения лежит между 0 и 0,31.[8][9] К нижнему пределу приближаются, когда преобладает нормальный компонент, и к верхнему, когда доминирует экспоненциальный компонент.
Вхождение
Распределение используется в качестве теоретической модели формы хроматографический пики.[1][2][10] Это было предложено в качестве статистической модели перемежающееся время в делящихся клетках.[11][12] Он также используется при моделировании кластерных ионных пучков.[13] Он обычно используется в психологии и других науках о мозге для изучения времени реакции.[14][15] В небольшом варианте, когда среднее значение Нормального компонента установлено на ноль, оно также используется в Стохастический пограничный анализ, как одна из спецификаций распределения для составного члена ошибки, моделирующего неэффективность. [16]
Связанные дистрибутивы
Это семейство дистрибутивов - частный или предельный случай нормально-экспоненциально-гамма-распределение. Это также можно рассматривать как трехпараметрическое обобщение нормального распределения для добавления перекоса; другой подобный дистрибутив - асимметричное нормальное распределение, у которого более тонкие хвосты. Распределение сложное распределение вероятностей в котором среднее значение нормальное распределение изменяется случайным образом как смещенный экспоненциальное распределение.
А Гауссов минус экспоненциальный распределение было предложено для моделирования цен опционов.[17] Если такая случайная величина Y имеет параметры μ, σ, λ, то его отрицательный -Y имеет экспоненциально модифицированное гауссово распределение с параметрами -μ, σ, λ, и поэтому Y имеет в виду и дисперсия .
Рекомендации
- ^ а б Грушка, Эли (1972). «Характеристика экспоненциально модифицированных гауссовых пиков в хроматографии». Аналитическая химия. 44 (11): 1733–1738. Дои:10.1021 / ac60319a011. PMID 22324584.
- ^ а б c d е Kalambet, Y .; Козьмин, Ю .; Михайлова, К .; Нагаев, И .; Тихонов, П. (2011). «Реконструкция хроматографических пиков с использованием экспоненциально модифицированной функции Гаусса». Журнал хемометрики. 25 (7): 352. Дои:10.1002 / cem.1343. S2CID 121781856.
- ^ Делли, Р. (1985). «Ряды для экспоненциально модифицированной формы гауссова пика». Анальный. Chem. 57: 388. Дои:10.1021 / ac00279a094.
- ^ Дайсон, Н.А. (1998). Методы хроматографической интеграции. Королевское химическое общество, информационные службы. п. 27. ISBN 9780854045105. Получено 2015-05-15.
- ^ Оливье Дж. И Норберг М. М. (2010) Положительно искаженные данные: пересмотр степенного преобразования Бокса-Кокса. Int. J. Psych. Res. 3 (1) 68-75.
- ^ Ратклифф, Р. (1979). «Распределение времени реакции группы и анализ статистики распределения». Psychol. Бык. 86 (3): 446–461. CiteSeerX 10.1.1.409.9863. Дои:10.1037/0033-2909.86.3.446. PMID 451109.
- ^ Винсент, С. Б. (1912). «Функции вибрисс в поведении белой крысы». Монографии по поведению животных. 1 (5): 7–81.
- ^ Хиткот, А (1996). «RTSYS: DOS-приложение для анализа данных о времени реакции». Методы, инструменты и компьютеры исследования поведения. 28 (3): 427–445. Дои:10.3758 / bf03200523.
- ^ Ulrich, R .; Миллер, Дж. (1994). «Влияние исключения выбросов на анализ времени реакции». J. Exp. Психология: Общие. 123: 34–80. Дои:10.1037/0096-3445.123.1.34.
- ^ Глэдни, HM; Дауден, Б.Ф .; Свален, JD (1969). «Компьютерная газожидкостная хроматография». Анальный. Chem. 41 (7): 883–888. Дои:10.1021 / ac60276a013.
- ^ Голубев, А. (2010). «Экспоненциально модифицированная гауссова (ЭМГ) актуальность для распределений, связанных с пролиферацией и дифференцировкой клеток». Журнал теоретической биологии. 262 (2): 257–266. Дои:10.1016 / j.jtbi.2009.10.005. PMID 19825376.
- ^ Тайсон, Д. Р .; Garbett, S.P .; Frick, P.L .; Каранта, В. (2012). «Фракционная пролиферация: метод деконволюции динамики популяции клеток из данных отдельных клеток». Природные методы. 9 (9): 923–928. Дои:10.1038 / nmeth.2138. ЧВК 3459330. PMID 22886092.
- ^ Nicolaescu, D .; Takaoka, G.H .; Исикава Дж. (2006). «Многопараметрическая характеристика пучков кластерных ионов». Журнал Vacuum Science & Technology B: Microelectronics and Nanometer Structures. 24 (5): 2236. Bibcode:2006JVSTB..24.2236N. Дои:10.1116/1.2335433.
- ^ Палмер, EM; Горовиц Тодд, S; Торральба, А; Вулф, JM (2011). «Каковы формы распределения времени отклика при визуальном поиске?». J Exp Psychol. 37 (1): 58–71. Дои:10.1037 / a0020747. ЧВК 3062635. PMID 21090905.
- ^ Рорер, D; Wixted, JT (1994). «Анализ задержки и времени между ответами при свободном отзыве». Память и познание. 22 (5): 511–524. Дои:10.3758 / BF03198390. PMID 7968547.
- ^ Ловелл, Нокс Калифорния; С.С. Кумбхакар (2000). Стохастический пограничный анализ. Издательство Кембриджского университета. С. 80–82.
- ^ Питер Карр и Дилип Б. Мадан, Методы перевала для ценообразования опционов, Журнал вычислительных финансов (49–61), том 13 / номер 1, осень 2009 г.