Экспоненциально модифицированное распределение Гаусса - Exponentially modified Gaussian distribution

ЭМГ
Функция плотности вероятности
Функция плотности вероятности для распределения ЭМГ
Кумулятивная функция распределения
Кумулятивная функция распределения для распределения ЭМГ
Параметрыμр - среднее значение гауссовой составляющей
σ2 > 0 - дисперсия гауссовой составляющей
λ > 0 - коэффициент экспоненциальной составляющей
ПоддерживатьИкср
PDF
CDF

, куда
- CDF гауссова распределения,
,

Иметь в виду
Режим

Дисперсия
Асимметрия
Бывший. эксцесс
MGF
CF

В теория вероятности, экспоненциально модифицированное гауссово распределение (ЭМГ, также известный как exGaussian распределение) описывает сумму независимых нормальный и экспоненциальный случайные переменные. Бывшая гауссовская случайная величина Z может быть выражено как Z = Икс + Y, куда Икс и Y независимы, Икс гауссово со средним μ и дисперсия σ2, и Y экспоненциально от скорости λ. Он имеет характерный положительный перекос от экспоненциальной составляющей.

Его также можно рассматривать как взвешенную функцию сдвинутой экспоненты, причем вес является функцией нормального распределения.

Определение

В функция плотности вероятности (pdf) экспоненциально измененного нормальное распределение является[1]

где erfc - это дополнительная функция ошибок определяется как

Эта функция плотности выводится через свертка нормального и экспоненциальный функции плотности вероятности.

Альтернативные формы вычислений

Альтернативная, но эквивалентная форма распределения ЭМГ используется для описания формы пика в хроматография.[2] Это выглядит следующим образом

(1)

куда

- амплитуда гауссиана,
- время релаксации экспоненты.

Эта функция не может быть вычислена для некоторых значений параметров (например, τ = 0) из-за арифметического переполнения. Альтернативная, но эквивалентная форма записи функции была предложена Делли:[3]

(2)

куда это масштабированная дополнительная функция ошибок

В случае этой формулы также возможно арифметическое переполнение, область переполнения отличается от первой формулы, за исключением очень малого τ.

При малых τ целесообразно использовать асимптотику второй формулы:

(3)

Решение об использовании формулы принимается на основании параметра :

за z <0 должно быть выполнено вычисление[2] по первой формуле,
для 0 ≤ z ≤ 6.71·107 (в случае формат с плавающей запятой двойной точности ) по второй формуле,
и для z > 6.71·107 по третьей формуле.

Режим (положение вершины, наиболее вероятное значение) вычисляется[2] с использованием производной формулы 2; противоположность масштабированная дополнительная функция ошибок erfcxinv () используется для расчета. Приблизительные значения также предлагает Калембет.[2] Хотя значение моды выше, чем у исходного гауссиана, вершина всегда находится на исходном (неизмененном) гауссиане.

Оценка параметров

Есть три параметра: иметь в виду нормального распределения (μ), стандартное отклонение нормального распределения (σ) и экспоненциальный спад параметр (τ = 1 / λ). Форма K = τ / σ также иногда используется для характеристики распределения. В зависимости от значений параметров распределение может иметь форму от почти нормальной до почти экспоненциальной.

Параметры распределения можно оценить по выборочным данным с помощью метод моментов следующее:[4][5]

куда м выборочное среднее, s - стандартное отклонение выборки, а γ1 это перекос.

Решение этих параметров дает:

Рекомендации

Ратклифф предположил, что в выборке должно быть не менее 100 точек данных, прежде чем оценки параметров следует считать надежными.[6] Винсент усреднение может использоваться с меньшими выборками, так как эта процедура лишь незначительно искажает форму распределения.[7] Эти точечные оценки могут использоваться в качестве начальных значений, которые могут быть уточнены более мощными методами, включая максимальная вероятность.

Доверительные интервалы

В настоящее время нет опубликованных таблиц, доступных для тестирования значимости с этим распределением. Распределение может быть смоделировано путем формирования суммы двух случайных величин, одна из которых получена из нормального распределения, а другая - из экспоненты.

Перекос

Ценность непараметрический перекос

этого распределения лежит между 0 и 0,31.[8][9] К нижнему пределу приближаются, когда преобладает нормальный компонент, и к верхнему, когда доминирует экспоненциальный компонент.

Вхождение

Распределение используется в качестве теоретической модели формы хроматографический пики.[1][2][10] Это было предложено в качестве статистической модели перемежающееся время в делящихся клетках.[11][12] Он также используется при моделировании кластерных ионных пучков.[13] Он обычно используется в психологии и других науках о мозге для изучения времени реакции.[14][15] В небольшом варианте, когда среднее значение Нормального компонента установлено на ноль, оно также используется в Стохастический пограничный анализ, как одна из спецификаций распределения для составного члена ошибки, моделирующего неэффективность. [16]

Связанные дистрибутивы

Это семейство дистрибутивов - частный или предельный случай нормально-экспоненциально-гамма-распределение. Это также можно рассматривать как трехпараметрическое обобщение нормального распределения для добавления перекоса; другой подобный дистрибутив - асимметричное нормальное распределение, у которого более тонкие хвосты. Распределение сложное распределение вероятностей в котором среднее значение нормальное распределение изменяется случайным образом как смещенный экспоненциальное распределение.

А Гауссов минус экспоненциальный распределение было предложено для моделирования цен опционов.[17] Если такая случайная величина Y имеет параметры μ, σ, λ, то его отрицательный -Y имеет экспоненциально модифицированное гауссово распределение с параметрами , σ, λ, и поэтому Y имеет в виду и дисперсия .

Рекомендации

  1. ^ а б Грушка, Эли (1972). «Характеристика экспоненциально модифицированных гауссовых пиков в хроматографии». Аналитическая химия. 44 (11): 1733–1738. Дои:10.1021 / ac60319a011. PMID  22324584.
  2. ^ а б c d е Kalambet, Y .; Козьмин, Ю .; Михайлова, К .; Нагаев, И .; Тихонов, П. (2011). «Реконструкция хроматографических пиков с использованием экспоненциально модифицированной функции Гаусса». Журнал хемометрики. 25 (7): 352. Дои:10.1002 / cem.1343. S2CID  121781856.
  3. ^ Делли, Р. (1985). «Ряды для экспоненциально модифицированной формы гауссова пика». Анальный. Chem. 57: 388. Дои:10.1021 / ac00279a094.
  4. ^ Дайсон, Н.А. (1998). Методы хроматографической интеграции. Королевское химическое общество, информационные службы. п. 27. ISBN  9780854045105. Получено 2015-05-15.
  5. ^ Оливье Дж. И Норберг М. М. (2010) Положительно искаженные данные: пересмотр степенного преобразования Бокса-Кокса. Int. J. Psych. Res. 3 (1) 68-75.
  6. ^ Ратклифф, Р. (1979). «Распределение времени реакции группы и анализ статистики распределения». Psychol. Бык. 86 (3): 446–461. CiteSeerX  10.1.1.409.9863. Дои:10.1037/0033-2909.86.3.446. PMID  451109.
  7. ^ Винсент, С. Б. (1912). «Функции вибрисс в поведении белой крысы». Монографии по поведению животных. 1 (5): 7–81.
  8. ^ Хиткот, А (1996). «RTSYS: DOS-приложение для анализа данных о времени реакции». Методы, инструменты и компьютеры исследования поведения. 28 (3): 427–445. Дои:10.3758 / bf03200523.
  9. ^ Ulrich, R .; Миллер, Дж. (1994). «Влияние исключения выбросов на анализ времени реакции». J. Exp. Психология: Общие. 123: 34–80. Дои:10.1037/0096-3445.123.1.34.
  10. ^ Глэдни, HM; Дауден, Б.Ф .; Свален, JD (1969). «Компьютерная газожидкостная хроматография». Анальный. Chem. 41 (7): 883–888. Дои:10.1021 / ac60276a013.
  11. ^ Голубев, А. (2010). «Экспоненциально модифицированная гауссова (ЭМГ) актуальность для распределений, связанных с пролиферацией и дифференцировкой клеток». Журнал теоретической биологии. 262 (2): 257–266. Дои:10.1016 / j.jtbi.2009.10.005. PMID  19825376.
  12. ^ Тайсон, Д. Р .; Garbett, S.P .; Frick, P.L .; Каранта, В. (2012). «Фракционная пролиферация: метод деконволюции динамики популяции клеток из данных отдельных клеток». Природные методы. 9 (9): 923–928. Дои:10.1038 / nmeth.2138. ЧВК  3459330. PMID  22886092.
  13. ^ Nicolaescu, D .; Takaoka, G.H .; Исикава Дж. (2006). «Многопараметрическая характеристика пучков кластерных ионов». Журнал Vacuum Science & Technology B: Microelectronics and Nanometer Structures. 24 (5): 2236. Bibcode:2006JVSTB..24.2236N. Дои:10.1116/1.2335433.
  14. ^ Палмер, EM; Горовиц Тодд, S; Торральба, А; Вулф, JM (2011). «Каковы формы распределения времени отклика при визуальном поиске?». J Exp Psychol. 37 (1): 58–71. Дои:10.1037 / a0020747. ЧВК  3062635. PMID  21090905.
  15. ^ Рорер, D; Wixted, JT (1994). «Анализ задержки и времени между ответами при свободном отзыве». Память и познание. 22 (5): 511–524. Дои:10.3758 / BF03198390. PMID  7968547.
  16. ^ Ловелл, Нокс Калифорния; С.С. Кумбхакар (2000). Стохастический пограничный анализ. Издательство Кембриджского университета. С. 80–82.
  17. ^ Питер Карр и Дилип Б. Мадан, Методы перевала для ценообразования опционов, Журнал вычислительных финансов (49–61), том 13 / номер 1, осень 2009 г.