Экспоненциально модифицированное распределение Гаусса - Exponentially modified Gaussian distribution

ЭМГ
	Функция плотности вероятности
	Кумулятивная функция распределения
Параметры	μ ∈ р - среднее значение гауссовой составляющей; σ2 > 0 - дисперсия гауссовой составляющей; λ > 0 - коэффициент экспоненциальной составляющей
Поддерживать	Икс ∈ р
PDF
CDF	, куда; - CDF гауссова распределения,; ,;
Иметь в виду
Режим
Дисперсия
Асимметрия
Бывший. эксцесс
MGF
CF

В теория вероятности, экспоненциально модифицированное гауссово распределение (ЭМГ, также известный как exGaussian распределение) описывает сумму независимых нормальный и экспоненциальный случайные переменные. Бывшая гауссовская случайная величина Z может быть выражено как Z = Икс + Y, куда Икс и Y независимы, Икс гауссово со средним μ и дисперсия σ², и Y экспоненциально от скорости λ. Он имеет характерный положительный перекос от экспоненциальной составляющей.

Его также можно рассматривать как взвешенную функцию сдвинутой экспоненты, причем вес является функцией нормального распределения.

Определение

В функция плотности вероятности (pdf) экспоненциально измененного нормальное распределение является^[1]

{ displaystyle f (x; mu, sigma, lambda) = { frac { lambda} {2}} e ^ {{ frac { lambda} {2}} (2 mu + lambda sigma ^ {2} -2x)} operatorname {erfc} left ({ frac { mu + lambda sigma ^ {2} -x} {{ sqrt {2}} sigma}} right) ,}

где erfc - это дополнительная функция ошибок определяется как

{ displaystyle { begin {align} operatorname {erfc} (x) & = 1- operatorname {erf} (x) & = { frac {2} { sqrt { pi}}} int _ {x} ^ { infty} e ^ {- t ^ {2}} , dt. end {align}}}

Эта функция плотности выводится через свертка нормального и экспоненциальный функции плотности вероятности.

Альтернативные формы вычислений

Альтернативная, но эквивалентная форма распределения ЭМГ используется для описания формы пика в хроматография.^[2] Это выглядит следующим образом

{ displaystyle f (x; h, mu, sigma, tau) = { frac {h sigma} { tau}} { sqrt { frac { pi} {2}}} exp left ({ frac {1} {2}} left ({ frac { sigma} { tau}} right) ^ {2} - { frac {x- mu} { tau}} right) operatorname {erfc} left ({ frac {1} { sqrt {2}}} left ({ frac { sigma} { tau}} - { frac {x- mu}) { sigma}} right) right),}

(1)

куда

{ displaystyle h}

- амплитуда гауссиана,

{ displaystyle tau = { frac {1} { lambda}}}

- время релаксации экспоненты.

Эта функция не может быть вычислена для некоторых значений параметров (например, τ = 0) из-за арифметического переполнения. Альтернативная, но эквивалентная форма записи функции была предложена Делли:^[3]

{ displaystyle f (x; h, mu, sigma, tau) = h exp left (- { frac {1} {2}} left ({ frac {x- mu} { sigma}} right) ^ {2} right) { frac { sigma} { tau}} { sqrt { frac { pi} {2}}} operatorname {erfcx} left ({ frac {1} { sqrt {2}}} left ({ frac { sigma} { tau}} - { frac {x- mu} { sigma}} right) right), }

(2)

куда ${ displaystyle operatorname {erfcx} t = exp t ^ {2} cdot operatorname {erfc} t}$ это масштабированная дополнительная функция ошибок

В случае этой формулы также возможно арифметическое переполнение, область переполнения отличается от первой формулы, за исключением очень малого τ.

При малых τ целесообразно использовать асимптотику второй формулы:

{ displaystyle f (x; h, mu, sigma, tau) = { frac {h exp left (- { frac {1} {2}} left ({ frac {x- mu} { sigma}} right) ^ {2} right)} {1 + { frac { left (x- mu right) tau} { sigma ^ {2}}}}}, }

(3)

Решение об использовании формулы принимается на основании параметра ${ displaystyle z = { frac {1} { sqrt {2}}} left ({ frac { sigma} { tau}} - { frac {x- mu} { sigma}} верно)}$ :

за z <0 должно быть выполнено вычисление^[2] по первой формуле,

для 0 ≤ z ≤ 6.71·10⁷ (в случае формат с плавающей запятой двойной точности ) по второй формуле,

и для z > 6.71·10⁷ по третьей формуле.

Режим (положение вершины, наиболее вероятное значение) вычисляется^[2] с использованием производной формулы 2; противоположность масштабированная дополнительная функция ошибок erfcxinv () используется для расчета. Приблизительные значения также предлагает Калембет.^[2] Хотя значение моды выше, чем у исходного гауссиана, вершина всегда находится на исходном (неизмененном) гауссиане.

Оценка параметров

Есть три параметра: иметь в виду нормального распределения (μ), стандартное отклонение нормального распределения (σ) и экспоненциальный спад параметр (τ = 1 / λ). Форма K = τ / σ также иногда используется для характеристики распределения. В зависимости от значений параметров распределение может иметь форму от почти нормальной до почти экспоненциальной.

Параметры распределения можно оценить по выборочным данным с помощью метод моментов следующее:^[4]^[5]

{ Displaystyle м = му + тау,}

{ Displaystyle s ^ {2} = sigma ^ {2} + tau ^ {2},}

{ displaystyle gamma _ {1} = { frac {2 tau ^ {3}} {( sigma ^ {2} + tau ^ {2}) ^ {3/2}}},}

куда м выборочное среднее, s - стандартное отклонение выборки, а γ₁ это перекос.

Решение этих параметров дает:

{ displaystyle { hat { mu}} = m-s left ({ frac { gamma _ {1}} {2}} right) ^ {1/3},}

{ displaystyle { hat { sigma ^ {2}}} = s ^ {2} left [1- left ({ frac { gamma _ {1}} {2}} right) ^ {2 / 3} right],}

{ displaystyle { hat { tau}} = s left ({ frac { gamma _ {1}} {2}} right) ^ {1/3}.}

Доверительные интервалы

В настоящее время нет опубликованных таблиц, доступных для тестирования значимости с этим распределением. Распределение может быть смоделировано путем формирования суммы двух случайных величин, одна из которых получена из нормального распределения, а другая - из экспоненты.

Перекос

Ценность непараметрический перекос

{ displaystyle { frac {{ text {mean}} - { text {median}}} { text {стандартное отклонение}}}}

этого распределения лежит между 0 и 0,31.^[8]^[9] К нижнему пределу приближаются, когда преобладает нормальный компонент, и к верхнему, когда доминирует экспоненциальный компонент.

Вхождение

Распределение используется в качестве теоретической модели формы хроматографический пики.^[1]^[2]^[10] Это было предложено в качестве статистической модели перемежающееся время в делящихся клетках.^[11]^[12] Он также используется при моделировании кластерных ионных пучков.^[13] Он обычно используется в психологии и других науках о мозге для изучения времени реакции.^[14]^[15] В небольшом варианте, когда среднее значение Нормального компонента установлено на ноль, оно также используется в Стохастический пограничный анализ, как одна из спецификаций распределения для составного члена ошибки, моделирующего неэффективность. ^[16]

Связанные дистрибутивы

Это семейство дистрибутивов - частный или предельный случай нормально-экспоненциально-гамма-распределение. Это также можно рассматривать как трехпараметрическое обобщение нормального распределения для добавления перекоса; другой подобный дистрибутив - асимметричное нормальное распределение, у которого более тонкие хвосты. Распределение сложное распределение вероятностей в котором среднее значение нормальное распределение изменяется случайным образом как смещенный экспоненциальное распределение.

А Гауссов минус экспоненциальный распределение было предложено для моделирования цен опционов.^[17] Если такая случайная величина Y имеет параметры μ, σ, λ, то его отрицательный -Y имеет экспоненциально модифицированное гауссово распределение с параметрами -μ, σ, λ, и поэтому Y имеет в виду ${ displaystyle mu - { tfrac {1} { lambda}}}$ и дисперсия ${ Displaystyle sigma ^ {2} + { tfrac {1} { lambda ^ {2}}}}$ .

Рекомендации

^ ^а ^б Грушка, Эли (1972). «Характеристика экспоненциально модифицированных гауссовых пиков в хроматографии». Аналитическая химия. 44 (11): 1733–1738. Дои:10.1021 / ac60319a011. PMID 22324584.
^ ^а ^б ^c ^d ^е Kalambet, Y .; Козьмин, Ю .; Михайлова, К .; Нагаев, И .; Тихонов, П. (2011). «Реконструкция хроматографических пиков с использованием экспоненциально модифицированной функции Гаусса». Журнал хемометрики. 25 (7): 352. Дои:10.1002 / cem.1343. S2CID 121781856.
^ Делли, Р. (1985). «Ряды для экспоненциально модифицированной формы гауссова пика». Анальный. Chem. 57: 388. Дои:10.1021 / ac00279a094.
^ Дайсон, Н.А. (1998). Методы хроматографической интеграции. Королевское химическое общество, информационные службы. п. 27. ISBN 9780854045105. Получено 2015-05-15.
^ Оливье Дж. И Норберг М. М. (2010) Положительно искаженные данные: пересмотр степенного преобразования Бокса-Кокса. Int. J. Psych. Res. 3 (1) 68-75.
^ Ратклифф, Р. (1979). «Распределение времени реакции группы и анализ статистики распределения». Psychol. Бык. 86 (3): 446–461. CiteSeerX 10.1.1.409.9863. Дои:10.1037/0033-2909.86.3.446. PMID 451109.
^ Винсент, С. Б. (1912). «Функции вибрисс в поведении белой крысы». Монографии по поведению животных. 1 (5): 7–81.
^ Хиткот, А (1996). «RTSYS: DOS-приложение для анализа данных о времени реакции». Методы, инструменты и компьютеры исследования поведения. 28 (3): 427–445. Дои:10.3758 / bf03200523.
^ Ulrich, R .; Миллер, Дж. (1994). «Влияние исключения выбросов на анализ времени реакции». J. Exp. Психология: Общие. 123: 34–80. Дои:10.1037/0096-3445.123.1.34.
^ Глэдни, HM; Дауден, Б.Ф .; Свален, JD (1969). «Компьютерная газожидкостная хроматография». Анальный. Chem. 41 (7): 883–888. Дои:10.1021 / ac60276a013.
^ Голубев, А. (2010). «Экспоненциально модифицированная гауссова (ЭМГ) актуальность для распределений, связанных с пролиферацией и дифференцировкой клеток». Журнал теоретической биологии. 262 (2): 257–266. Дои:10.1016 / j.jtbi.2009.10.005. PMID 19825376.
^ Тайсон, Д. Р .; Garbett, S.P .; Frick, P.L .; Каранта, В. (2012). «Фракционная пролиферация: метод деконволюции динамики популяции клеток из данных отдельных клеток». Природные методы. 9 (9): 923–928. Дои:10.1038 / nmeth.2138. ЧВК 3459330. PMID 22886092.
^ Nicolaescu, D .; Takaoka, G.H .; Исикава Дж. (2006). «Многопараметрическая характеристика пучков кластерных ионов». Журнал Vacuum Science & Technology B: Microelectronics and Nanometer Structures. 24 (5): 2236. Bibcode:2006JVSTB..24.2236N. Дои:10.1116/1.2335433.
^ Палмер, EM; Горовиц Тодд, S; Торральба, А; Вулф, JM (2011). «Каковы формы распределения времени отклика при визуальном поиске?». J Exp Psychol. 37 (1): 58–71. Дои:10.1037 / a0020747. ЧВК 3062635. PMID 21090905.
^ Рорер, D; Wixted, JT (1994). «Анализ задержки и времени между ответами при свободном отзыве». Память и познание. 22 (5): 511–524. Дои:10.3758 / BF03198390. PMID 7968547.
^ Ловелл, Нокс Калифорния; С.С. Кумбхакар (2000). Стохастический пограничный анализ. Издательство Кембриджского университета. С. 80–82.
^ Питер Карр и Дилип Б. Мадан, Методы перевала для ценообразования опционов, Журнал вычислительных финансов (49–61), том 13 / номер 1, осень 2009 г.

[Grushka1972-1] а ^б Грушка, Эли (1972). «Характеристика экспоненциально модифицированных гауссовых пиков в хроматографии». Аналитическая химия. 44 (11): 1733–1738. Дои:10.1021 / ac60319a011. PMID 22324584.

[Kalambet2011-2] а ^б ^c ^d ^е Kalambet, Y .; Козьмин, Ю .; Михайлова, К .; Нагаев, И .; Тихонов, П. (2011). «Реконструкция хроматографических пиков с использованием экспоненциально модифицированной функции Гаусса». Журнал хемометрики. 25 (7): 352. Дои:10.1002 / cem.1343. S2CID 121781856.

[Delley1985-3] Делли, Р. (1985). «Ряды для экспоненциально модифицированной формы гауссова пика». Анальный. Chem. 57: 388. Дои:10.1021 / ac00279a094.

[google-4] Дайсон, Н.А. (1998). Методы хроматографической интеграции. Королевское химическое общество, информационные службы. п. 27. ISBN 9780854045105. Получено 2015-05-15.

[Olivier2010-5] Оливье Дж. И Норберг М. М. (2010) Положительно искаженные данные: пересмотр степенного преобразования Бокса-Кокса. Int. J. Psych. Res. 3 (1) 68-75.

[Ratcliff1979-6] Ратклифф, Р. (1979). «Распределение времени реакции группы и анализ статистики распределения». Psychol. Бык. 86 (3): 446–461. CiteSeerX 10.1.1.409.9863. Дои:10.1037/0033-2909.86.3.446. PMID 451109.

[Vincent1912-7] Винсент, С. Б. (1912). «Функции вибрисс в поведении белой крысы». Монографии по поведению животных. 1 (5): 7–81.

[Heathcote1996-8] Хиткот, А (1996). «RTSYS: DOS-приложение для анализа данных о времени реакции». Методы, инструменты и компьютеры исследования поведения. 28 (3): 427–445. Дои:10.3758 / bf03200523.

[Ulrich1994-9] Ulrich, R .; Миллер, Дж. (1994). «Влияние исключения выбросов на анализ времени реакции». J. Exp. Психология: Общие. 123: 34–80. Дои:10.1037/0096-3445.123.1.34.

[Gladney1969-10] Глэдни, HM; Дауден, Б.Ф .; Свален, JD (1969). «Компьютерная газожидкостная хроматография». Анальный. Chem. 41 (7): 883–888. Дои:10.1021 / ac60276a013.

[Golubev2010-11] Голубев, А. (2010). «Экспоненциально модифицированная гауссова (ЭМГ) актуальность для распределений, связанных с пролиферацией и дифференцировкой клеток». Журнал теоретической биологии. 262 (2): 257–266. Дои:10.1016 / j.jtbi.2009.10.005. PMID 19825376.

[Tyson2012-12] Тайсон, Д. Р .; Garbett, S.P .; Frick, P.L .; Каранта, В. (2012). «Фракционная пролиферация: метод деконволюции динамики популяции клеток из данных отдельных клеток». Природные методы. 9 (9): 923–928. Дои:10.1038 / nmeth.2138. ЧВК 3459330. PMID 22886092.

[13] Nicolaescu, D .; Takaoka, G.H .; Исикава Дж. (2006). «Многопараметрическая характеристика пучков кластерных ионов». Журнал Vacuum Science & Technology B: Microelectronics and Nanometer Structures. 24 (5): 2236. Bibcode:2006JVSTB..24.2236N. Дои:10.1116/1.2335433.

[Palmer2011-14] Палмер, EM; Горовиц Тодд, S; Торральба, А; Вулф, JM (2011). «Каковы формы распределения времени отклика при визуальном поиске?». J Exp Psychol. 37 (1): 58–71. Дои:10.1037 / a0020747. ЧВК 3062635. PMID 21090905.

[Rohrer1994-15] Рорер, D; Wixted, JT (1994). «Анализ задержки и времени между ответами при свободном отзыве». Память и познание. 22 (5): 511–524. Дои:10.3758 / BF03198390. PMID 7968547.

[16] Ловелл, Нокс Калифорния; С.С. Кумбхакар (2000). Стохастический пограничный анализ. Издательство Кембриджского университета. С. 80–82.

[17] Питер Карр и Дилип Б. Мадан, Методы перевала для ценообразования опционов, Журнал вычислительных финансов (49–61), том 13 / номер 1, осень 2009 г.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

Распределения вероятностей (Список )
Дискретный одномерный с конечной опорой	Бенфорд Бернулли бета-бином биномиальный категоричный гипергеометрический Бином Пуассона Радемахер солитон дискретная униформа Zipf Ципф – Мандельброт
Дискретный одномерный с бесконечной поддержкой	бета-отрицательный бином Борель Конвей – Максвелл – Пуассон дискретная фаза Delaporte расширенный отрицательный бином Флори-Шульц Гаусс – Кузьмин геометрический логарифмический отрицательный бином Panjer параболический фрактал Пуассон Скеллам Юл – Саймон Зета
Непрерывный одномерный поддерживается на ограниченном интервале	арксинус АРГУС Лысый – Николс Бейтс бета бета прямоугольный непрерывный Бернулли Ирвин – Холл Кумарасвами логит-нормальный нецентральная бета приподнятый косинус взаимный треугольный U-квадратичный униформа Полукруг Вигнера
Непрерывный одномерный поддерживается на полубесконечном интервале	Бенини Benktander 1-го рода Benktander 2-го рода бета прайм Заусенец хи-квадрат чи Дагум Дэвис экспоненциально-логарифмический Erlang экспоненциальный F сложенный нормальный Фреше гамма гамма / Gompertz обобщенная гамма обобщенный обратный гауссовский Гомпертц наполовину логистический наполовину нормальный Хотеллинга Т-квадрат гипер-Эрланг гиперэкспоненциальный гипоэкспоненциальный обратный хи-квадрат масштабированный обратный хи-квадрат обратный гауссовский обратная гамма Колмогоров Леви журнал-Коши лог-Лаплас логистика лог-нормальный Lomax матрично-экспоненциальный Максвелл – Больцманн Максвелл – Юттнер Mittag-Leffler Накагами нецентральный хи-квадрат нецентральный F Парето фазовый поли-Вейбулл Рэлей релятивистский Брейт – Вигнер Рис сдвинутый Гомпертц усеченный нормальный Тип-2 Гамбель Weibull дискретный Weibull Лямбда Уилкса
Непрерывный одномерный поддерживается на всей реальной линии	Коши экспоненциальная степень Фишера z Гауссовский q обобщенный нормальный обобщенный гиперболический геометрическая конюшня Гамбель Holtsmark гиперболический секанс Джонсона S_U Ландо Лаплас асимметричный лаплас логистика нецентральный т нормальный (гауссовский) нормально-обратный гауссовский перекос нормально слэш стабильный Студенты т Гамбель типа 1 Трейси – Уидом дисперсия-гамма Voigt
Непрерывный одномерный с поддержкой, тип которой варьируется	обобщенный хи-квадрат обобщенное экстремальное значение обобщенный Парето Марченко – Пастур q-экспоненциальный q-Гауссовский q-Вейбулл смещенная логистика Лямбда Тьюки
Смешанная непрерывно-дискретная одномерная	выпрямленный гауссовский
Многовариантный (совместный)	Дискретный Ewens полиномиальный Дирихле-полиномиальный отрицательный полиномиальный Непрерывный Дирихле обобщенный Дирихле многомерный Лаплас многомерный нормальный многомерный стабильный многомерный т нормальная обратная гамма нормальная гамма Матричнозначный обратная матрица гамма обратный-Wishart матрица нормальная матрица т матрица гамма нормальный-обратный-Уишарт нормальный-Wishart Wishart
Направленный	Одномерный (круговой) направленный Круглая форма одномерный фон Мизеса завернутый нормально завернутый Коши завернутый экспоненциальный обернутый асимметричный лаплас завернутый Леви Двумерный (сферический) Кент Двумерный (тороидальный) двумерный фон Мизеса Многомерный фон Мизес-Фишер Bingham
Вырожденный и единственное число	Вырожденный Дельта-функция Дирака Единственное число Кантор
Семьи	Круговой соединение Пуассона эллиптический экспоненциальный естественная экспонента расположение – масштаб максимальная энтропия смесь Пирсон Твиди завернутый