Гамма-распределение - Gamma distribution
Функция плотности вероятности | |||
Кумулятивная функция распределения | |||
Параметры | |||
---|---|---|---|
Поддерживать | |||
CDF | |||
Иметь в виду | |||
Медиана | Нет простой закрытой формы | Нет простой закрытой формы | |
Режим | |||
Дисперсия | |||
Асимметрия | |||
Бывший. эксцесс | |||
Энтропия | |||
MGF | |||
CF | |||
Метод моментов |
В теория вероятности и статистика, то гамма-распределение это двух-параметр семья непрерывных распределения вероятностей. В экспоненциальное распределение, Распределение Erlang, и распределение хи-квадрат являются частными случаями гамма-распределения. Есть три разных параметризации в общем использовании:
- С параметр формы k и параметр масштаба θ.
- С параметром формы α = k и параметр обратного масштаба β = 1/θ, называется параметр скорости.
- С параметром формы k и средний параметр μ = kθ = α/β.
В каждой из этих трех форм оба параметра являются положительными действительными числами.
Гамма-распределение - это распределение вероятностей максимальной энтропии (как относительно единой базовой меры, так и относительно 1 /Икс базовая мера) для случайной величины Икс для которого E[Икс] = kθ = α/β фиксировано и больше нуля, и E[ln (Икс)] = ψ(k) + ln (θ) = ψ(α) - ln (β) фиксированный (ψ это функция дигаммы ).[1]
Определения
Параметризация с k и θ кажется более распространенным в эконометрика и некоторых других прикладных областях, где, например, гамма-распределение часто используется для моделирования времени ожидания. Например, в жизненное испытание, время ожидания смерти - это случайная переменная который часто моделируется с помощью гамма-распределения. Увидеть Хогга и Крейга[2] для явной мотивации.
Параметризация с α и β чаще встречается в Байесовская статистика, где гамма-распределение используется как сопряженный предшествующий распределения для различных типов параметров обратной шкалы (ставки), таких как λ из экспоненциальное распределение или распределение Пуассона[3] - или, если на то пошло, β самого гамма-распределения. Тесно связанные обратное гамма-распределение используется в качестве сопряженного априорного значения для параметров масштаба, таких как отклонение из нормальное распределение.
Если k положительный целое число, то распределение представляет собой Распределение Erlang; т.е. сумма k независимый экспоненциально распределенный случайные переменные, каждый из которых имеет среднее значение θ.
Характеристика с помощью формы α и оценить β
Гамма-распределение может быть параметризовано с помощью параметр формы α = k и параметр обратного масштаба β = 1/θ, называется параметр скорости. Случайная величина Икс гамма-распределение с формой α и оценить β обозначается
Соответствующая функция плотности вероятности в параметризации скорости формы равна
куда это гамма-функция. Для всех положительных целых чисел .
В кумулятивная функция распределения - регуляризованная гамма-функция:
куда это нижний неполная гамма-функция.
Если α положительный целое число (т.е. распределение является Распределение Erlang ) кумулятивная функция распределения имеет следующее разложение в ряд:[4]
Характеристика с помощью формы k и масштабировать θ
Случайная величина Икс гамма-распределение с формой k и масштабировать θ обозначается
В функция плотности вероятности с использованием параметризации в масштабе формы
Здесь Γ (k) это гамма-функция оценивается в k.
В кумулятивная функция распределения - регуляризованная гамма-функция:
куда это нижний неполная гамма-функция.
Также это можно выразить следующим образом, если k положительный целое число (т.е. распределение является Распределение Erlang ):[4]
Обе параметризации являются общими, поскольку любая из них может быть более удобной в зависимости от ситуации.
Характеристики
Асимметрия
Асимметрия гамма-распределения зависит только от его параметра формы, k, и он равен
Расчет медианы
В отличие от режима и среднего, которые имеют легко вычисляемые формулы на основе параметров, медиана не имеет уравнения в замкнутой форме. Медиана этого распределения определяется как значение такой, что
Строгий подход к проблеме определения асимптотического разложения и оценок медианы гамма-распределения был впервые проведен Ченом и Рубином, которые доказали, что (для )
куда это среднее и это медиана распространение.[5]
К. П. Чой нашел первые пять членов в асимптотическом разложении медианы, сравнив медиану с оценкой Рамануджана. функция.[6] Берг и Педерсен нашли больше терминов:[7]
Они также доказали многие свойства медианы, показали, что является выпуклой функцией от ,[8] и показал, что асимптотика вблизи является .[7]
Суммирование
Если Икся имеет гамму (kя, θ) раздача для я = 1, 2, ..., N (т.е. все распределения имеют одинаковый масштабный параметр θ), тогда
при условии, что все Икся находятся независимый.
Для случаев, когда Икся находятся независимый но имеют разные параметры масштаба см. Матхай [9] или Moschopoulos.[10]
Гамма-распределение показывает бесконечная делимость.
Масштабирование
Если
тогда для любого c > 0,
- по моментным производящим функциям,
или эквивалентно
Действительно, мы знаем, что если Икс является экспоненциальная с.в. со скоростью λ тогда cX - экспоненциальная с.в. со скоростью λ/c; то же самое верно и с вариациями гаммы (и это можно проверить с помощью момент-производящая функция см., например,эти заметки, 10.4- (ii)): умножение на положительную константу c делит ставку (или, что то же самое, умножает шкалу).
Экспоненциальная семья
Гамма-распределение - двухпараметрическое экспоненциальная семья с естественные параметры k - 1 и −1 /θ (эквивалентно, α - 1 и -β), и естественная статистика Икс и ln (Икс).
Если параметр формы k фиксируется, результирующее однопараметрическое семейство распределений представляет собой естественная экспоненциальная семья.
Логарифмическое ожидание и дисперсия
Можно показать, что
или эквивалентно,
куда ψ это функция дигаммы. Точно так же
куда это функция тригаммы.
Это можно вывести с помощью экспоненциальная семья формула для моментная производящая функция достаточной статистики, поскольку одной из достаточных статистик гамма-распределения является ln (Икс).
Информационная энтропия
В информационная энтропия является
в k, θ параметризация, информационная энтропия дан кем-то
Дивергенция Кульбака – Лейблера
В Дивергенция Кульбака – Лейблера (KL-дивергенция), гамма (αп, βп) ("истинное" распределение) от Gamma (αq, βq) ("аппроксимирующее" распределение) определяется выражением[11]
Написано с использованием k, θ параметризация, KL-дивергенция гамма (kп, θп) из гаммы (kq, θq) дан кем-то
Преобразование Лапласа
В Преобразование Лапласа гамма PDF
Связанные дистрибутивы
Общее
- Позволять быть независимых и одинаково распределенных случайных величин, следующих за экспоненциальное распределение с параметром скорости λ, то ~ Gamma (n, 1 / λ), где n - параметр формы, а 1 / λ - масштаб.
- Если Икс ~ Gamma (1, 1 / λ) (параметризация формы и масштаба), тогда Икс имеет экспоненциальное распределение с параметром скорости λ.
- Если Икс ~ Gamma (ν / 2, 2) (параметризация формы и масштаба), тогда Икс идентичен χ2(ν), распределение хи-квадрат с ν степени свободы. Наоборот, если Q ~ χ2(ν) и c положительная константа, то cQ ~ Гамма (ν/2, 2c).
- Если k является целое число, гамма-распределение представляет собой Распределение Erlang и - распределение вероятностей времени ожидания до kй "приход" в одномерном Пуассоновский процесс с интенсивностью 1 /θ. Если
- тогда
- Если Икс имеет Распределение Максвелла – Больцмана с параметром а, тогда
- .
- Если Икс ~ Гамма (k, θ), тогда следует экспоненциально-гамма-распределению (сокращенно exp-gammma).[12] Иногда его называют логарифмически-гамма-распределением.[13] Формулы для его среднего и дисперсии находятся в разделе # Логарифмическое ожидание и дисперсия.
- Если Икс ~ Гамма (k, θ), тогда следует за обобщенное гамма-распределение с параметрами п = 2, d = 2k, и [нужна цитата ].
- В более общем смысле, если Икс ~ Гамма (k,θ), тогда за следует за обобщенное гамма-распределение с параметрами п = 1/q, d = k/q, и .
- Если Икс ~ Гамма (k, θ), то 1 /Икс ~ Инв-Гамма (k, θ−1) (увидеть Обратное гамма-распределение для вывода).
- Параметризация 1: Если независимы, то , или эквивалентно,
- Параметризация 2: Если независимы, то , или эквивалентно,
- Если Икс ~ Гамма (α, θ) и Y ~ Гамма (β, θ) распределены независимо, то Икс/(Икс + Y) имеет бета-распространение с параметрами α и β, и Икс/(Икс + Y) не зависит от Икс + Y, то есть Гамма (α + β, θ) -распределены.
- Если Икся ~ Гамма (αя, 1) распределены независимо, то вектор (Икс1/S, ..., Иксп/S), куда S = Икс1 + ... + Иксп, следует за Распределение Дирихле с параметрами α1, ..., αп.
- Для больших k гамма-распределение сходится к нормальное распределение со средним μ = kθ и дисперсия σ2 = kθ2.
- Гамма-распределение - это сопряженный предшествующий для точности нормальное распределение с известными иметь в виду.
- В Распределение Уишарта является многомерным обобщением гамма-распределения (выборки представляют собой положительно определенные матрицы, а не положительные действительные числа).
- Гамма-распределение - это частный случай обобщенное гамма-распределение, то обобщенное целочисленное гамма-распределение, а обобщенное обратное гауссово распределение.
- Среди дискретных распределений отрицательное биномиальное распределение иногда рассматривается как дискретный аналог гамма-распределения.
- Распределения твиди - гамма-распределение принадлежит к семейству Tweedie модели экспоненциальной дисперсии.
Составная гамма
Если параметр формы гамма-распределения известен, но параметр обратного масштаба неизвестен, то гамма-распределение для обратного масштаба образует сопряженный априор. В составное распределение, который является результатом интегрирования обратной шкалы, имеет решение в замкнутой форме, известное как составное гамма-распределение.[14]
Если вместо этого параметр формы известен, но среднее значение неизвестно, а априор среднего значения задается другим гамма-распределением, то это приводит к K-распределение.
Статистические выводы
Оценка параметров
Оценка максимального правдоподобия
Функция правдоподобия для N iid наблюдения (Икс1, ..., ИксN) является
из которого мы вычисляем функцию логарифма правдоподобия
Нахождение максимума по θ взяв производную и установив ее равной нулю, получаем максимальная вероятность оценщик θ параметр:
Подставляя это в функцию логарифма правдоподобия, получаем
Нахождение максимума по k взяв производную и установив ее равной нулю, получаем
куда ψ это функция дигаммы. Нет закрытого решения для k. Функция имеет очень хорошее числовое поведение, поэтому, если требуется численное решение, его можно найти, например, с помощью Метод Ньютона. Начальное значение k можно найти либо с помощью метод моментов, или используя приближение
Если мы позволим
тогда k примерно
что находится в пределах 1,5% от правильного значения.[15] Явная форма обновления этого начального предположения по Ньютону – Рафсону:[16]
Оценщики в закрытой форме
Последовательные оценки в закрытой форме k и θ существуют, которые получены из вероятности обобщенное гамма-распределение.[17]
Оценка формы k является
и оценка масштаба θ является
Если используется параметризация скорости, оценка .
Эти оценщики не являются строго оценщиками максимального правдоподобия, а вместо этого называются оценщиками логарифмического момента смешанного типа. Однако они имеют такую же эффективность, что и оценки максимального правдоподобия.
Хотя эти оценки согласованы, они имеют небольшую погрешность. Вариант оценки для шкалы с поправкой на смещение θ является
Корректировка смещения для параметра формы k дается как[18]
Минимальная байесовская среднеквадратическая ошибка
С известными k и неизвестно θ, апостериорная функция плотности для тета (с использованием стандартного масштабно-инвариантного прежний за θ) является
Обозначение
Интеграция в отношении θ можно провести заменой переменных, обнаружив, что 1 /θ гамма-распределение с параметрами α = Nk, β = у.
Моменты можно вычислить, взяв отношение (м к м = 0)
который показывает, что оценка среднего ± стандартное отклонение апостериорного распределения для θ является
Байесовский вывод
Конъюгировать приор
В Байесовский вывод, то гамма-распределение это сопряженный предшествующий ко многим вероятностным распределениям: Пуассон, экспоненциальный, нормальный (с известным средним), Парето, гамма известной формы σ, обратная гамма с известным параметром формы, и Гомпертц с известным масштабным параметром.
Гамма-распределение сопряженный предшествующий является:[19]
куда Z - нормализующая константа, не имеющая решения в замкнутой форме. Апостериорное распределение можно найти, обновив параметры следующим образом:
куда п - количество наблюдений, а Икся это я-е наблюдение.
Возникновение и приложения
Гамма-распределение использовалось для моделирования размера страховые выплаты[20] и осадки.[21] Это означает, что совокупные страховые выплаты и количество осадков, накопленных в водохранилище, моделируются с помощью гамма-процесс - очень похоже на экспоненциальное распределение генерирует Пуассоновский процесс.
Гамма-распределение также используется для моделирования ошибок в многоуровневых Регрессия Пуассона модели, потому что смесь из Распределения Пуассона с гамма-распределением ставок имеет известное распределение в закрытой форме, называемое отрицательный бином.
В беспроводной связи гамма-распределение используется для моделирования многолучевое замирание мощности сигнала;[нужна цитата ] смотрите также Распределение Рэлея и Райское распределение.
В онкология, возрастное распределение рак заболеваемость часто следует за гамма-распределением, тогда как параметры формы и масштаба предсказывают, соответственно, количество события водителя и временной интервал между ними.[22]
В нейробиология, гамма-распределение часто используется для описания распределения межспайковые интервалы.[23][24]
В бактериальный экспрессия гена, то номер копии из конститутивно выраженный белок часто следует гамма-распределению, где масштаб и параметр формы представляют собой, соответственно, среднее количество всплесков на клеточный цикл и среднее количество белковые молекулы продуцируется одной мРНК в течение своей жизни.[25]
В геномика, гамма-распределение применялось в пик вызова шаг (т.е. распознавание сигнала) в ЧИП-чип[26] и ChIP-seq[27] анализ данных.
Гамма-распределение широко используется как сопряженный предшествующий в байесовской статистике. Это сопряженная априорная величина для точности (то есть обратная дисперсии) нормальное распределение. Это также сопряженный априор для экспоненциальное распределение.
Генерация случайных величин с гамма-распределением
Учитывая указанное выше свойство масштабирования, достаточно сгенерировать гамма-переменные с θ = 1, так как позже мы можем преобразовать в любое значение β с простым делением.
Предположим, мы хотим сгенерировать случайные величины из Gamma (п + δ, 1), где n - целое неотрицательное число и 0 < δ <1. Используя тот факт, что распределение Gamma (1, 1) совпадает с распределением Exp (1), и отмечая метод генерация экспоненциальных переменных, заключаем, что если U является равномерно распределены на (0, 1], то −ln (U) распределен Gamma (1, 1) (т.е. выборка с обратным преобразованием ). Теперь, используя "α-добавление свойства гамма-распределения, расширяем этот результат:
куда Uk все равномерно распределены на (0, 1] и независимый. Теперь осталось только сгенерировать переменную, распределенную как Gamma (δ, 1) для 0 < δ <1 и примените "α-добавление еще раз. Это самая сложная часть.
Случайная генерация гамма-переменных подробно обсуждается Devroye,[28]:401–428 отмечая, что ни один из них не является равномерно быстрым для всех параметров формы. При малых значениях параметра формы алгоритмы часто не работают.[28]:406 Для произвольных значений параметра формы можно применить метод Аренса и Дитера.[29] модифицированный метод приемки-брака Алгоритм GD (форма k ≥ 1) или метод преобразования[30] когда 0 < k <1. См. Также Cheng and Feast Algorithm GKM 3.[31] или метод сжатия Марсальи.[32]
Ниже приводится версия Аренса-Дитера. метод приема – отказа:[29]
- Генерировать U, V и W так как iid uniform (0, 1] изменяется.
- Если тогда и . Иначе, и .
- Если затем переходите к шагу 1.
- ξ распределяется как Γ (δ, 1).
Краткое изложение этого
куда это целая часть k, ξ генерируется с помощью алгоритма выше с δ = {k} (дробная часть k) и Uk все независимы.
Хотя описанный выше подход технически верен, Деврой отмечает, что он линейен в отношении значения k да и вообще не удачный выбор. Вместо этого он рекомендует использовать методы на основе отклонения или таблицы, в зависимости от контекста.[28]:401–428
Например, простой метод отклонения преобразования Марсальи, основанный на одной нормальной переменной Икс и один вариант униформы U:[33]
- Набор и .
- Набор .
- Если и возвращаться , иначе вернитесь к шагу 2.
С участием генерирует случайное число с гамма-распределением во времени, которое приблизительно постоянно с k. Скорость приема зависит от k, со степенью приемки 0,95, 0,98 и 0,99 для k = 1, 2 и 4. Для k <1, можно использовать поднять k для использования с этим методом.
Примечания
- ^ Park, Sung Y .; Бера, Анил К. (2009). «Модель условной гетероскедастичности авторегрессии с максимальной энтропией» (PDF). Журнал эконометрики. 150 (2): 219–230. CiteSeerX 10.1.1.511.9750. Дои:10.1016 / j.jeconom.2008.12.014. Архивировано из оригинал (PDF) на 2016-03-07. Получено 2011-06-02.
- ^ Хогг, Р.В.; Крейг, А. Т. (1978). Введение в математическую статистику (4-е изд.). Нью-Йорк: Макмиллан. С. Замечание 3.3.1. ISBN 0023557109.
- ^ Масштабируемая рекомендация с факторизацией Пуассона, Прем Гопалан, Джейк М. Хофман, Дэвид Блей, arXiv.org 2014
- ^ а б Папулис, Пиллаи, Вероятность, случайные величины и случайные процессы, Четвертый выпуск
- ^ Джисен Чен, Герман Рубин, Границы разницы между медианным и средним гамма- и пуассоновым распределениями, Statistics & Probability Letters, том 4, выпуск 6, октябрь 1986 г., страницы 281–283, ISSN 0167-7152, [1].
- ^ Цой, К. П. «О медианах гамма-распределений и уравнении Рамануджана», Труды Американского математического общества, Vol. 121, № 1 (май 1994 г.), стр. 245–251.
- ^ а б Берг, Кристиан и Педерсен, Хенрик Л. (март 2006 г.). «Гипотеза Чена – Рубина в непрерывной ситуации» (PDF). Методы и приложения анализа. 13 (1): 63–88. Дои:10.4310 / MAA.2006.v13.n1.a4. S2CID 6704865. Получено 1 апреля 2020.
- ^ Берг, Кристиан и Педерсен, Хенрик Л. «Выпуклость медианы в гамма-распределении».
- ^ Матхай, А. М. (1982). «Вместимость плотины с вводами гамма-типа». Летопись Института статистической математики. 34 (3): 591–597. Дои:10.1007 / BF02481056. ISSN 0020-3157. S2CID 122537756.
- ^ Moschopoulos, П. Г. (1985). «Распределение суммы независимых гамма-случайных величин». Летопись Института статистической математики. 37 (3): 541–544. Дои:10.1007 / BF02481123. S2CID 120066454.
- ^ У. Д. Пенни, [www.fil.ion.ucl.ac.uk/~wpenny/publications/densities.ps KL-расхождения плотностей нормальной, гамма-плотности, плотности Дирихле и Вишарта][требуется полная цитата ]
- ^ https://reference.wolfram.com/language/ref/ExpGammaDistribution.html
- ^ https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.loggamma.html#scipy.stats.loggamma
- ^ Дубей, Сатья Д. (декабрь 1970 г.). «Составное гамма-, бета- и F-распределения». Метрика. 16: 27–31. Дои:10.1007 / BF02613934. S2CID 123366328.
- ^ Минка, Томас П. (2002). «Оценка гамма-распределения» (PDF). Цитировать журнал требует
| журнал =
(помощь) - ^ Choi, S.C .; Wette, R. (1969). «Максимально правдоподобная оценка параметров гамма-распределения и их смещения». Технометрика. 11 (4): 683–690. Дои:10.1080/00401706.1969.10490731.
- ^ Чжи-Шэн Е и Нань Чен (2017) Оценки в закрытой форме для гамма-распределения, полученные из уравнений правдоподобия Американский статистик, 71: 2, 177-181
- ^ Франсиско Лузада, Педро Л. Рамос, Эдуардо Рамос. (2019) Примечание о смещении оценок в закрытой форме для гамма-распределения, полученных из уравнений правдоподобия. Американский статистик 73: 2, страницы 195–199.
- ^ Финк, Д. 1995 Сборник сопряженных приоров. Отчет о выполнении: Расширение и совершенствование методов для постановки целей по качеству данных. (Контракт Министерства энергетики США 95‑831).
- ^ п. 43, Филип Дж. Боланд, Статистические и вероятностные методы в актуарной науке, Chapman & Hall CRC 2007
- ^ Аксой, Х. (2000) «Использование гамма-распределения в гидрологическом анализе», Терк Дж. Энгин Энвайрон Сайнс, 24, 419 – 428.
- ^ Беликов, Алексей В. (22 сентября 2017 г.). «Количество ключевых канцерогенных событий можно предсказать по заболеваемости раком». Научные отчеты. 7 (1): 12170. Дои:10.1038 / s41598-017-12448-7. ЧВК 5610194. PMID 28939880.
- ^ Дж. Г. Робсон и Дж. Б. Трой, «Природа поддерживаемого разряда Q, X и Y ганглиозных клеток сетчатки кошки», J. Opt. Soc. Являюсь. А 4, 2301–2307 (1987)
- ^ M.C.M. Райт, И.М. Винтер, Дж. Дж. Форстер, С. Блик «Реакция на тоновые импульсы с наилучшей частотой в вентральном ядре улитки определяется упорядоченной статистикой межспайковых интервалов», Hearing Research 317 (2014)
- ^ Н. Фридман, Л. Цай и X. С. Се (2006) "Связь стохастической динамики с распределением населения: аналитическая основа экспрессии генов", Phys. Rev. Lett. 97, 168302.
- ^ DJ Reiss, MT Facciotti и NS Baliga (2008) «Модельная деконволюция связывания ДНК в масштабе всего генома», Биоинформатика, 24, 396–403
- ^ М.А. Мендоза-Парра, М. Новицка, В. Ван Гул, Г. Гронемейер (2013) «Характеристика паттернов связывания ChIP-seq с помощью деконволюции формы пика на основе модели», BMC Genomics, 14:834
- ^ а б c Деврой, Люк (1986). Генерация неоднородной случайной величины. Нью-Йорк: Springer-Verlag. ISBN 978-0-387-96305-1.CS1 maint: ref = harv (ссылка на сайт) См. Главу 9, раздел 3.
- ^ а б Ahrens, J. H .; Дитер, У (январь 1982 г.). «Генерирование гаммы изменяется с помощью модифицированной техники отклонения». Коммуникации ACM. 25 (1): 47–54. Дои:10.1145/358315.358390. S2CID 15128188.. См. Алгоритм GD, стр. 53.
- ^ Ahrens, J. H .; Дитер, У. (1974). «Компьютерные методы выборки из гамма-, бета-, пуассоновского и биномиального распределений». Вычисление. 12 (3): 223–246. CiteSeerX 10.1.1.93.3828. Дои:10.1007 / BF02293108. S2CID 37484126.
- ^ Cheng, R.C.H., и Feast, G.M. Некоторые простые генераторы гамма-изменения. Appl. Стат. 28 (1979), 290–295.
- ^ Марсалья, Г. Метод сжатия для генерации гамма-вариаций. Comput, Math. Appl. 3 (1977), 321–325.
- ^ Marsaglia, G .; Цанг, В. В. (2000). «Простой метод генерации гамма-переменных». Транзакции ACM на математическом ПО. 26 (3): 363–372. Дои:10.1145/358407.358414. S2CID 2634158.