Сгруппированное распределение Дирихле - Grouped Dirichlet distribution

В статистика, то сгруппированное распределение Дирихле (GDD) является многомерным обобщением Распределение Дирихле Впервые он был описан Ng et al 2008.^[1] Сгруппированное распределение Дирихле возникает при анализе категориальных данных, когда некоторые наблюдения могут попасть в любую из набора других «четких» категорий. Например, у одного может быть набор данных, состоящий из наблюдений и контроля при двух разных условиях. С полными данными перекрестная классификация статуса заболевания формирует таблицу 2 (случай / контроль) -x- (состояние / отсутствие состояния) с вероятностями ячеек.

	Уход	Без лечения
Управление	θ₁	θ₂
Случаи	θ₃	θ₄

Если, однако, данные включают, скажем, не респондентов, которые, как известно, относятся к контрольной группе или случаям, тогда перекрестная классификация статуса болезни формирует таблицу 2-x-3. Вероятность последнего столбца - это сумма вероятностей первых двух столбцов в каждой строке, например

	Уход	Без лечения	Отсутствует
Управление	θ₁	θ₂	θ₁+ θ₂
Случаи	θ₃	θ₄	θ₃+ θ₄

GDD позволяет полностью оценить вероятности сот при таких условиях агрегирования.^[1]

Распределение вероятностей

Рассмотрим замкнутое симплексное множество ${ displaystyle { mathcal {T}} _ {n} = left { left (x_ {1}, ldots x_ {n} right) left | x_ {i} geq 0, i = 1 , cdots, n, sum _ {i = 1} ^ {n} x_ {n} = 1 right. right }}$ и ${ displaystyle mathbf {x} in { mathcal {T}} _ {n}}$ . Письмо ${ displaystyle mathbf {x} _ {- n} = left (x_ {1}, ldots, x_ {n-1} right)}$ во-первых ${ displaystyle n-1}$ элементы члена ${ displaystyle { mathcal {T}} _ {n}}$ , распределение ${ displaystyle mathbf {x}}$ для двух разделов имеет функцию плотности, заданную как

{ displaystyle operatorname {GD} _ {n, 2, s} left ( left. mathbf {x} _ {- n} right | mathbf {a}, mathbf {b} right) = { frac { left ( prod _ {i = 1} ^ {n} x_ {i} ^ {a_ {i} -1} right) cdot left ( sum _ {i = 1} ^ { s} x_ {i} right) ^ {b_ {1}} cdot left ( sum _ {i = s + 1} ^ {n} x_ {i} right) ^ {b_ {2}}} { operatorname { mathrm {B}} left (a_ {1}, ldots, a_ {s} right) cdot operatorname { mathrm {B}} left (a_ {s + 1}, ldots, a_ {n} right) cdot operatorname { mathrm {B}} left (b_ {1} + sum _ {i = 1} ^ {s} a_ {i}, b_ {2} + sum _ {i = s + 1} ^ {n} a_ {i} right)}}}

куда ${ Displaystyle OperatorName { mathrm {B}} left ( mathbf {a} right)}$ это многомерная бета-функция.

Нг и др.^[1] продолжил определение м сгруппированное распределение Дирихле с плотностью ${ displaystyle mathbf {x} _ {- n}}$ данный

{ displaystyle operatorname {GD} _ {n, m, mathbf {s}} left ( left. mathbf {x} _ {- n} right | mathbf {a}, mathbf {b} right) = c_ {m} ^ {- 1} cdot left ( prod _ {i = 1} ^ {n} x_ {i} ^ {a_ {i} -1} right) cdot prod _ {j = 1} ^ {m} left ( sum _ {k = s_ {j-1} +1} ^ {s_ {j}} x_ {k} right) ^ {b_ {j}}}

куда ${ Displaystyle mathbf {s} = left (s_ {1}, ldots, s_ {m} right)}$ вектор целых чисел с ${ displaystyle 0 = s_ {0}$ . Нормирующая константа, задаваемая

{ displaystyle c_ {m} = left { prod _ {j = 1} ^ {m} operatorname { mathrm {B}} left (a_ {s_ {j-1} +1}, ldots , a_ {s_ {j}} right) right } cdot operatorname { mathrm {B}} left (b_ {1} + sum _ {k = 1} ^ {s_ {1}} a_ {k}, ldots, b_ {m} + sum _ {k = s_ {m-1} +1} ^ {s_ {m}} a_ {k} right)}

Далее авторы использовали эти распределения в контексте трех различных приложений в медицине.

Сгруппированное распределение Дирихле - Grouped Dirichlet distribution

Распределение вероятностей

Рекомендации