Многомерная пробит-модель - Multivariate probit model

В статистика и эконометрика, то многомерная пробит модель является обобщением пробит модель используется для совместной оценки нескольких коррелированных бинарных результатов. Например, если считается, что решения об отправке хотя бы одного ребенка в государственную школу и решение о голосовании в пользу школьного бюджета коррелированы (оба решения бинарны), то многомерная пробит-модель будет подходящей для совместного прогнозирования этих два варианта на индивидуальной основе. Этот подход изначально был разработан Сиддхартха Чиб и Эдвард Гринберг.[1]

Пример: двумерный пробит

В обычной пробит-модели есть только одна двоичная зависимая переменная и так только один скрытая переменная используется. Напротив, в двумерной пробит-модели есть две двоичные зависимые переменные. и , так что есть две скрытые переменные: и Предполагается, что каждая наблюдаемая переменная принимает значение 1 тогда и только тогда, когда лежащая в основе непрерывная скрытая переменная принимает положительное значение:

с

и

Подбор двумерной пробит-модели включает оценку значений и . Для этого вероятность модели должна быть максимальной. Эта вероятность

Подстановка скрытых переменных и в функциях вероятности и ведении журналов дает

После некоторой переписывания функция логарифмического правдоподобия становится:

Обратите внимание, что это кумулятивная функция распределения из двумерное нормальное распределение. и в функции логарифмического правдоподобия наблюдаемые переменные равны единице или нулю.

Многовариантный пробит

В общем случае где мы можем взять как выбор и как отдельные лица или наблюдения, вероятность наблюдения за выбором является

Где и,

Функция логарифма правдоподобия в этом случае будет

Кроме обычно не существует решения в замкнутой форме для интегралов в уравнении логарифмического правдоподобия. Вместо этого для моделирования вероятностей выбора могут использоваться методы моделирования. Методы, использующие выборку по важности, включают Алгоритм GHK (Гевеке, Хадживассилу, Макфадден и Кин),[2] AR (accept-reject), метод Стерна. Существуют также подходы MCMC к этой проблеме, включая CRB (метод Чиба с Рао-Блэквеллизацией), CRT (Чиб, Риттер, Таннер), ARK (ядро принятия-отклонения) и ASK (ядро с адаптивной выборкой).[3]. В Probit-LMM (Mandt, Wenzel, Nakajima et al.) Предлагается вариационный подход к масштабированию до больших наборов данных.[4]

Рекомендации

  1. ^ Чиб, Сиддхартха; Гринберг, Эдвард (июнь 1998 г.). «Анализ многомерных пробит-моделей». Биометрика. 85 (2): 347–361. CiteSeerX  10.1.1.198.8541. Дои:10.1093 / biomet / 85.2.347 - через Oxford Academic.
  2. ^ Гадживассилиу, Василис (1994). «Глава 40 Классические методы оценки для моделей LDV с помощью моделирования». Справочник по эконометрике. 4: 2383–2441. Дои:10.1016 / S1573-4412 (05) 80009-1. ISBN  9780444887665.
  3. ^ Елязков, Иван (2010). «Перспективы MCMC по моделированию оценки правдоподобия». Достижения в эконометрике. 26: 3–39. Дои:10.1108 / S0731-9053 (2010) 0000026005. ISBN  978-0-85724-149-8.
  4. ^ Мандт, Стефан; Венцель, Флориан; Накадзима, Шиничи; Джон, Каннингем; Липперт, Кристоф; Клофт, Мариус (2017). «Разреженная пробит линейная смешанная модель» (PDF). Машинное обучение. 106 (9–10): 1–22. arXiv:1507.04777. Дои:10.1007 / s10994-017-5652-6.

дальнейшее чтение

  • Грин, Уильям Х., Эконометрический анализ, седьмое издание, Prentice-Hall, 2012.