Бинарная регрессия - Binary regression

В статистика, конкретно регрессивный анализ, а бинарная регрессия оценивает связь между одним или несколькими объясняющие переменные и один выход двоичная переменная. Обычно моделируется вероятность двух альтернатив вместо простого вывода одного значения, как в линейная регрессия.

Бинарная регрессия обычно рассматривается как частный случай биномиальная регрессия, с одним исходом (), и одна из двух альтернатив, рассматриваемая как «успешная» и кодируемая как 1: значение представляет собой количество успехов в 1 испытании, либо 0, либо 1. Наиболее распространенными моделями бинарной регрессии являются модели логит модель (логистическая регрессия ) и пробит модель (пробит регресс ).

Приложения

Двоичная регрессия в основном применяется либо для прогнозирования (двоичная классификация ), или для оценки ассоциация между независимыми переменными и выходом. В экономике бинарные регрессии используются для моделирования двоичный выбор.

Интерпретации

Модели бинарной регрессии можно интерпретировать как скрытые переменные модели вместе с моделью измерения; или как вероятностные модели, непосредственно моделирующие вероятность.

Скрытая переменная модель

Интерпретация скрытой переменной традиционно использовалась в биоанализ, давая пробит модель, где предполагаются нормальная дисперсия и обрезание. Интерпретация скрытой переменной также используется в теория ответа элемента (IRT).

Формально интерпретация скрытой переменной утверждает, что результат у связан с вектором независимых переменных Икс к

куда и , β вектор параметры и грамм это распределение вероятностей.

Эта модель может применяться во многих экономических контекстах. Например, результатом может быть решение менеджера инвестировать в программу, ожидаемая чистая дисконтированный денежный поток и Икс - вектор переменных, которые могут влиять на денежный поток этой программы. Тогда менеджер будет инвестировать только тогда, когда ожидает, что чистый дисконтированный денежный поток будет положительным.[1]

Часто срок ошибки предполагается, что следует нормальное распределение зависит от объясняющих переменных Икс. Это порождает стандартный пробит модель.[2]

Вероятностная модель

Простейшей прямой вероятностной моделью является логит модель, который моделирует логарифм как линейная функция объясняющей переменной или переменных. Логит-модель является «самой простой» в смысле обобщенные линейные модели (GLIM): логарифмические шансы являются естественным параметром для экспоненциальная семья распределения Бернулли, поэтому его проще всего использовать для вычислений.

Другая прямая вероятностная модель - это линейная вероятностная модель, который моделирует саму вероятность как линейную функцию независимых переменных. Недостатком линейной вероятностной модели является то, что для некоторых значений независимых переменных модель будет предсказывать вероятности меньше нуля или больше единицы.

Смотрите также

Рекомендации

  1. ^ Подробный пример см. В: Тецуо Яй, Сэйдзи Ивакура, Сигеру Моричи, Мультиномиальный пробит со структурированной ковариацией для поведения при выборе маршрута, Транспортные исследования, часть B: Методологические, том 31, выпуск 3, июнь 1997, страницы 195–207, ISSN 0191 -2615
  2. ^ Блисс, К. И. (1934). «Метод пробитов». Наука 79 (2037): 38–39.
  • Лонг, Дж. Скотт; Фриз, Джереми (2006). «4. Модели для двоичных результатов: 4.1 Статистическая модель». Модели регрессии для категориальных зависимых переменных с использованием Stata, второе издание. Stata Press. С. 131–136. ISBN  978-1-59718011-5.CS1 maint: ref = harv (связь)