Условная логистическая регрессия - Conditional logistic regression
Условная логистическая регрессия является продолжением логистическая регрессия что позволяет учесть стратификация и соответствие. Его основная область применения - наблюдательные исследования и в частности эпидемиология. Он был разработан в 1978 году Норман Бреслоу, Николай день, К. Т. Халворсен, Росс Л. Прентис и К. Сабай.[1] Это наиболее гибкая и общая процедура для сопоставленных данных.
Мотивация
Наблюдательные исследования используют стратификация или же соответствие как способ контролировать сбивать с толку. До условной логистической регрессии для сопоставленных данных существовало несколько тестов, как показано на связанные тесты. Однако они не позволяли анализировать непрерывные предикторы с произвольным размером страты. Всем этим процедурам также не хватает гибкости условной логистической регрессии и, в частности, возможности контроля ковариат.
Логистическая регрессия может учитывать стратификацию, имея разные постоянные члены для каждой страты. Обозначим ярлык (например, статус дела) -е наблюдение й слой и значения соответствующих предикторов. Тогда вероятность одного наблюдения равна
куда постоянный член для й слой. Хотя это удовлетворительно работает для ограниченного числа слоев, патологическое поведение возникает, когда слои малы. Когда страты парные, количество параметров растет с количеством наблюдений. (это равно ). Асимптотические результаты, на которых оценка максимального правдоподобия основано на, поэтому недействительны и оценка является необъективной. Фактически, можно показать, что безусловный анализ данных совпадающих пар приводит к оценке отношения шансов, которое является квадратом правильного условного.[2]
Условная вероятность
Подход условного правдоподобия имеет дело с указанным выше патологическим поведением, обусловливая количество случаев в каждой страте и, следовательно, устраняя необходимость в оценке параметров страты. В случае, когда страты являются парами, когда первое наблюдение является случаем, а второе - контролем, это можно увидеть следующим образом.
При аналогичных вычислениях условная вероятность слоя размером , с первые наблюдения являются случаями,
куда это множество всех подмножеств размера из набора .
Тогда полная условная логарифмическая вероятность - это просто сумма логарифмических правдоподобий для каждого слоя. Тогда оценщик определяется как что максимизирует условное логарифмическое правдоподобие.
Выполнение
Условная логистическая регрессия доступна в R как функция клогит
в выживание
упаковка. Это в выживание
пакет, потому что логарифмическая вероятность условной логистической модели такая же, как логарифмическая вероятность модели Кокса с определенной структурой данных.[3]
Связанные тесты
- Тест парных различий позволяет проверить связь между двоичным результатом и непрерывным предиктором с учетом спаривания.
- Тест Кокрана-Мантеля-Хензеля позволяет проверить связь между двоичным результатом и двоичным предиктором с учетом стратификации с произвольным размером страты. Когда его условия применения проверены, он идентичен условной логистической регрессии. оценка теста.[4]
Примечания
- ^ Breslow NE, Day NE, Халворсен KT, Prentice RL, Sabai C (1978). «Оценка множественных функций относительного риска в сопоставленных исследованиях случай-контроль». Am J Epidemiol. 108 (4): 299–307. Дои:10.1093 / oxfordjournals.aje.a112623. PMID 727199.
- ^ Breslow, N.E .; Day, N.E. (1980). Статистические методы исследования рака. Том 1 - Анализ исследований случай-контроль. Лион, Франция: МАИР. С. 249–251. Архивировано из оригинал на 2016-12-26. Получено 2016-11-04.
- ^ Ламли, Томас. «Документация R Условная логистическая регрессия». Получено 3 ноября, 2016.
- ^ Дэй, Н. Э., Байар, Д. П. (1979). «Проверка гипотез в исследованиях« случай-контроль »- эквивалентность статистики Мантеля-Хензеля и тестов логита». Биометрия. 35 (3): 623–630. Дои:10.2307/2530253.CS1 maint: несколько имен: список авторов (связь)