Лямбда Гудмана и Крускалса - Goodman and Kruskals lambda

В теория вероятности и статистика, Лямбда Гудмана и Краскала () является мерой пропорционального уменьшения погрешности Кросстабуляция анализ. Для любого образца с номинальный независимая переменная и зависимая переменная (или те, которые могут обрабатываться номинально), он указывает степень, в которой модальные категории и частоты для каждого значения независимой переменной отличаются от общей модальной категории и частоты, то есть для всех значений независимой переменной вместе. можно рассчитать с помощью уравнения

куда

- общая немодальная частота, а
представляет собой сумму немодальных частот для каждого значения независимой переменной.

Значения лямбда варьируются от нуля (нет связи между независимый и зависимые переменные) к единице (идеальная ассоциация ).

Недостатки

Хотя лямбда Гудмана и Крускала - простой способ оценить связь между переменными, она дает значение 0 (нет связи), когда две переменные находятся в согласие - то есть, когда модальная категория одинакова для всех значений независимой переменной, даже если модальные частоты или проценты меняются. В качестве примера рассмотрим таблицу ниже, в которой описана фиктивная выборка из 350 человек, сгруппированных по статусу родства и артериальному давлению. Предположим, что статус взаимосвязи является независимой переменной, артериальное давление - зависимой переменной, то есть задается вопрос: «Можно ли лучше предсказать артериальное давление, если известен статус взаимосвязи?»

Статус отношений и артериальное давление (вымышленные)
Семейное положениеОбщий
НезамужняяЖенат
Артериальное давлениеНормальный80%
(120)
51%
(102)
63.4%
(222)
Высоко20%
(30)
49%
(98)
36.6%
(128)
Общий42.9%
(150)
57.1%
(200)
100%
(350)

Для этого образца

Причина в том, что прогнозируемое номинальное артериальное давление фактически является «нормальным» в обоих столбцах (оба верхних числа выше соответствующего нижнего числа). Таким образом, рассмотрение статуса отношений не изменит прогноза о том, что у людей нормальное кровяное давление, даже если данные показывают, что брак увеличивает вероятность высокого кровяного давления.

Если вопрос изменен, например на вопрос «Каков прогнозируемый статус отношений на основе артериального давления?» будет иметь ненулевое значение.

То есть:

Смотрите также

Рекомендации