Поправка Ятесса на непрерывность - Yatess correction for continuity

В статистика, Поправка Йетса на непрерывность (или же Тест хи-квадрат Йейтса) используется в определенных ситуациях при тестировании на независимость в Таблица сопряженности. Он направлен на исправление ошибки, введенной путем предположения, что дискретные вероятности частот в таблице могут быть аппроксимированы непрерывным распределением (хи-квадрат ). В некоторых случаях поправка Йетса может слишком сильно подстраиваться, и поэтому ее текущее использование ограничено.

Поправка на ошибку аппроксимации

С использованием распределение хи-квадрат интерпретировать Статистика хи-квадрат Пирсона требует предположить, что дискретный вероятность наблюдаемого биномиальные частоты в таблице можно аппроксимировать непрерывным распределение хи-квадрат. Это предположение не совсем верно и вносит некоторую ошибку.

Чтобы уменьшить ошибку приближения, Фрэнк Йейтс, английский статистик, предложил поправку на непрерывность, которая корректирует формулу для Критерий хи-квадрат Пирсона путем вычитания 0,5 из разницы между каждым наблюдаемым значением и его ожидаемым значением в таблице непредвиденных обстоятельств 2 × 2.[1] Это уменьшает полученное значение хи-квадрат и, таким образом, увеличивает его p-значение.

Эффект поправки Йетса состоит в том, чтобы предотвратить переоценку статистической значимости небольших данных. Эта формула в основном используется, когда хотя бы одна ячейка таблицы имеет ожидаемое количество меньше 5. К сожалению, поправка Йейтса может иметь тенденцию к чрезмерной корректировке. Это может привести к чрезмерно консервативному результату, не позволяющему отвергнуть нулевая гипотеза когда это должно (a ошибка типа II ). Таким образом, предполагается, что поправка Йейтса не нужна даже при довольно малых размерах выборки,[2] Такие как:

Ниже приводится исправленная версия Йейтса. Статистика хи-квадрат Пирсона:

куда:

Оя = наблюдаемая частота
Eя = ожидаемая (теоретическая) частота, утвержденная нулевой гипотезой
N = количество различных событий

Стол 2 × 2

В качестве сокращения для таблицы 2 × 2 со следующими записями:

 SF 
АабNА
BcdNB
 NSNFN

мы можем написать

В некоторых случаях так лучше.

Смотрите также

Рекомендации

  1. ^ Йейтс, Ф (1934). "Таблица непредвиденных обстоятельств с малыми числами и χ2 тест". Дополнение к Журнал Королевского статистического общества 1(2): 217–235. JSTOR  2983604
  2. ^ Сокал Р.Р., Рольф Ф.Дж. (1981). Биометрия: принципы и практика статистики в биологических исследованиях. Оксфорд: W.H. Фриман, ISBN  0-7167-1254-7.