Тест хи-квадрат - Chi-squared test

Распределение хи-квадрат, показывая χ2 на Иксось и п-значение (вероятность правого хвоста) на у-ось.

А критерий хи-квадрат, также записывается как χ2 тест, это проверка статистической гипотезы то есть действительный выполнить, когда статистика теста распределенный хи-квадрат под нулевая гипотеза, конкретно Критерий хи-квадрат Пирсона и их варианты. Критерий хи-квадрат Пирсона используется для определения наличия статистически значимый разница между ожидаемым частоты и наблюдаемые частоты в одной или нескольких категориях Таблица сопряженности.

В стандартных приложениях этого теста наблюдения делятся на взаимоисключающие классы. Если нулевая гипотеза что нет различий между классами в популяции, верно, тестовая статистика, вычисленная на основе наблюдений, следует χ2 Распределение частоты. Цель теста - оценить, насколько вероятно, что наблюдаемые частоты будут предполагать, что нулевая гипотеза верна.

Статистика тестов, следующая за χ2 распределение происходит, когда наблюдения независимы и нормально распределенный, предположения которых часто оправдываются Центральная предельная теорема. Это также χ2 тесты для проверки нулевой гипотезы независимости пары случайные переменные на основе наблюдений за парами.

Критерии хи-квадрат часто относятся к тестам, для которых распределение тестовой статистики приближается к χ2 распределение асимптотически, что означает, что выборочное распределение (если нулевая гипотеза верна) тестовой статистики все более и более приближается к распределению хи-квадрат как образец размеры увеличиваются.

История

В XIX веке статистические аналитические методы в основном применялись при анализе биологических данных, и исследователи обычно предполагали, что наблюдения следуют нормальное распределение, Такие как Сэр Джордж Эйри и Профессор Мерриман, чьи работы критиковали Карл Пирсон в его статье 1900 года.[1]

В конце 19 века Пирсон заметил существование значительных перекос в рамках некоторых биологических наблюдений. Чтобы смоделировать наблюдения, независимо от того, нормальны они или искажены, Пирсон в серии статей, опубликованных с 1893 по 1916 год,[2][3][4][5] разработал Распределение Пирсона, семейство непрерывных распределений вероятности, которое включает нормальное распределение и множество искаженных распределений, и предложил метод статистического анализа, состоящий из использования распределения Пирсона для моделирования наблюдения и выполнения теста согласия, чтобы определить, насколько хорошо модель действительно соответствует наблюдениям.

Критерий хи-квадрат Пирсона

В 1900 году Пирсон опубликовал статью[1] на χ2 тест, который считается одной из основ современной статистики.[6] В этой статье Пирсон исследовал критерий согласия.

Предположим, что п наблюдения в случайной выборке из совокупности подразделяются на k взаимоисключающие классы с соответствующими наблюдаемыми номерами Икся (за я = 1,2,…,k), а нулевая гипотеза дает вероятность пя что наблюдение попадает в яй класс. Итак, у нас есть ожидаемые числа мя = нпя для всех я, куда

Пирсон предположил, что при условии, что нулевая гипотеза верна, как п → ∞ предельное распределение величины, приведенной ниже, является χ2 распределение.

Пирсон сначала рассмотрел случай, когда ожидаемые числа мя достаточно большие известные числа во всех ячейках, предполагая, что каждое Икся можно рассматривать как нормально распределенный, и достигли результата, что в пределе при п становится большим, Икс2 следует за χ2 распространение с k − 1 степени свободы.

Однако затем Пирсон рассмотрел случай, в котором ожидаемые числа зависели от параметров, которые необходимо было оценить на основе выборки, и предположил, что с обозначением мя истинные ожидаемые числа и мя предполагаемые ожидаемые числа, разница

обычно будет положительным и достаточно маленьким, чтобы его можно было опустить. В заключение Пирсон утверждал, что если мы рассмотрим Икс2 также распространяется как χ2 распространение с k − 1 степени свободы, ошибка этого приближения не повлияет на практические решения. Этот вывод вызвал некоторые разногласия в практических приложениях и не был принят в течение 20 лет до статей Фишера 1922 и 1924 годов.[7][8]

Другие примеры тестов хи-квадрат

Один статистика теста что следует за распределение хи-квадрат именно проверка того, что дисперсия нормально распределенной совокупности имеет заданное значение на основе выборочная дисперсия. Такие тесты нечасто встречаются на практике, поскольку истинная дисперсия совокупности обычно неизвестна. Однако есть несколько статистических тестов, в которых распределение хи-квадрат приблизительно верно:

Точный тест Фишера

Точный тест, используемый вместо теста хи-квадрат 2 x 2 на независимость, см. Точный тест Фишера.

Биномиальный тест

Точный тест, используемый вместо критерия согласия 2 x 1 на соответствие, см. Биномиальный тест.

Другие тесты хи-квадрат

Поправка Йетса на непрерывность

С использованием распределение хи-квадрат интерпретировать Статистика хи-квадрат Пирсона требует предположить, что дискретный вероятность наблюдаемого биномиальные частоты в таблице можно аппроксимировать непрерывным распределение хи-квадрат. Это предположение не совсем верно и вносит некоторую ошибку.

Для уменьшения ошибки приближения Фрэнк Йейтс предложил поправку на непрерывность, которая корректирует формулу для Критерий хи-квадрат Пирсона путем вычитания 0,5 из абсолютной разницы между каждым наблюдаемым значением и его ожидаемым значением в 2 × 2 Таблица сопряженности.[9] Это уменьшает полученное значение хи-квадрат и, таким образом, увеличивает его п-ценить.

Критерий хи-квадрат для дисперсии в нормальной популяции

Если образец размера п берется из населения, имеющего нормальное распределение, то есть результат (см. распределение выборочной дисперсии ), который позволяет проверить, имеет ли дисперсия генеральной совокупности заранее определенное значение. Например, производственный процесс мог находиться в стабильном состоянии в течение длительного периода, что позволяло определять значение отклонения практически без ошибок. Предположим, что тестируется вариант процесса, в результате чего создается небольшая выборка п товарные позиции, вариации которых подлежат проверке. Статистика теста Т в этом случае можно задать сумму квадратов выборочного среднего, деленную на номинальное значение дисперсии (т. е. значение, которое будет проверяться как имеющееся). потом Т имеет распределение хи-квадрат с п − 1 степени свободы. Например, если размер выборки равен 21, область приемлемости для Т с уровнем значимости 5% находится между 9,59 и 34,17.

Пример критерия хи-квадрат для категориальных данных

Предположим, что есть город с населением 1000000 жителей и четырьмя районами: А, B, C, и D. Произведена случайная выборка из 650 жителей города, род занятий которых записан как «белый воротничок», «синий воротничок» или «без воротника». Нулевая гипотеза состоит в том, что район проживания каждого человека не зависит от профессиональной классификации человека. Данные представлены в виде таблицы:

АBCDобщий
белый воротничок906010495349
Синий воротник30505120151
Без воротника30404535150
Общий150150200150650

Возьмем образец проживающих по соседству А, 150, чтобы оценить, какая часть из 1000000 живет по соседству А. Аналогично берем 349/650 оценить, какая часть из 1 000 000 - белые воротнички. Исходя из предположения о независимости в рамках гипотезы, мы должны «ожидать» количества белых воротничков по соседству. А быть

Тогда в этой «ячейке» таблицы мы имеем

Сумма этих величин по всем ячейкам является статистикой теста; в таком случае, . При нулевой гипотезе эта сумма имеет приблизительно распределение хи-квадрат, число степеней свободы которого равно

Если тестовая статистика невероятно велика в соответствии с этим распределением хи-квадрат, то можно отвергнуть нулевую гипотезу независимости.

Связанный с этим вопрос - это проверка на однородность. Предположим, что вместо того, чтобы дать каждому жителю каждого из четырех районов равные шансы на включение в выборку, мы заранее решаем, сколько жителей каждого района включить. Тогда у каждого жителя будет такой же шанс быть выбранным, как и у всех жителей одного и того же района, но у жителей разных районов будет разная вероятность быть выбранным, если четыре размера выборки не пропорциональны населению четырех районов. В таком случае мы будем проверять «однородность», а не «независимость». Вопрос в том, одинаковы ли пропорции «синих воротничков», «белых воротничков» и «без воротничков» в четырех кварталах. Однако тест делается точно так же.

Приложения

В криптоанализ, критерий хи-квадрат используется для сравнения распределения простой текст и (возможно) расшифрованный зашифрованный текст. Наименьшее значение теста означает, что расшифровка прошла успешно с высокой вероятностью.[10][11] Этот метод можно обобщить для решения современных криптографических задач.[12]

В биоинформатика, критерий хи-квадрат используется для сравнения распределения определенных свойств генов (например, геномного содержания, скорости мутаций, кластеризации сетей взаимодействия и т. д.), принадлежащих к разным категориям (например, гены болезней, основные гены, гены на определенной хромосоме так далее.).[13][14]

Смотрите также

Рекомендации

  1. ^ а б Пирсон, Карл (1900). «По критерию, согласно которому данная система отклонений от вероятного в случае коррелированной системы переменных такова, что можно разумно предположить, что она возникла в результате случайной выборки» (PDF). Философский журнал. Серия 5. 50 (302): 157–175. Дои:10.1080/14786440009463897.
  2. ^ Пирсон, Карл (1893). «Вклад в математическую теорию эволюции [аннотация]». Труды Королевского общества. 54: 329–333. Дои:10.1098 / rspl.1893.0079. JSTOR  115538.
  3. ^ Пирсон, Карл (1895). «Вклад в математическую теорию эволюции, II: асимметрия в однородном материале». Философские труды Королевского общества. 186: 343–414. Bibcode:1895РСПТА.186..343П. Дои:10.1098 / рста.1895.0010. JSTOR  90649.
  4. ^ Пирсон, Карл (1901). «Математический вклад в теорию эволюции, X: Дополнение к мемуарам о перекосах». Философские труды Королевского общества A. 197 (287–299): 443–459. Bibcode:1901РСПТА.197..443П. Дои:10.1098 / рста.1901.0023. JSTOR  90841.
  5. ^ Пирсон, Карл (1916). «Математические вклады в теорию эволюции, XIX: второе приложение к мемуарам о перекосах». Философские труды Королевского общества A. 216 (538–548): 429–457. Bibcode:1916РСПТА.216..429П. Дои:10.1098 / рста.1916.0009. JSTOR  91092.
  6. ^ Кокран, Уильям Г. (1952). «Тест согласия по критерию хи-квадрат». Анналы математической статистики. 23 (3): 315–345. Дои:10.1214 / aoms / 1177729380. JSTOR  2236678.
  7. ^ Фишер, Рональд А. (1922). "Об интерпретации χ2 из таблиц непредвиденных обстоятельств и расчета P ». Журнал Королевского статистического общества. 85 (1): 87–94. Дои:10.2307/2340521. JSTOR  2340521.
  8. ^ Фишер, Рональд А. (1924). "Условия, при которых χ2 Измеряет расхождение между наблюдением и гипотезой ». Журнал Королевского статистического общества. 87 (3): 442–450. JSTOR  2341149.
  9. ^ Йетс, Фрэнк (1934). "Таблица непредвиденных обстоятельств с малым числом и χ2 тест". Приложение к Журналу Королевского статистического общества. 1 (2): 217–235. Дои:10.2307/2983604. JSTOR  2983604.
  10. ^ «Статистика хи-квадрат». Практическая криптография. Архивировано из оригинал 18 февраля 2015 г.. Получено 18 февраля 2015.
  11. ^ «Использование Чи в квадрате для взлома кодов». Ресурсы IB ​​по математике. Британская международная школа на Пхукете.
  12. ^ Рябко, Б. Я .; Стогниенко, В. С .; Шокин, Ю. И. (2004). «Новый тест на случайность и его применение к некоторым криптографическим задачам» (PDF). Журнал статистического планирования и вывода. 123 (2): 365–376. Дои:10.1016 / s0378-3758 (03) 00149-6. Получено 18 февраля 2015.
  13. ^ Фельдман, И .; Ржецкий, А .; Виткуп Д. (2008). «Сетевые свойства генов, несущих мутации наследственных болезней». PNAS. 105 (11): 4323–432. Bibcode:2008PNAS..105.4323F. Дои:10.1073 / pnas.0701722105. ЧВК  2393821. PMID  18326631.
  14. ^ "хи-квадрат-тесты" (PDF). Архивировано из оригинал (PDF) 29 июня 2018 г.. Получено 29 июн 2018.

дальнейшее чтение