Показатели ошибки при проверке гипотез - Error exponents in hypothesis testing
В статистическая проверка гипотез, показатель ошибки процедуры проверки гипотез - это скорость, с которой вероятности Типа I и Типа II экспоненциально убывают с размером образца, используемого в тесте. Например, если вероятность ошибки теста распадается как , куда - размер выборки, показатель ошибки равен .
Формально показатель ошибки теста определяется как предельное значение отношения отрицательного логарифма вероятности ошибки к размеру выборки для больших размеров выборки: . Показатели ошибки для различных проверок гипотез вычисляются с использованием Теорема Санова и другие результаты теория больших отклонений.
Показатели ошибки при проверке бинарных гипотез
Рассмотрим задачу проверки бинарных гипотез, в которой наблюдения моделируются как независимые и одинаково распределенные случайные величины по каждой гипотезе. Позволять обозначают наблюдения. Позволять обозначить функция плотности вероятности каждого наблюдения при нулевой гипотезе и разреши обозначают функцию плотности вероятности каждого наблюдения при альтернативной гипотезе .
В этом случае есть два возможных события ошибки. Ошибка типа 1, также называемая ложный положительный результат, возникает, когда нулевая гипотеза верна и ошибочно отклоняется. Ошибка типа 2, также называемая ложноотрицательной, возникает, когда альтернативная гипотеза верна, а нулевая гипотеза не отклоняется. Обозначена вероятность ошибки 1-го типа. а вероятность ошибки 2-го типа обозначена .
Оптимальная экспонента ошибки для тестирования Неймана – Пирсона
В системе Неймана – Пирсона[1] версия бинарной проверки гипотез, интересует минимизация вероятности ошибки 2-го типа при условии, что вероятность ошибки типа 1 меньше или равен предварительно заданному уровню . В этой настройке оптимальной процедурой тестирования является критерий отношения правдоподобия.[2] Кроме того, оптимальный тест гарантирует, что вероятность ошибки 2-го типа экспоненциально спадает с увеличением размера выборки. в соответствии с .[3] Показатель ошибки это Дивергенция Кульбака – Лейблера между распределениями вероятностей наблюдений при двух гипотезах. Этот показатель также называют показателем леммы Чернова – Стейна.
Оптимальный показатель ошибки для средней вероятности ошибки при проверке байесовской гипотезы
в Байесовский Версия проверки бинарной гипотезы заинтересована в минимизации средней вероятности ошибки при обеих гипотезах, предполагая априорную вероятность появления каждой гипотезы. Позволять обозначают априорную вероятность гипотезы . В этом случае средняя вероятность ошибки определяется выражением . В этой настройке снова используется тест отношения правдоподобия.[4] оптимальна, а оптимальная ошибка убывает как куда представляет информацию Чернова между двумя распределениями, определенными как
Рекомендации
- ^ Нейман, Дж.; Пирсон, Э.С. (1933), «К вопросу о наиболее эффективных проверках статистических гипотез» (PDF), Философские труды Лондонского королевского общества A, 231 (694–706): 289–337, Bibcode:1933РСПТА.231..289Н, Дои:10.1098 / рста.1933.0009, JSTOR 91247
- ^ Леманн, Э.; Романо, Джозеф П. (2005). Проверка статистических гипотез (3-е изд.). Нью-Йорк: Спрингер. ISBN 978-0-387-98864-1.
- ^ Обложка, Томас М.; Томас, Джой А. (2006). Элементы теории информации (2-е изд.). Нью-Йорк: Wiley-Interscience.
- ^ Бедный, Х.В. (2010). Введение в обнаружение и оценку сигналов (2-е изд.). Нью-Йорк: Спрингер.