Показатели ошибки при проверке гипотез - Error exponents in hypothesis testing

В статистическая проверка гипотез, показатель ошибки процедуры проверки гипотез - это скорость, с которой вероятности Типа I и Типа II экспоненциально убывают с размером образца, используемого в тесте. Например, если вероятность ошибки ${ displaystyle P _ { mathrm {error}}}$ теста распадается как ${ Displaystyle е ^ {- п бета}}$ , куда ${ displaystyle n}$ - размер выборки, показатель ошибки равен ${ displaystyle beta}$ .

Формально показатель ошибки теста определяется как предельное значение отношения отрицательного логарифма вероятности ошибки к размеру выборки для больших размеров выборки: ${ displaystyle lim _ {n to infty} { frac {- ln P _ { text {error}}} {n}}}$ . Показатели ошибки для различных проверок гипотез вычисляются с использованием Теорема Санова и другие результаты теория больших отклонений.

Показатели ошибки при проверке бинарных гипотез

Рассмотрим задачу проверки бинарных гипотез, в которой наблюдения моделируются как независимые и одинаково распределенные случайные величины по каждой гипотезе. Позволять ${ Displaystyle Y_ {1}, Y_ {2}, ldots, Y_ {n}}$ обозначают наблюдения. Позволять ${ displaystyle f_ {0}}$ обозначить функция плотности вероятности каждого наблюдения ${ displaystyle Y_ {i}}$ при нулевой гипотезе ${ displaystyle H_ {0}}$ и разреши ${ displaystyle f_ {1}}$ обозначают функцию плотности вероятности каждого наблюдения ${ displaystyle Y_ {i}}$ при альтернативной гипотезе ${ displaystyle H_ {1}}$ .

В этом случае есть два возможных события ошибки. Ошибка типа 1, также называемая ложный положительный результат, возникает, когда нулевая гипотеза верна и ошибочно отклоняется. Ошибка типа 2, также называемая ложноотрицательной, возникает, когда альтернативная гипотеза верна, а нулевая гипотеза не отклоняется. Обозначена вероятность ошибки 1-го типа. ${ displaystyle P ( mathrm {error} mid H_ {0})}$ а вероятность ошибки 2-го типа обозначена ${ Displaystyle P ( mathrm {error} mid H_ {1})}$ .

Оптимальная экспонента ошибки для тестирования Неймана – Пирсона

В системе Неймана – Пирсона^[1] версия бинарной проверки гипотез, интересует минимизация вероятности ошибки 2-го типа ${ displaystyle P ({ text {error}} mid H_ {1})}$ при условии, что вероятность ошибки типа 1 ${ displaystyle P ({ text {error}} mid H_ {0})}$ меньше или равен предварительно заданному уровню ${ displaystyle alpha}$ . В этой настройке оптимальной процедурой тестирования является критерий отношения правдоподобия.^[2] Кроме того, оптимальный тест гарантирует, что вероятность ошибки 2-го типа экспоненциально спадает с увеличением размера выборки. ${ displaystyle n}$ в соответствии с ${ displaystyle lim _ {n to infty} { frac {- ln P ( mathrm {error} mid H_ {1})} {n}} = D (f_ {0} parallel f_ { 1})}$ .^[3] Показатель ошибки ${ Displaystyle D (е_ {0} параллель е_ {1})}$ это Дивергенция Кульбака – Лейблера между распределениями вероятностей наблюдений при двух гипотезах. Этот показатель также называют показателем леммы Чернова – Стейна.

Оптимальный показатель ошибки для средней вероятности ошибки при проверке байесовской гипотезы

в Байесовский Версия проверки бинарной гипотезы заинтересована в минимизации средней вероятности ошибки при обеих гипотезах, предполагая априорную вероятность появления каждой гипотезы. Позволять ${ displaystyle pi _ {0}}$ обозначают априорную вероятность гипотезы ${ displaystyle H_ {0}}$ . В этом случае средняя вероятность ошибки определяется выражением ${ displaystyle P _ { text {ave}} = pi _ {0} P ({ text {error}} mid H_ {0}) + (1- pi _ {0}) P ({ text {error}} mid H_ {1})}$ . В этой настройке снова используется тест отношения правдоподобия.^[4] оптимальна, а оптимальная ошибка убывает как ${ displaystyle lim _ {n to infty} { frac {- ln P _ { text {ave}}} {n}} = C (f_ {0}, f_ {1})}$ куда ${ Displaystyle C (е_ {0}, е_ {1})}$ представляет информацию Чернова между двумя распределениями, определенными как ${ displaystyle C (f_ {0}, f_ {1}) = min _ { lambda in [0,1]} int (f_ {0} (x)) ^ { lambda} (f_ {1 } (x)) ^ {(1- lambda)} , dx.}$

Показатели ошибки при проверке гипотез - Error exponents in hypothesis testing

Содержание

Показатели ошибки при проверке бинарных гипотез

Оптимальная экспонента ошибки для тестирования Неймана – Пирсона

Оптимальный показатель ошибки для средней вероятности ошибки при проверке байесовской гипотезы

Рекомендации