Парадокс Линдли - Lindleys paradox

Парадокс Линдли это нелогичный ситуация в статистика в которой Байесовский и частотник подходы к проверка гипотезы проблема дает разные результаты для определенных вариантов выбора предварительное распространение. Проблема несовпадения двух подходов обсуждалась в Гарольд Джеффрис 'Учебник 1939 г .;[1] он стал известен как парадокс Линдли после Деннис Линдли назвал разногласие парадокс в статье 1957 года.[2]

Хотя упоминается как парадокс, разные результаты байесовского и частотного подходов можно объяснить их использованием для ответа на принципиально разные вопросы, а не фактического несогласия между двумя методами.

Тем не менее, для большого класса априорных подходов различия между частотным и байесовским подходами вызваны сохранением фиксированного уровня значимости: как признавал даже Линдли, «теория не оправдывает практику сохранения фиксированного уровня значимости» и даже «некоторые вычисления профессора Пирсона в обсуждении этого документа подчеркнули, как уровень значимости должен измениться с размером выборки, если бы потери и априорные вероятности оставались фиксированными ''.[2] Фактически, если критическое значение увеличивается с увеличением размера выборки достаточно быстро, то расхождение между частотным и байесовским подходами становится незначительным по мере увеличения размера выборки.[3]

Описание парадокса

Результат некоторого эксперимента имеет два возможных объяснения, гипотезы и , и некоторое предварительное распространение представление неопределенности относительно того, какая гипотеза более точна, прежде чем принимать во внимание .

Парадокс Линдли возникает, когда

  1. Результат "значимо" по частотному тесту с указанием достаточных доказательств для отклонения , скажем, на уровне 5%, и
  2. В апостериорная вероятность из данный высокий, что указывает на веские доказательства того, что лучше согласуется с чем .

Эти результаты могут возникнуть одновременно с очень специфично, более расплывчатые, и предварительное распределение не сильно способствует тому или другому, как показано ниже.

Числовой пример

Следующий числовой пример иллюстрирует парадокс Линдли. В одном городе за определенный период времени родился 49 581 мальчик и 48 870 девочек. Наблюдаемая пропорция рождений мальчиков составляет 49 581/98 451 ≈ 0,5036. Мы предполагаем, что доля рождений мужского пола составляет биномиальная переменная с параметром . Мы заинтересованы в том, чтобы проверить, составляет 0,5 или другое значение. То есть наша нулевая гипотеза и альтернатива .

Частотный подход

Частотный подход к тестированию заключается в вычислении p-значение, вероятность увидеть долю мальчиков не меньше, чем предполагая правда. Поскольку число рождений очень велико, мы можем использовать нормальное приближение для доли мужских рождений , с и , вычислить

Мы были бы в равной степени удивлены, если бы увидели 49 581 родов женского пола, т.е. , поэтому частотный специалист обычно выполняет двусторонний тест, для которого p-значение будет . В обоих случаях p-значение ниже уровня значимости α, равного 5%, поэтому частотный подход отвергает поскольку это не согласуется с наблюдаемыми данными.

Байесовский подход

При отсутствии причин отдавать предпочтение одной гипотезе другой, байесовский подход заключался бы в назначении априорных вероятностей и равномерное распределение по под , а затем вычислить апостериорную вероятность с помощью Теорема Байеса,

После наблюдения мальчики из рождений, мы можем вычислить апостериорную вероятность каждой гипотезы, используя функция массы вероятности для биномиальной переменной,

куда это Бета-функция.

Из этих значений находим апостериорную вероятность , что сильно способствует над .

Два подхода - байесовский и частотный - кажутся конфликтующими, и это «парадокс».

Согласование байесовского и частотного подходов

Однако, по крайней мере, в примере Линдли, если мы возьмем последовательность уровней значимости, αп, так что αп = пk с k > 1/2, то апостериорная вероятность нуля сходится к 0, что согласуется с отклонением нуля.[3] В этом числовом примере взяв k = 1/2, приводит к уровню значимости 0,00318, поэтому частотный специалист не отвергнет нулевую гипотезу, которая примерно соответствует байесовскому подходу.

Распределение п при нулевой гипотезе и апостериорном распределении п.

Если мы используем малоинформативный приор и проверить гипотезу, более похожую на гипотезу частотного подхода, парадокс исчезает.

Например, если мы рассчитаем апостериорное распределение , используя равномерное предварительное распределение на (т.е. ), мы нашли

Если мы используем это, чтобы проверить вероятность того, что новорожденный, скорее всего, будет мальчиком, чем девочкой, т.е. , мы нашли

Другими словами, очень вероятно, что доля рождений мужского пола выше 0,5.

Ни один из анализов не дает оценки размер эффекта, напрямую, но оба могут использоваться для определения, например, того, будет ли доля рождений мальчиков выше определенного порогового значения.

Отсутствие настоящего парадокса

Очевидное расхождение между двумя подходами вызвано сочетанием факторов. Во-первых, частотный подход, описанный выше. без ссылки на . Байесовский подход оценивает как альтернатива , и обнаружил, что первая лучше согласуется с наблюдениями. Это потому, что последняя гипотеза гораздо более расплывчата, поскольку может быть где угодно в , что приводит к очень низкой апостериорной вероятности. Чтобы понять, почему, полезно рассмотреть две гипотезы как генераторы наблюдений:

  • Под , мы выбрали и спросите, какова вероятность увидеть 49 581 мальчика при 98 451 рождении.
  • Под , мы выбрали случайным образом от 0 до 1 и задайте тот же вопрос.

Большинство возможных значений для под очень слабо подтверждаются наблюдениями. По сути, очевидное расхождение между методами - это вовсе не разногласия, а, скорее, два разных утверждения о том, как гипотезы соотносятся с данными:

  • Частотел считает, что является плохим объяснением наблюдения.
  • Байесовец считает, что - гораздо лучшее объяснение наблюдения, чем .

Согласно частотному тесту соотношение полов новорожденных маловероятно 50/50. Тем не менее 50/50 - лучшее приближение, чем большинство, но не все, другие соотношения. Гипотеза соответствовали бы наблюдениям намного лучше, чем почти все другие соотношения, включая .

Например, этот выбор гипотез и априорных вероятностей подразумевает утверждение: «если > 0,49 и <0,51, то априорная вероятность быть точно 0,5 равно 0,50 / 0,51 98% ". Учитывая такое сильное предпочтение , легко понять, почему байесовский подход отдает предпочтение перед лицом , хотя наблюдаемое значение ложь от 0,5. Отклонение более 2 сигм от считается важным в частотном подходе, но его значение отвергается предшествующим в байесовском подходе.

Посмотрев на это с другой стороны, мы можем увидеть, что априорное распределение по существу является плоским с дельта-функцией на . Ясно, что это сомнительно. Фактически, если бы вы представили действительные числа как непрерывные, то было бы более логичным предположить, что никакое данное число не могло бы быть точным значением параметра, т.е. мы должны принять P (theta = 0,5) = 0.

Более реалистичное распределение для в альтернативной гипотезе дает менее удивительный результат для апостериорной части . Например, если мы заменим с , т.е. оценка максимального правдоподобия за , апостериорная вероятность будет всего 0,07 по сравнению с 0,93 для (Конечно, на самом деле нельзя использовать MLE как часть предыдущего распространения).

Недавнее обсуждение

Парадокс продолжает оставаться предметом активных дискуссий.[3][4][5][6]

Смотрите также

Примечания

  1. ^ Джеффрис, Гарольд (1939). Теория вероятности. Oxford University Press. МИСТЕР  0000924.
  2. ^ а б Линдли, Д.В. (1957). «Статистический парадокс». Биометрика. 44 (1–2): 187–192. Дои:10.1093 / biomet / 44.1-2.187. JSTOR  2333251.
  3. ^ а б c Нааман, Майкл (01.01.2016). «Почти верная проверка гипотез и разрешение парадокса Джеффриса-Линдли». Электронный статистический журнал. 10 (1): 1526–1550. Дои:10.1214 / 16-EJS1146. ISSN  1935-7524.
  4. ^ Спанос, Арис (2013). «Кого следует опасаться парадокса Джеффриса-Линдли?». Философия науки. 80.1: 73–93. Дои:10.1086/668875.
  5. ^ Шпренгер, янв (2013). «Проверка точной нулевой гипотезы: случай парадокса Линдли» (PDF). Философия науки. 80: 733–744. Дои:10.1086/673730.
  6. ^ Роберт, Кристиан П. (2014). «О парадоксе Джеффриса-Линдли». Философия науки. 81.2: 216–232. arXiv:1303.5973. Дои:10.1086/675729.

дальнейшее чтение