Hyperprior - Hyperprior

В Байесовская статистика, а гиперприор это предварительное распространение на гиперпараметр, то есть от параметра предварительное распространение.

Как и в случае с термином гиперпараметр, использование гипер заключается в том, чтобы отличить его от предшествующего распределения параметра модели для базовой системы. Особенно они возникают при использовании сопряженные приоры.

Например, если вы используете бета-распространение для моделирования распределения параметра п из Распределение Бернулли, тогда:

  • Распределение Бернулли (с параметром п) это модель базовой системы;
  • п это параметр базовой системы (распределение Бернулли);
  • Бета-распределение (с параметрами α и β) это прежний распределение п;
  • α и β являются параметрами априорного распределения (бета-распределение), следовательно, гиперпараметры;
  • Предварительное распределение α и β таким образом гиперприор.

В принципе, можно повторить вышеизложенное: если сам гиперприор имеет гиперпараметры, их можно назвать гипергиперпараметрами и т. Д.

Аналогичным образом можно назвать апостериорное распределение по гиперпараметру гиперпостальным, и, если они принадлежат к одному семейству, назвать их сопряженными гиперраспределениями или сопряженными гиперприорами. Однако это быстро становится очень абстрактным и удаленным от исходной проблемы.

Цель

Гиперприоры, как и сопряженные априорные числа, обеспечивают удобство вычислений - они не изменяют процесс байесовского вывода, а просто позволяют проще описывать и вычислять с помощью априорного.

Неопределенность

Во-первых, использование гиперприора позволяет выразить неопределенность в гиперпараметре: принятие фиксированного априорного значения является предположением, изменение гиперпараметра априорного значения позволяет провести анализ чувствительности на основе этого предположения, а использование распределения по этому гиперпараметру позволяет выразить неопределенность в этом предположении: «предположим, что априор имеет такую ​​форму (это параметрическое семейство), но мы не уверены в том, какими именно должны быть значения параметров».

Распределение смеси

Говоря более абстрактно, если используется гиперприор, то априорное распределение (по параметру базовой модели) само по себе является плотность смеси: это средневзвешенное значение различных априорных распределений (по разным гиперпараметрам), причем гиперприор является взвешиванием. Это добавляет дополнительные возможные распределения (помимо используемого параметрического семейства), поскольку параметрические семейства распределений обычно не выпуклые множества - поскольку плотность смеси равна выпуклое сочетание дистрибутивов, это вообще будет врать за пределами Например, смесь двух нормальных распределений не является нормальным распределением: если взять разные средние (достаточно отдаленные) и смешать 50% каждого из них, получится бимодальное распределение, которое, таким образом, не является нормальным. Фактически, выпуклая оболочка нормальных распределений является плотной во всех распределениях, поэтому в некоторых случаях вы можете сколь угодно точно аппроксимировать данный априор, используя семейство с подходящим гиперприором.

Что делает этот подход особенно полезным, так это использование конъюгированных априорных значений: отдельные конъюгированные априорные элементы легко вычисляются апостериорами, и, таким образом, смесь конъюгированных априорных значений представляет собой одну и ту же смесь апостериорных значений: нужно только знать, как каждое из них сопряжено с предшествующими изменениями. Prior может быть слишком ограничительным, но использование смеси сопряженных априорных значений может дать желаемое распределение в форме, которую легко вычислить. Это похоже на разложение функции по собственным функциям - см. Сопряженный априор: аналогия с собственными функциями.

Динамическая система

Гиперприор - это распределение на пространстве возможных гиперпараметров. Если кто-то использует сопряженные априорные значения, то это пространство сохраняется за счет перехода к апостериорным - таким образом, по мере поступления данных распределение изменяется, но остается в этом пространстве: по мере поступления данных распределение развивается как динамическая система (каждая точка пространства гиперпараметров эволюционирует в обновленные гиперпараметры), с течением времени сходятся, как сходится само предшествующее.

Рекомендации

  • Бернардо, Дж. М .; Смит, А. Ф. М. (2000). Байесовская теория. Нью-Йорк: Вили. ISBN  0-471-49464-X.