Минимаксная оценка - Minimax estimator
В статистических теория принятия решений, где перед нами стоит задача оценки детерминированного параметра (вектора) из наблюдений ан оценщик (правило оценки) называется минимакс если его максимальный рисковать минимальна среди всех оценок . В некотором смысле это означает, что это оценщик, который работает лучше всего в наихудшем из возможных случаев, допускаемых в задаче.
Настройка проблемы
Рассмотрим задачу оценки детерминированного (не Байесовский ) параметр от зашумленных или поврежденных данных связанные через условное распределение вероятностей . Наша цель - найти "хороший" оценщик. для оценки параметра , что минимизирует некоторые заданные функция риска . Здесь функция риска (технически Функциональный или Оператор поскольку функция функции, НЕ композиция функции) ожидание некоторых функция потерь относительно . Популярный пример функции потерь[1] это квадрат ошибки потери , а функцией риска для этой потери является среднеквадратичная ошибка (MSE).
К сожалению, в целом риск нельзя минимизировать, так как он зависит от неизвестного параметра. сам (если бы мы знали, какова реальная стоимость , нам не нужно было бы его оценивать). Поэтому требуются дополнительные критерии для поиска оптимальной оценки в некотором смысле. Одним из таких критериев является минимаксный критерий.
Определение
Определение : Оценщик называется минимакс относительно функции риска если он достигает наименьшего максимального риска среди всех оценщиков, что означает, что он удовлетворяет
Наименее благоприятное распределение
По логике, оценка является минимаксной, когда она является наилучшей в худшем случае. Продолжая эту логику, минимаксный оценщик должен быть Байесовская оценка относительно наименее благоприятного априорного распределения . Чтобы продемонстрировать это понятие, обозначим средний риск байесовской оценки относительно предшествующего распределения так как
Определение: Предварительное распространение называется наименее благоприятным, если для любого другого распределения средний риск удовлетворяет .
Теорема 1: Если тогда:
- является минимаксным.
- Если является уникальной байесовской оценкой, а также уникальной минимаксной оценкой.
- наименее благоприятен.
Следствие: Если байесовский оценщик имеет постоянный риск, он минимальный. Учтите, что это необязательное условие.
Пример 1: недобросовестная монета[2][3]: Рассмотрим задачу оценки «успешности» биномиальный Переменная, . Это можно рассматривать как оценку скорости, с которой несправедливая монета падает на «орла» или «решку». В этом случае байесовская оценка относительно Бета -распределенный приор, является
с постоянным байесовским риском
и, согласно Следствию, является минимаксным.
Определение: Последовательность предшествующих распределений называется наименее благоприятным, если для любого другого распределения ,
Теорема 2: Если есть последовательность приоров и оценщик такой, что, тогда :
- является минимаксным.
- Последовательность наименее благоприятен.
Обратите внимание, что здесь не гарантируется уникальность. Например, оценка ML из предыдущего примера может быть достигнута как предел байесовских оценок относительно униформа прежний, с увеличением поддержки, а также относительно нормального априорного значения с нулевым средним с увеличением дисперсии. Таким образом, ни итоговая оценка ML не является уникальным минимаксом, ни наименее благоприятный априор не уникален.
Пример 2: Рассмотрим задачу оценки среднего значения размерный Гауссовский случайный вектор . В максимальная вероятность (ML) оценка для в этом случае просто , и его риск
Риск постоянен, но оценка ML на самом деле не является байесовской, поэтому следствие теоремы 1 не применяется. Однако оценка ML является пределом байесовских оценок по отношению к предыдущей последовательности. , и, следовательно, действительно минимакс согласно теореме 2. Тем не менее из минимаксности не всегда следует допустимость. Фактически в этом примере известно, что оценка ML недопустима (не допустима) всякий раз, когда . Известный Оценка Джеймса – Стейна доминирует над ML всякий раз, когда . Хотя оба оценщика имеют одинаковый риск когда , и оба они минимаксны, оценка Джеймса – Стейна имеет меньший риск для любых конечных . Этот факт проиллюстрирован на следующем рисунке.
Несколько примеров
В общем, определить минимаксную оценку сложно, а зачастую и невозможно. Тем не менее, во многих случаях минимаксная оценка была определена.
Пример 3: ограниченное нормальное среднее: При оценке среднего значения вектора нормали , где известно, что . Байесовская оценка относительно априорной, которая равномерно распределена на краю ограничивающего сфера известен как минимаксный всякий раз, когда . Аналитическое выражение для этой оценки:
где , это модифицированный Функция Бесселя первого вида заказап.
Асимптотическая минимаксная оценка
Сложность определения точной минимаксной оценки мотивировала изучение оценок асимптотического минимакса - оценки называется -асимптотический (или приближенный) минимакс, если
Для многих задач оценивания, особенно в установках непараметрического оценивания, были установлены различные приближенные минимаксные оценки. Дизайн приближенной минимаксной оценки тесно связан с геометрией, такой как метрическое число энтропии, из .
Рандомизированная минимаксная оценка
Иногда минимаксная оценка может принимать форму рандомизированное правило принятия решения. Пример показан слева. Пространство параметров состоит всего из двух элементов, и каждая точка на графике соответствует риску правила принятия решения: координата x - это риск, когда параметр а координата y - это риск, когда параметр равен . В этой задаче принятия решения минимаксная оценка лежит на отрезке прямой, соединяющем две детерминированные оценки. Выбор с вероятностью и с вероятностью сводит к минимуму риск супремума.
Связь с надежной оптимизацией
Надежная оптимизация представляет собой подход к решению задач оптимизации в условиях неопределенности в знании основных параметров.[4][5] Например, Байесовская оценка MMSE параметра требует знания корреляционной функции параметра. Если знание этой корреляционной функции не полностью доступно, популярный подход минимаксной робастной оптимизации[6] состоит в том, чтобы определить набор, характеризующий неопределенность в отношении корреляционной функции, а затем провести минимаксную оптимизацию по набору неопределенности и оценке соответственно. Аналогичные минимаксные оптимизации могут быть выполнены, чтобы сделать оценки устойчивыми к некоторым неточно известным параметрам. Например, недавнее исследование, посвященное таким методам в области обработки сигналов, можно найти в.[7]
В R. Fandom Noubiap и W. Seidel (2001) был разработан алгоритм вычисления гамма-минимаксного решающего правила, когда гамма задается конечным числом обобщенных моментных условий. Такое решающее правило минимизирует максимум интегралов функции риска относительно всех распределений в гамме. Гамма-минимаксные решающие правила представляют интерес для исследований устойчивости в байесовской статистике.
использованная литература
- Э. Л. Леманн и Г. Каселла (1998), Теория точечного оценивания, 2-е изд. Нью-Йорк: Springer-Verlag.
- Ф. Перрон и Э. Маршанд (2002), "О минимаксной оценке ограниченного нормального среднего", Статистика и вероятностные письма 58: 327–333.
- Р. Фэндом Нубиап и У. Зайдель (2001), «Алгоритм для вычисления гамма-минимаксных правил принятия решений в условиях обобщенных моментов», Анналы статистики, Август 2001, т. 29, нет. 4. С. 1094–1116.
- Штейн, К. (1981). «Оценка среднего многомерного нормального распределения». Анналы статистики. 9 (6): 1135–1151. Дои:10.1214 / aos / 1176345632. Г-Н 0630098. Zbl 0476.62035.
- ^ Бергер, Дж. (1985). Статистическая теория принятия решений и байесовский анализ (2-е изд.). Нью-Йорк: Springer-Verlag. С. xv + 425. ISBN 0-387-96098-8. Г-Н 0580664.
- ^ Hodges, Jr., J.L .; Леманн, Э. (1950). «Некоторые проблемы при оценивании минимаксной точки». Анна. Математика. Статист. 21 (2): 182–197. Дои:10.1214 / aoms / 1177729838. JSTOR 2236900. Г-Н 0035949. Zbl 0038.09802.
- ^ Штейнхаус, Гюгон (1957). «Проблема оценки». Анна. Математика. Статист. 28 (3): 633–648. Дои:10.1214 / aoms / 1177706876. JSTOR 2237224. Г-Н 0092313. Zbl 0088.35503.
- ^ С. А. Кассам и Х. В. Бедный (1985), "Надежные методы обработки сигналов: обзор", Труды IEEE, т. 73, стр. 433–481, март 1985 г.
- ^ А. Бен-Тал, Л. Эль-Гауи и А. Немировски (2009), «Робастная оптимизация», Princeton University Press, 2009.
- ^ С. Верду и Х. В. Пур (1984), "О минимаксной робастности: общий подход и приложения", IEEE Transactions по теории информации, т. 30, стр. 328–340, март 1984 г.
- ^ М. Датский Нисар. Минимаксная надежность в обработке сигналов для связи, Шейкер Верлаг, ISBN 978-3-8440-0332-1, Август 2011 г.