Оптимальная остановка - Optimal stopping
В математика, теория оптимальная остановка[1][2] или же ранняя остановка[3] занимается проблемой выбора времени для совершения определенного действия, чтобы максимизировать ожидаемое вознаграждение или минимизация ожидаемых затрат. Проблемы с оптимальной остановкой можно найти в статистика, экономика, и математические финансы (связано с ценообразованием Американские варианты ). Ключевым примером проблемы оптимальной остановки является проблема секретаря. Задачи оптимальной остановки часто можно записать в виде Уравнение беллмана, и поэтому часто решаются с помощью динамическое программирование.
Определение
Случай с дискретным временем
Проблемы с правилами остановки связаны с двумя объектами:
- Последовательность случайных величин , совместное распределение которого считается известным
- Последовательность функций вознаграждения которые зависят от наблюдаемых значений случайных величин в 1:
Учитывая эти объекты, проблема заключается в следующем:
- Вы наблюдаете последовательность случайных величин, и на каждом шаге , вы можете либо прекратить наблюдение, либо продолжить
- Если вы перестанете наблюдать на шаге , ты получишь награду
- Вы хотите выбрать правило остановки чтобы максимизировать ожидаемое вознаграждение (или, что то же самое, минимизировать ожидаемые убытки)
Случай непрерывного времени
Рассмотрим процессы усиления определено на фильтрованное вероятностное пространство и предположим, что является адаптированный к фильтрации. Оптимальная задача остановки - найти время остановки что максимизирует ожидаемый выигрыш
куда называется функция значения. Здесь может иметь значение .
Более конкретная формулировка выглядит следующим образом. Считаем адаптированным сильным Марковский процесс определено на фильтрованном вероятностном пространстве куда обозначает вероятностная мера где случайный процесс начинается в . Учитывая непрерывные функции , и , оптимальная задача остановки
Это иногда называют формулировкой MLS (что означает Майера, Лагранжа и супремума соответственно).[4]
Методы решения
Обычно существует два подхода к решению задач оптимальной остановки.[4] Когда лежащий в основе процесс (или процесс выигрыша) описывается своим безусловным конечномерные распределения подходящим методом решения является подход мартингейла, названный так потому, что он использует мартингейл теории, наиболее важной концепцией является Конверт Снелла. В случае дискретного времени, если горизонт планирования конечно, проблема также может быть легко решена с помощью динамическое программирование.
Когда основной процесс определяется семейством (условных) переходных функций, приводящих к марковскому семейству переходных вероятностей, мощные аналитические инструменты, предоставляемые теорией Марковские процессы часто можно использовать, и этот подход называется методом Маркова. Решение обычно получают путем решения связанной задачи со свободными границами (Стефан проблемы ).
Результат скачкообразной диффузии
Позволять быть Леви распространение в предоставленный SDE
куда является -размерный Броуновское движение, является -размерный компенсированный Случайная мера Пуассона, , , и заданы функции такие, что единственное решение существуют. Позволять быть открытым множеством (область платежеспособности) и
время банкротства. Оптимальная проблема остановки:
Оказывается, что при некоторых условиях регулярности[5] справедлива следующая теорема проверки:
Если функция удовлетворяет
- где область продолжения ,
- на , и
- на , куда это бесконечно малый генератор из
тогда для всех . Более того, если
- на
потом для всех и оптимальное время остановки.
Эти условия также можно записать в более компактном виде ( интегро-вариационное неравенство ):
- на
Примеры
Подбрасывание монет
(Пример, где сходится)
У вас есть честная монета, и вы постоянно ее подбрасываете. Каждый раз, прежде чем он будет брошен, вы можете прекратить его бросать и получить оплату (например, в долларах) за среднее количество наблюдаемых голов.
Вы хотите увеличить получаемую сумму, выбрав правило остановки. Икся (за я ≥ 1) образует последовательность независимых одинаково распределенных случайных величин с Распределение Бернулли
и если
тогда последовательности , и являются объектами, связанными с этой проблемой.
Продажа дома
(Пример, где не обязательно сходится)
У вас есть дом и вы хотите его продать. Каждый день вам предлагают за свой дом и плати чтобы продолжить его рекламировать. Если вы продадите свой дом в день , ты заработаешь , куда .
Вы хотите максимизировать сумму, которую вы зарабатываете, выбирая правило остановки.
В этом примере последовательность () - это последовательность предложений для вашего дома, а последовательность функций вознаграждения - это то, сколько вы заработаете.
Проблема секретаря
(Пример, где конечная последовательность)
Вы наблюдаете последовательность объектов, которые можно отсортировать от лучших к худшим. Вы хотите выбрать правило остановки, которое максимизирует ваши шансы выбрать лучший объект.
Здесь, если (п - некоторое большое число) - это ранги объектов, а это шанс выбрать лучший объект, если вы перестанете намеренно отклонять объекты на шаге i, тогда и - это последовательности, связанные с этой проблемой. Эта проблема была решена в начале 1960-х несколькими людьми. Элегантное решение проблемы с секретарем и несколько модификаций этой проблемы предоставлено более поздним алгоритм шансов оптимальной остановки (алгоритм Брюсса).
Теория поиска
Экономисты изучили ряд задач оптимальной остановки, подобных «проблеме секретаря», и обычно называют этот тип анализа «теорией поиска». Теория поиска особенно сосредоточена на поиске работником высокооплачиваемой работы или поиске потребителем недорогого товара.
Проблема с парковкой
Частным примером применения теории поиска является задача оптимального выбора парковочного места водителем, идущим в оперу (театр, магазины и т. Д.). Подъезжая к месту назначения, водитель идет по улице, вдоль которой есть парковочные места - обычно только некоторые места на парковке свободны. Цель хорошо видна, поэтому расстояние до цели легко оценить. Задача водителя - выбрать свободное парковочное место как можно ближе к месту назначения, не поворачиваясь, чтобы расстояние от этого места до места назначения было минимальным.[6]
Опционная торговля
В торговле опции на финансовые рынки, обладатель Американский вариант разрешено реализовать право на покупку (или продажу) базового актива по заранее определенной цене в любое время до или на дату истечения срока действия. Следовательно, оценка американских опционов, по сути, является оптимальной задачей для остановки. Рассмотрим классический Блэк-Скоулз настроить и позволить быть безрисковая процентная ставка и и ставка дивидендов и волатильность акции. Цена акций следует геометрическому броуновскому движению
в рамках меры, нейтральной к риску.
Когда опция бессрочная, оптимальная проблема остановки
где функция выигрыша для опциона колл и по оферте. Вариационное неравенство
для всех куда это граница упражнения. Известно, что решение[7]
- (Бессрочный звонок) куда и
- (Бессрочный пут) куда и
С другой стороны, когда срок годности конечен, проблема связана с двумерной задачей со свободной границей без известного решения в замкнутой форме. Однако можно использовать различные численные методы. Видеть Модель Блэка – Шоулза # Американские варианты для различных методов оценки здесь, а также Фугит для дискретного, дерево на основе, расчет оптимального времени для тренировки.
Смотрите также
- Проблема с остановкой
- Марковский процесс принятия решений
- Теорема о необязательной остановке
- Стохастический контроль
Рекомендации
- ^ Чоу, Ю.С.; Роббинс, Х.; Зигмунд, Д. (1971). Большие надежды: теория оптимальной остановки. Бостон: Houghton Mifflin.
- ^ Фергюсон, Томас С. (2007). Оптимальная остановка и приложения. UCLA.
- ^ Хилл, Теодор П. (2009). «Зная, когда остановиться». Американский ученый. 97: 126–133. Дои:10.1511/2009.77.126. ISSN 1545-2786 - via (Французский перевод см. история на обложке в июльском номере Pour la Science (2009)).
- ^ а б Пескир, Горан; Ширяев Альберт (2006). «Оптимальная остановка и задачи со свободной границей». Лекции по математике. ETH Zürich. Дои:10.1007/978-3-7643-7390-0. ISBN 978-3-7643-2419-3. Цитировать журнал требует
| журнал =
(помощь) - ^ Эксендаль, Б.; Сулем, А. С. (2007). «Прикладное стохастическое управление скачкообразными диффузиями». Дои:10.1007/978-3-540-69826-5. ISBN 978-3-540-69825-8. Цитировать журнал требует
| журнал =
(помощь) - ^ MacQueen, J .; Миллер-младший, Р. (1960). «Оптимальные политики настойчивости». Исследование операций. 8 (3): 362–380. Дои:10.1287 / opre.8.3.362. ISSN 0030-364X.
- ^ Каратзас, Иоаннис; Шрив, Стивен Э. (1998). «Методы математических финансов». Стохастическое моделирование и прикладная вероятность. 39. Дои:10.1007 / b98840. ISBN 978-0-387-94839-3. Цитировать журнал требует
| журнал =
(помощь)
- Томас С. Фергюсон, Оптимальная остановка и приложения, получено 21 июня 2007 г.
- Томас С. Фергюсон, "Кто решил проблему секретарши? " Статистическая наука, Vol. 4., 282–296, (1989)
- Ф. Томас Брюсс. «Суммируйте шансы на единицу и остановитесь». Анналы вероятности, Vol. 28, 1384–1391, (2000)
- Ф. Томас Брюсс. «Искусство принимать правильные решения: почему лица, принимающие решения, хотят знать алгоритм шансов». Информационный бюллетень Европейского математического общества, Выпуск 62, 14–20, (2006)
- Rogerson, R .; Shimer, R .; Райт, Р. (2005). «Теоретико-поисковые модели рынка труда: обзор». Журнал экономической литературы. 43 (4): 959–88. JSTOR 4129380.