Оптимальная остановка - Optimal stopping

В математика, теория оптимальная остановка[1][2] или же ранняя остановка[3] занимается проблемой выбора времени для совершения определенного действия, чтобы максимизировать ожидаемое вознаграждение или минимизация ожидаемых затрат. Проблемы с оптимальной остановкой можно найти в статистика, экономика, и математические финансы (связано с ценообразованием Американские варианты ). Ключевым примером проблемы оптимальной остановки является проблема секретаря. Задачи оптимальной остановки часто можно записать в виде Уравнение беллмана, и поэтому часто решаются с помощью динамическое программирование.

Определение

Случай с дискретным временем

Проблемы с правилами остановки связаны с двумя объектами:

  1. Последовательность случайных величин , совместное распределение которого считается известным
  2. Последовательность функций вознаграждения которые зависят от наблюдаемых значений случайных величин в 1:

Учитывая эти объекты, проблема заключается в следующем:

  • Вы наблюдаете последовательность случайных величин, и на каждом шаге , вы можете либо прекратить наблюдение, либо продолжить
  • Если вы перестанете наблюдать на шаге , ты получишь награду
  • Вы хотите выбрать правило остановки чтобы максимизировать ожидаемое вознаграждение (или, что то же самое, минимизировать ожидаемые убытки)

Случай непрерывного времени

Рассмотрим процессы усиления определено на фильтрованное вероятностное пространство и предположим, что является адаптированный к фильтрации. Оптимальная задача остановки - найти время остановки что максимизирует ожидаемый выигрыш

куда называется функция значения. Здесь может иметь значение .

Более конкретная формулировка выглядит следующим образом. Считаем адаптированным сильным Марковский процесс определено на фильтрованном вероятностном пространстве куда обозначает вероятностная мера где случайный процесс начинается в . Учитывая непрерывные функции , и , оптимальная задача остановки

Это иногда называют формулировкой MLS (что означает Майера, Лагранжа и супремума соответственно).[4]

Методы решения

Обычно существует два подхода к решению задач оптимальной остановки.[4] Когда лежащий в основе процесс (или процесс выигрыша) описывается своим безусловным конечномерные распределения подходящим методом решения является подход мартингейла, названный так потому, что он использует мартингейл теории, наиболее важной концепцией является Конверт Снелла. В случае дискретного времени, если горизонт планирования конечно, проблема также может быть легко решена с помощью динамическое программирование.

Когда основной процесс определяется семейством (условных) переходных функций, приводящих к марковскому семейству переходных вероятностей, мощные аналитические инструменты, предоставляемые теорией Марковские процессы часто можно использовать, и этот подход называется методом Маркова. Решение обычно получают путем решения связанной задачи со свободными границами (Стефан проблемы ).

Результат скачкообразной диффузии

Позволять быть Леви распространение в предоставленный SDE

куда является -размерный Броуновское движение, является -размерный компенсированный Случайная мера Пуассона, , , и заданы функции такие, что единственное решение существуют. Позволять быть открытым множеством (область платежеспособности) и

время банкротства. Оптимальная проблема остановки:

Оказывается, что при некоторых условиях регулярности[5] справедлива следующая теорема проверки:

Если функция удовлетворяет

  • где область продолжения ,
  • на , и
  • на , куда это бесконечно малый генератор из

тогда для всех . Более того, если

  • на

потом для всех и оптимальное время остановки.

Эти условия также можно записать в более компактном виде ( интегро-вариационное неравенство ):

  • на

Примеры

Подбрасывание монет

(Пример, где сходится)

У вас есть честная монета, и вы постоянно ее подбрасываете. Каждый раз, прежде чем он будет брошен, вы можете прекратить его бросать и получить оплату (например, в долларах) за среднее количество наблюдаемых голов.

Вы хотите увеличить получаемую сумму, выбрав правило остановки. Икся (за я ≥ 1) образует последовательность независимых одинаково распределенных случайных величин с Распределение Бернулли

и если

тогда последовательности , и являются объектами, связанными с этой проблемой.

Продажа дома

(Пример, где не обязательно сходится)

У вас есть дом и вы хотите его продать. Каждый день вам предлагают за свой дом и плати чтобы продолжить его рекламировать. Если вы продадите свой дом в день , ты заработаешь , куда .

Вы хотите максимизировать сумму, которую вы зарабатываете, выбирая правило остановки.

В этом примере последовательность () - это последовательность предложений для вашего дома, а последовательность функций вознаграждения - это то, сколько вы заработаете.

Проблема секретаря

(Пример, где конечная последовательность)

Вы наблюдаете последовательность объектов, которые можно отсортировать от лучших к худшим. Вы хотите выбрать правило остановки, которое максимизирует ваши шансы выбрать лучший объект.

Здесь, если (п - некоторое большое число) - это ранги объектов, а это шанс выбрать лучший объект, если вы перестанете намеренно отклонять объекты на шаге i, тогда и - это последовательности, связанные с этой проблемой. Эта проблема была решена в начале 1960-х несколькими людьми. Элегантное решение проблемы с секретарем и несколько модификаций этой проблемы предоставлено более поздним алгоритм шансов оптимальной остановки (алгоритм Брюсса).

Теория поиска

Экономисты изучили ряд задач оптимальной остановки, подобных «проблеме секретаря», и обычно называют этот тип анализа «теорией поиска». Теория поиска особенно сосредоточена на поиске работником высокооплачиваемой работы или поиске потребителем недорогого товара.

Проблема с парковкой

Частным примером применения теории поиска является задача оптимального выбора парковочного места водителем, идущим в оперу (театр, магазины и т. Д.). Подъезжая к месту назначения, водитель идет по улице, вдоль которой есть парковочные места - обычно только некоторые места на парковке свободны. Цель хорошо видна, поэтому расстояние до цели легко оценить. Задача водителя - выбрать свободное парковочное место как можно ближе к месту назначения, не поворачиваясь, чтобы расстояние от этого места до места назначения было минимальным.[6]

Опционная торговля

В торговле опции на финансовые рынки, обладатель Американский вариант разрешено реализовать право на покупку (или продажу) базового актива по заранее определенной цене в любое время до или на дату истечения срока действия. Следовательно, оценка американских опционов, по сути, является оптимальной задачей для остановки. Рассмотрим классический Блэк-Скоулз настроить и позволить быть безрисковая процентная ставка и и ставка дивидендов и волатильность акции. Цена акций следует геометрическому броуновскому движению

в рамках меры, нейтральной к риску.

Когда опция бессрочная, оптимальная проблема остановки

где функция выигрыша для опциона колл и по оферте. Вариационное неравенство

для всех куда это граница упражнения. Известно, что решение[7]

  • (Бессрочный звонок) куда и
  • (Бессрочный пут) куда и

С другой стороны, когда срок годности конечен, проблема связана с двумерной задачей со свободной границей без известного решения в замкнутой форме. Однако можно использовать различные численные методы. Видеть Модель Блэка – Шоулза # Американские варианты для различных методов оценки здесь, а также Фугит для дискретного, дерево на основе, расчет оптимального времени для тренировки.

Смотрите также

Рекомендации

  1. ^ Чоу, Ю.С.; Роббинс, Х.; Зигмунд, Д. (1971). Большие надежды: теория оптимальной остановки. Бостон: Houghton Mifflin.
  2. ^ Фергюсон, Томас С. (2007). Оптимальная остановка и приложения. UCLA.
  3. ^ Хилл, Теодор П. (2009). «Зная, когда остановиться». Американский ученый. 97: 126–133. Дои:10.1511/2009.77.126. ISSN  1545-2786 - via (Французский перевод см. история на обложке в июльском номере Pour la Science (2009)).
  4. ^ а б Пескир, Горан; Ширяев Альберт (2006). «Оптимальная остановка и задачи со свободной границей». Лекции по математике. ETH Zürich. Дои:10.1007/978-3-7643-7390-0. ISBN  978-3-7643-2419-3. Цитировать журнал требует | журнал = (помощь)
  5. ^ Эксендаль, Б.; Сулем, А. С. (2007). «Прикладное стохастическое управление скачкообразными диффузиями». Дои:10.1007/978-3-540-69826-5. ISBN  978-3-540-69825-8. Цитировать журнал требует | журнал = (помощь)
  6. ^ MacQueen, J .; Миллер-младший, Р. (1960). «Оптимальные политики настойчивости». Исследование операций. 8 (3): 362–380. Дои:10.1287 / opre.8.3.362. ISSN  0030-364X.
  7. ^ Каратзас, Иоаннис; Шрив, Стивен Э. (1998). «Методы математических финансов». Стохастическое моделирование и прикладная вероятность. 39. Дои:10.1007 / b98840. ISBN  978-0-387-94839-3. Цитировать журнал требует | журнал = (помощь)