Условия Вульфа - Wolfe conditions

В непринужденной минимизация проблема, Условия Вульфа представляют собой набор неравенств для выполнения неточный линейный поиск, особенно в квазиньютоновские методы, впервые опубликовано Филип Вулф в 1969 г.[1][2]

В этих методах идея состоит в том, чтобы найти

для некоторых гладкий . Каждый шаг часто включает приблизительное решение подзадачи.

куда это лучшее предположение, направление поиска, и - длина шага.

Неточный поиск строк обеспечивает эффективный способ вычисления приемлемой длины шага. что снижает целевая функция 'достаточно', а не минимизировать целевую функцию по точно. Алгоритм линейного поиска может использовать условия Вульфа как требование для любых предположений. , прежде чем найти новое направление поиска .

Правило Армихо и кривизна

Длина шага считается, что удовлетворяет Условия Вульфа, ограниченный направлением , если выполняются два неравенства:

с . (Изучая условие (ii), вспомните, что для обеспечения того, чтобы направление спуска, имеем , как и в случае градиентный спуск, куда , или же Ньютон – Рафсон, куда с положительно определенный.)

обычно выбирается довольно маленьким, в то время как намного больше; Нокедал и Райт приводят пример значений и для методов Ньютона или квазиньютона и для нелинейного метод сопряженных градиентов.[3] Неравенство i) известно как Правило Армихо[4] и ii) как условие кривизны; i) гарантирует, что длина шага уменьшается «достаточно», и ii) гарантирует, что наклон был уменьшен в достаточной степени. Условия i) и ii) можно интерпретировать как обеспечивающие соответственно верхнюю и нижнюю границы допустимых значений длины шага.

Сильное условие Вульфа на кривизну

Обозначим одномерную функцию ограничено направлением в качестве . Условия Вульфа могут привести к значению длины шага, не близкому к минимизатору . Если мы изменим условие кривизны на следующее,

тогда i) и iii) вместе образуют так называемые сильные условия Вульфа, и сила лежать рядом с критическая точка из .

Обоснование

Основная причина наложения условий Вульфа в алгоритме оптимизации, где заключается в обеспечении сходимости градиента к нулю. В частности, если косинус угла между и градиент,

отделена от нуля и выполняются условия i) и ii), то .

Дополнительная мотивация в случае квазиньютоновский метод, это если , где матрица обновляется BFGS или же DFP формула, то если положительно определен ii) влечет также положительно определен.

Комментарии

Хотя условия Вульфа сложнее, чем условие Армийо, на данный момент алгоритм, основанный на условии Армийо (то есть, обратный градиентный спуск), имеет лучшую теоретическую гарантию, см. Разделы «Верхний предел скорости обучения» и «Теоретическая гарантия» в Поиск строки с возвратом.

Смотрите также

Рекомендации

  1. ^ Вулф, П. (1969). «Условия сходимости методов восхождения». SIAM Обзор. 11 (2): 226–000. Дои:10.1137/1011036. JSTOR  2028111.
  2. ^ Вулф, П. (1971). «Условия сходимости методов восхождения. II: Некоторые исправления». SIAM Обзор. 13 (2): 185–000. Дои:10.1137/1013035.
  3. ^ Нокедаль, Хорхе; Райт, Стивен (1999). Численная оптимизация. п. 38.
  4. ^ Армийо, Ларри (1966). «Минимизация функций, имеющих липшицевы первые частные производные». Pacific J. Math. 16 (1): 1–3. Дои:10.2140 / pjm.1966.16.1.

дальнейшее чтение

  • «Методы линейного поиска». Численная оптимизация. Серия Springer по исследованию операций и финансовому инжинирингу. 2006. С. 30–32. Дои:10.1007/978-0-387-40065-5_3. ISBN  978-0-387-30303-1.
  • «Квазиньютоновские методы». Численная оптимизация. Серия Springer по исследованию операций и финансовому инжинирингу. 2006. С. 135–163. Дои:10.1007/978-0-387-40065-5_6. ISBN  978-0-387-30303-1.