Вывод метода сопряженных градиентов - Derivation of the conjugate gradient method

В числовая линейная алгебра, то метод сопряженных градиентов является итерационный метод для численного решения линейная система

куда является симметричный положительно определенный. Метод сопряженных градиентов может быть получен с нескольких различных точек зрения, включая специализацию метод сопряженных направлений за оптимизация, и вариация Арнольди /Ланцош итерация для собственное значение проблемы.

Цель этой статьи - документировать важные этапы этих выводов.

Вывод из метода сопряженных направлений

Метод сопряженных градиентов можно рассматривать как частный случай метода сопряженных направлений, применяемого для минимизации квадратичной функции

Метод сопряженных направлений

В методе сопряженных направлений для минимизации

каждый начинается с первоначального предположения и соответствующая невязка , и вычисляет итерацию и невязку по формулам

куда представляют собой серию взаимно сопряженных направлений, т. е.

для любого .

Метод сопряженных направлений неточен в том смысле, что не даются формулы для выбора направлений. . Конкретный выбор приводит к различным методам, включая метод сопряженных градиентов и Гауссово исключение.

Вывод из итерации Арнольди / Ланцоша

Метод сопряженных градиентов можно также рассматривать как вариант итерации Арнольди / Ланцоша, применяемой для решения линейных систем.

Общий метод Арнольди

В итерации Арнольди каждый начинается с вектора и постепенно строит ортонормированный основа из Крыловское подпространство

определяя куда

Другими словами, для , найден Ортогонализация по Граму-Шмидту против с последующей нормализацией.

В матричной форме итерация описывается уравнением

куда

с

Применяя итерацию Арнольди к решению линейных систем, начинают с , невязка, соответствующая первоначальному предположению . После каждого шага итерации вычисляется и новая итерация .

Прямой метод Ланцоша

В дальнейшем мы предполагаем, что симметрично положительно определено. С симметрией , то верхняя матрица Гессенберга становится симметричным и, следовательно, трехдиагональным. Тогда это можно более четко обозначить как

Это дает возможность кратковременного трехкратного повторения в итерации, а итерация Арнольди сводится к итерации Ланцоша.

С является симметричным положительно определенным, поэтому . Следовательно, возможно LU факторизованный без частичный поворот в

с удобными повторами для и :

Переписать в качестве

с

Теперь важно заметить, что

Фактически, есть короткие повторения для и также:

С этой формулировкой мы приходим к простому возвращению для :

Приведенные выше соотношения напрямую приводят к прямому методу Ланцоша, который оказывается несколько более сложным.

Метод сопряженных градиентов от наложения ортогональности и сопряженности

Если мы позволим для масштабирования и компенсации масштабирования в постоянном множителе мы потенциально можем иметь более простые повторы в форме:

В качестве предпосылки для упрощения выводим теперь ортогональность и сопряженность , т.е. для ,

Остатки взаимно ортогональны, потому что по сути является кратным поскольку для , , за ,

Чтобы увидеть сопряжение , достаточно показать, что диагональ:

является симметричным и нижним треугольником одновременно и, следовательно, должен быть диагональным.

Теперь мы можем получить постоянные множители и относительно масштабированного только наложив ортогональность и сопряженность .

Из-за ортогональности , необходимо, чтобы . Как результат,

Точно так же из-за сопряженности , необходимо, чтобы . Как результат,

На этом вывод завершен.

Рекомендации

  1. Гестенес, М.; Штифель, Э. (Декабрь 1952 г.). «Методы сопряженных градиентов для решения линейных систем» (PDF). Журнал исследований Национального бюро стандартов. 49 (6).
  2. Саад, Ю. (2003). "Глава 6: Методы подпространства Крылова, часть I". Итерационные методы для разреженных линейных систем (2-е изд.). СИАМ. ISBN  978-0-89871-534-7.