Обратимая матрица - Invertible matrix

В линейная алгебра, п-к-п квадратная матрица А называется обратимый (также неособый или же невырожденный), если существует п-к-п квадратная матрица B такой, что

куда яп обозначает п-к-п единичная матрица и используемое умножение обычное матричное умножение. Если это так, то матрица B однозначно определяется А, и называется (мультипликативным) обратный из А, обозначаемый А−1.[1][2] Обращение матрицы это процесс нахождения матрицы B который удовлетворяет предыдущему уравнению для данной обратимой матрицы А.

Квадратная матрица, которая нет обратимый называется единственное число или же выродиться. Квадратная матрица сингулярна если и только если это детерминант равно нулю.[3] Сингулярные матрицы редки в том смысле, что если элементы квадратной матрицы выбираются случайным образом из любой конечной области числовой прямой или комплексной плоскости, вероятность того, что матрица является сингулярной, равна 0, то есть она будет "Больше никогда" быть единичным. Неквадратные матрицы (м-к-п матрицы, для которых мп) не имеют обратного. Однако в некоторых случаях такая матрица может иметь левый обратный или же правый обратный. Если А является м-к-п и классифицировать из А равно п (пм), тогда А имеет левую инверсию, п-к-м матрица B такой, что BA = яп. Если А имеет звание м (мп), то он имеет правый обратный п-к-м матрица B такой, что AB = ям.

Хотя наиболее распространенным случаем является матрица над настоящий или же сложный чисел, все эти определения могут быть даны для матриц над любыми звенеть. Однако в случае, когда кольцо коммутативно, условием обратимости квадратной матрицы является то, что ее определитель обратим в кольце, что в общем случае является более строгим требованием, чем ненулевое значение. Для некоммутативного кольца обычный определитель не определен. Условия существования левообратных или правообратных более сложны, так как над кольцами не существует понятия ранга.

Набор п × п обратимые матрицы вместе с операцией умножения матриц (и элементы из кольца р) образуют группа, то общая линейная группа степени п, обозначенный .[1]

Характеристики

Теорема об обратимой матрице

Позволять А быть квадратом п к п матрица над поле K (например, поле р действительных чисел). Следующие утверждения эквивалентны (т.е. они либо все истинны, либо полностью ложны для любой данной матрицы):[4]

А обратима, то есть А имеет обратный, невырожденный или невырожденный.
А является эквивалент строки к п-к-п единичная матрица яп.
А является столбец-эквивалент к п-к-п единичная матрица яп.
А имеет п поворотные позиции.
Det А ≠ 0. В общем случае квадратная матрица над коммутативное кольцо обратима тогда и только тогда, когда его детерминант это единица измерения в этом кольце.
А имеет полное звание; то есть, классифицировать А = п.
Уравнение Топор = 0 имеет только тривиальное решение Икс = 0.
В ядро из А является тривиальным, то есть он содержит только нулевой вектор в качестве элемента, кер (А) = {0}.
Уравнение Топор = б имеет ровно одно решение для каждого б в Kп.
Колонны А находятся линейно независимый.
Столбцы А охватывать Kп.
Col А = Kп.
Колонны А сформировать основа из Kп.
Отображение линейного преобразования Икс к Топор это биекция из Kп к Kп.
Существует п-к-п матрица B такой, что AB = яп = BA.
В транспонировать АТ обратимая матрица (следовательно, строки А находятся линейно независимый, охватывать Kп, и образуют основа из Kп).
Число 0 не является собственное значение из А.
Матрица А можно выразить как конечное произведение элементарные матрицы.
Матрица А имеет левую обратную (т. е. существует B такой, что BA = я) или же правый обратный (т. е. существует C такой, что AC = я), в этом случае существуют и левые, и правые обратные, и B = C = А−1.

Другие свойства

Кроме того, для обратимой матрицы имеют место следующие свойства А:

  • (А−1)−1 = А;
  • (kА)−1 = k−1А−1 для ненулевого скаляра k;
  • (Топор)+ = Икс+А−1 если А имеет ортонормированные столбцы, где + обозначает Обратное преобразование Мура – ​​Пенроуза и Икс вектор;
  • (АТ)−1 = (А−1)Т;
  • Для любого обратимого п-к-п матрицы А и B, (AB)−1 = B−1А−1. В более общем смысле, если А1, ..., Аk обратимы п-к-п матрицы, то (А1А2⋅⋅⋅Аk−1Аk)−1 = А−1
    k
    А−1
    k−1
    А−1
    2
    А−1
    1
    ;
  • Det А−1 = (det А)−1.

Строки обратной матрицы V матрицы U находятся ортонормированный в колонны U (и наоборот, меняя местами строки на столбцы). Чтобы увидеть это, предположим, что УФ = ВУ = Я где ряды V обозначаются как и столбцы U в качестве за . Тогда ясно, что Евклидов внутренний продукт любых двух . Это свойство также может быть полезно при построении обратной квадратной матрицы в некоторых случаях, когда набор ортогональный векторы (но не обязательно ортонормированные векторы) в столбцы U известны . В этом случае можно применить итеративную Процесс Грама – Шмидта к этому начальному набору, чтобы определить строки обратного V.

Матрица, которая является собственной обратной (т. Е. Матрица А такой, что А = А−1 и А2 = я), называется инволютивная матрица.

По отношению к его адъюгату

В сопоставлять матрицы можно использовать, чтобы найти обратное следующее:

Если является обратимая матрица, тогда

По отношению к единичной матрице

Из ассоциативности умножения матриц следует, что если

за конечный квадрат матрицы А и B, то также

[5]

Плотность

Над полем действительных чисел множество сингулярных п-к-п матриц, рассматриваемых как подмножество рп×п, это нулевой набор, то есть имеет Лебег измерять ноль. Это верно, потому что особые матрицы являются корнями детерминант функция. Это непрерывная функция, потому что она является полиномом от элементов матрицы. Таким образом, на языке теория меры, почти все п-к-п матрицы обратимы.

Кроме того, п-к-п обратимые матрицы - это плотный открытый набор в топологическое пространство из всех п-к-п матрицы. Эквивалентно множество сингулярных матриц закрыто и нигде не плотный в пространстве п-к-п матрицы.

Однако на практике можно встретить необратимые матрицы. И в численные расчеты, матрицы, которые являются обратимыми, но близкими к необратимым, по-прежнему могут быть проблематичными; такие матрицы называются плохо воспитанный.

Примеры

Рассмотрим следующее 2-к-2 матрица:

Матрица обратимо. Чтобы проверить это, можно вычислить, что , которая не равна нулю.

В качестве примера необратимой или сингулярной матрицы рассмотрим матрицу

Определитель равен 0, что является необходимым и достаточным условием необратимости матрицы.

Методы обращения матриц

Гауссово исключение

Исключение Гаусса – Жордана является алгоритм который можно использовать для определения обратимости данной матрицы и для нахождения обратной. Альтернативой является LU разложение, который генерирует верхнюю и нижнюю треугольные матрицы, которые легче инвертировать.

Метод Ньютона

Обобщение Метод Ньютона как используется для мультипликативный обратный алгоритм может быть удобно, если удобно найти подходящее стартовое семя:

Виктор Пан и Джон Рейф проделали работу, которая включает способы создания начального семени.[6][7] Байт журнал обобщил один из своих подходов.[8]

Метод Ньютона особенно полезен при работе с семейством связанных матриц, которые ведут себя достаточно похоже на последовательность, созданную для гомотопии, описанной выше: иногда хорошей отправной точкой для уточнения приближения для новой обратной матрицы может быть уже полученная обратная матрица предыдущей, которая почти соответствует текущая матрица, например пара последовательностей обратных матриц, используемая при получении матричные квадратные корни методом итерации Денмана – Биверса; для этого может потребоваться более одного прохода итерации в каждой новой матрице, если они не достаточно близко друг к другу, чтобы хватило только одного. Метод Ньютона также полезен для «доработки» поправок к алгоритму Гаусса – Жордана, который был загрязнен небольшими ошибками из-за несовершенная компьютерная арифметика.

Метод Кэли – Гамильтона

В Теорема Кэли – Гамильтона позволяет обратное выражаться через det (), следы и силы :[9]

куда это измерение , и это след матрицы дается суммой главной диагонали. Сумма принимается и наборы всех удовлетворяющий линейному Диофантово уравнение

Формулу можно переписать в терминах полной Полиномы Белла аргументов в качестве

Собственное разложение

Если матрица А может быть разложен на собственные числа, и если ни одно из его собственных значений не равно нулю, то А обратим, а его обратный

куда это квадрат (N×N) матрица, я-й столбец - это собственный вектор из , и это диагональная матрица диагональные элементы которого являются соответствующими собственными числами, т. е. . Если симметрично, гарантированно будет ортогональная матрица, следовательно . Кроме того, поскольку - диагональная матрица, обратная к ней легко вычисляется:

Разложение Холецкого

Если матрица А является положительно определенный, то обратное к нему можно получить как

куда L это нижний треугольник Разложение Холецкого из А, и L * обозначает сопряженное транспонирование L.

Аналитическое решение

Написание транспонирования матрица сомножителей, известный как сопряженная матрица, также может быть эффективным способом вычисления обратного маленький матриц, но этот рекурсивный метод неэффективен для больших матриц. Чтобы определить обратное, вычисляем матрицу сомножителей:

так что

где |А| это детерминант из А, C это матрица сомножителей, и CТ представляет матрицу транспонировать.

Инверсия матриц 2 × 2

В кофакторное уравнение перечисленное выше дает следующий результат для 2 × 2 матрицы. Инверсия этих матриц может быть произведена следующим образом:[10]

Это возможно, потому что 1/(объявлениедо н.э) является обратным определителю рассматриваемой матрицы, и та же стратегия может быть использована для других размеров матриц.

Метод Кэли – Гамильтона дает

Инверсия матриц 3 × 3

Вычислительно эффективный 3 × 3 обращение матрицы дается формулой

(где скаляр А не следует путать с матрицей АЕсли определитель не равен нулю, матрица обратима, а элементы промежуточной матрицы в правой части выше заданы формулой

Определитель А можно вычислить, применяя правило Сарруса следующее:

Разложение Кэли – Гамильтона дает

Генерал 3 × 3 Обратное можно кратко выразить через перекрестное произведение и тройное произведение. Если матрица (состоящий из трех векторов-столбцов, , , и ) обратима, обратная ему дается формулой

Определитель A, , равно тройному произведению , , и - объем параллелепипед образованный строками или столбцами:

Правильность формулы можно проверить, используя свойства перекрестного и тройного произведения, а также отметив, что для групп всегда совпадают левые и правые инверсии. Интуитивно из-за перекрестных произведений каждая строка ортогонален двум несоответствующим столбцам матрицы (в результате чего недиагональные члены быть нулевым). Деление на

вызывает диагональные элементы быть единством. Например, первая диагональ:

Инверсия матриц 4 × 4

С увеличением размерности выражения для обратного А усложняется. За п = 4, метод Кэли – Гамильтона приводит к выражению, которое все еще остается приемлемым:

Блочная инверсия

Матрицы также могут быть перевернутый поблочно используя следующую формулу аналитического обращения:

 

 

 

 

(1)

куда А, B, C и D находятся подблоки матрицы произвольного размера. (А должен быть квадратным, чтобы его можно было перевернуть. Более того, А и DCA−1B должно быть невырожденным.[11]) Эта стратегия особенно выгодна, если А диагональный и DCA−1BДополнение Шура из А) является маленькой матрицей, так как это единственные матрицы, требующие инверсии.

Эта техника была изобретена несколько раз заново и появилась благодаря Ганс Больц (1923),[нужна цитата ] кто использовал это для инверсии геодезический матрицы и Тадеуш Банахевич (1937), которые обобщили его и доказали его правильность.

В теорема о недействительности говорит, что недействительность А равен нулю субблока в нижнем правом углу обратной матрицы, и что ноль B равняется нулю субблока в верхнем правом углу обратной матрицы.

Процедура обращения, которая привела к уравнению (1) выполнили операции матричного блока, которые оперировали C и D первый. Вместо этого, если А и B оперируются первыми и обеспечивают D и АBD−1C неособые,[12] результат

 

 

 

 

(2)

Приравнивая уравнения (1) и (2) приводит к

 

 

 

 

(3)

где уравнение (3) это Тождество матрицы Вудбери, что эквивалентно биномиальная обратная теорема.

Поскольку поблочное обращение п × п матрица требует обращения двух матриц половинного размера и 6 умножений между двумя матрицами половинного размера, можно показать, что разделяй и властвуй алгоритм который использует поблочное обращение для инвертирования матрицы, выполняется с той же временной сложностью, что и алгоритм умножения матриц, который используется внутри компании.[13] Существуют алгоритмы матричного умножения со сложностью О(п2.3727) операций, а лучшая доказанная нижняя граница Ω (п2 бревно п).[14]

Эта формула значительно упрощается, когда верхняя правая блочная матрица - нулевая матрица. Эта формулировка полезна, когда матрицы и имеют относительно простые обратные формулы (или псевдообратное в том случае, если не все блоки квадратные. В этом частном случае формула обращения блочной матрицы, приведенная выше в полной общности, становится

Автор серии Neumann

Если матрица А имеет свойство, что

тогда А неособое, и его обратное выражение может быть выражено Серия Неймана:[15]

Усечение суммы приводит к "приблизительному" обратному значению, которое может быть полезно в качестве предварительный кондиционер. Обратите внимание, что усеченный ряд можно ускорить экспоненциально, отметив, что ряд Неймана является геометрическая сумма. Таким образом, он удовлетворяет

.

Поэтому только умножения матриц необходимы для вычисления условия суммы.

В более общем смысле, если А находится «около» обратимой матрицы Икс в том смысле, что

тогда А невырожден и обратный ему

Если это также так, АИкс имеет классифицировать 1, то это упрощается до

п-адическое приближение

Если А матрица с целыми или рациональными коэффициентами, и мы ищем решение в произвольная точность рациональные, то p-адический метод аппроксимации сходится к точному решению в , предполагая стандартный используется матричное умножение.[16] Метод основан на решении п линейных систем по методу Диксона п-адическое приближение (каждое в ) и доступен как таковой в программном обеспечении, специализирующемся на матричных операциях произвольной точности, например в IML.[17]

Метод взаимных базисных векторов

Учитывая квадратная матрица , , с строки интерпретируются как векторов (Суммирование Эйнштейна предполагается), где являются стандартными ортонормированный базис из Евклидово пространство (), затем используя Алгебра Клиффорда (или же Геометрическая алгебра ) мы вычисляем обратную (иногда называемую двойной ) векторы-столбцы как столбцы обратной матрицы . Обратите внимание, что место "" указывает, что ""удалено с этого места в приведенном выше выражении для . Тогда у нас есть , куда это Дельта Кронекера. У нас также есть , как требуется. Если векторы не являются линейно независимыми, то и матрица не обратима (не имеет обратного).

Производная обратной матрицы

Предположим, что обратимая матрица А зависит от параметра т. Тогда производная от обратной функции А относительно т дан кем-то[18]

Чтобы вывести указанное выше выражение для производной обратной функции А, можно дифференцировать определение матрицы, обратной а затем решить для обратного А:

Вычитание с обеих сторон вышеуказанного и умножая справа на дает правильное выражение для производной обратного:

Аналогично, если это небольшое число, тогда

В более общем смысле, если

тогда,

Учитывая положительное целое число ,

Следовательно,

Обобщенная обратная

Некоторые свойства обратных матриц разделяют обобщенные обратные (например, Обратное преобразование Мура – ​​Пенроуза ), который можно определить для любого м-к-п матрица.

Приложения

Для большинства практических приложений это нет необходимо инвертировать матрицу для решения система линейных уравнений; однако для уникального решения это является необходимо, чтобы рассматриваемая матрица была обратимой.

Техники разложения, такие как LU разложение намного быстрее, чем обращение, также были разработаны различные быстрые алгоритмы для специальных классов линейных систем.

Регрессия / наименьшие квадраты

Хотя явное обратное не требуется для оценки вектора неизвестных, это самый простой способ оценить их точность, находящуюся на диагонали обратной матрицы (матрица апостериорной ковариации вектора неизвестных). Однако во многих случаях известны более быстрые алгоритмы вычисления только диагональных элементов обратной матрицы.[19]

Обращение матриц в симуляциях в реальном времени

Инверсия матриц играет значительную роль в компьютерная графика, особенно в 3D графика рендеринг и 3D-моделирование. Примеры включают экран в мир лучей, преобразования объектов из мира в подпространство в мир и физического моделирования.

Матрица инверсия в беспроводной связи MIMO

Инверсия матриц также играет важную роль в MIMO (Multiple-Input, Multiple-Output) технология беспроводной связи. Система MIMO состоит из N передавать и M приемные антенны. Уникальные сигналы, занимающие одну и ту же полосу частот, отправляются через N передающие антенны и принимаются через M приемные антенны. Сигнал, поступающий на каждую приемную антенну, будет линейной комбинацией N передаваемые сигналы, формирующие N × M матрица передачи ЧАС. Это критично для матрицы ЧАС быть обратимым, чтобы получатель мог понять передаваемую информацию.

Смотрите также

Рекомендации

  1. ^ а б «Исчерпывающий список символов алгебры». Математическое хранилище. 2020-03-25. Получено 2020-09-08.
  2. ^ «Обратимые матрицы». www.sosmath.com. Получено 2020-09-08.
  3. ^ Вайсштейн, Эрик В. "Матрица инверсная". mathworld.wolfram.com. Получено 2020-09-08.
  4. ^ Вайсштейн, Эрик В. "Теорема об обратимой матрице". mathworld.wolfram.com. Получено 2020-09-08.
  5. ^ Хорн, Роджер А .; Джонсон, Чарльз Р. (1985). Матричный анализ. Издательство Кембриджского университета. п. 14. ISBN  978-0-521-38632-6..
  6. ^ Пан, Виктор; Рейф, Джон (1985), Эффективное параллельное решение линейных систем, Материалы 17-го ежегодного симпозиума ACM по теории вычислений, Провиденс: ACM
  7. ^ Пан, Виктор; Рейф, Джон (1985), Отчет Центра исследований вычислительной техники Гарвардского университета TR-02-85, Кембридж, Массачусетс: Вычислительная лаборатория Айкена
  8. ^ «Обращение больших матриц». Журнал Byte. 11 (4): 181–190. Апрель 1986 г.
  9. ^ Доказательство можно найти в Приложении B к Кондратюк, Л. А .; Криворученко, М. И. (1992). «Сверхпроводящая кварковая материя в группе цветов SU (2)». Zeitschrift für Physik A. 344: 99–115. Дои:10.1007 / BF01291027.
  10. ^ Стрэнг, Гилберт (2003). Введение в линейную алгебру (3-е изд.). СИАМ. п. 71. ISBN  978-0-9614088-9-3., Глава 2, стр.71
  11. ^ Бернштейн, Деннис (2005). Матричная математика. Издательство Принстонского университета. п. 44. ISBN  978-0-691-11802-4.
  12. ^ Бернштейн, Деннис (2005). Матричная математика. Издательство Принстонского университета. п. 45. ISBN  978-0-691-11802-4.
  13. ^ Т. Х. Кормен, К. Э. Лейзерсон, Р. Л. Ривест, К. Штейн, Введение в алгоритмы, 3-е изд., MIT Press, Кембридж, Массачусетс, 2009, §28.2.
  14. ^ Ран Раз. О сложности матричного произведения. В материалах тридцать четвертого ежегодного симпозиума ACM по теории вычислений. ACM Press, 2002. Дои:10.1145/509907.509932.
  15. ^ Стюарт, Гилберт (1998). Матричные алгоритмы: основные разложения. СИАМ. п. 55. ISBN  978-0-89871-414-2.
  16. ^ Haramoto, H .; Мацумото, М. (2009). «P-адический алгоритм вычисления обратных целочисленных матриц». Журнал вычислительной и прикладной математики. 225: 320–322. Дои:10.1016 / j.cam.2008.07.044.
  17. ^ «IML - Библиотека целочисленных матриц». cs.uwaterloo.ca. Получено 14 апреля 2018.
  18. ^ Магнус, Ян Р .; Neudecker, Хайнц (1999). Матричное дифференциальное исчисление: с приложениями в статистике и эконометрике (Пересмотренная ред.). Нью-Йорк: Джон Вили и сыновья. С. 151–152. ISBN  0-471-98633-X.
  19. ^ Линь, Линь; Лу, Цзяньфэн; Инь, Лексинг; Автомобиль, Роберто; E, Weinan (2009). «Быстрый алгоритм выделения диагонали обратной матрицы с применением к анализу электронной структуры металлических систем». Коммуникации в математических науках. 7 (3): 755–777. Дои:10.4310 / CMS.2009.v7.n3.a12.

дальнейшее чтение

внешняя ссылка