Мультилинейное умножение - Multilinear multiplication

В полилинейная алгебра, применяя карту, которая является тензорное произведение линейных отображений к тензор называется мультилинейное умножение.

Абстрактное определение

Позволять ${ displaystyle F}$ поле нулевой характеристики, например ${ Displaystyle mathbb {R}}$ или ${ Displaystyle mathbb {C}}$ .Позволять ${ displaystyle V_ {k}}$ - конечномерное векторное пространство над ${ displaystyle F}$ , и разреши ${ displaystyle { mathcal {A}} in V_ {1} otimes V_ {2} otimes cdots otimes V_ {d}}$ быть на порядок простой тензор, т.е. существуют векторы ${ displaystyle mathbf {v} _ {k} in V_ {k}}$ такой, что ${ displaystyle { mathcal {A}} = mathbf {v} _ {1} otimes mathbf {v} _ {2} otimes cdots otimes mathbf {v} _ {d}}$ . Если нам дан набор линейных карт ${ displaystyle A_ {k}: V_ {k} to W_ {k}}$ , то мультилинейное умножение из ${ displaystyle { mathcal {A}}}$ с ${ displaystyle (A_ {1}, A_ {2}, ldots, A_ {d})}$ определено^[1] как действие на ${ displaystyle { mathcal {A}}}$ из тензорное произведение этих линейных отображений,^[2] а именно

{ displaystyle { begin {align} A_ {1} otimes A_ {2} otimes cdots otimes A_ {d}: V_ {1} otimes V_ {2} otimes cdots otimes V_ {d} & to W_ {1} otimes W_ {2} otimes cdots otimes W_ {d}, mathbf {v} _ {1} otimes mathbf {v} _ {2} otimes cdots otimes mathbf {v} _ {d} & mapsto A_ {1} ( mathbf {v} _ {1}) otimes A_ {2} ( mathbf {v} _ {2}) otimes cdots otimes A_ {d} ( mathbf {v} _ {d}) end {выравнивается}}}

Поскольку тензорное произведение линейных карт сама по себе является линейной картой,^[2] и поскольку каждый тензор допускает разложение тензорного ранга,^[1] вышеприведенное выражение линейно распространяется на все тензоры. То есть для общего тензора ${ displaystyle { mathcal {A}} in V_ {1} otimes V_ {2} otimes cdots otimes V_ {d}}$ , мультилинейное умножение

{ displaystyle { begin {align} & { mathcal {B}}: = (A_ {1} otimes A_ {2} otimes cdots otimes A_ {d}) ({ mathcal {A}}) [4pt] = {} & (A_ {1} otimes A_ {2} otimes cdots otimes A_ {d}) left ( sum _ {i = 1} ^ {r} mathbf {a } _ {i} ^ {1} otimes mathbf {a} _ {i} ^ {2} otimes cdots otimes mathbf {a} _ {i} ^ {d} right) [5pt ] = {} & sum _ {i = 1} ^ {r} A_ {1} ( mathbf {a} _ {i} ^ {1}) otimes A_ {2} ( mathbf {a} _ { i} ^ {2}) otimes cdots otimes A_ {d} ( mathbf {a} _ {i} ^ {d}) end {выравнивается}}}

куда ${ textstyle { mathcal {A}} = sum _ {i = 1} ^ {r} mathbf {a} _ {i} ^ {1} otimes mathbf {a} _ {i} ^ {2 } otimes cdots otimes mathbf {a} _ {i} ^ {d}}$ с ${ displaystyle mathbf {a} _ {i} ^ {k} in V_ {k}}$ один из ${ displaystyle { mathcal {A}}}$ разложения тензорного ранга. Справедливость приведенного выше выражения не ограничивается разложением тензорного ранга; фактически, это справедливо для любого выражения ${ displaystyle { mathcal {A}}}$ как линейная комбинация чистых тензоров, что следует из универсальное свойство тензорного произведения.

В литературе обычно используются следующие сокращенные обозначения для полилинейных умножений:

{ displaystyle (A_ {1}, A_ {2}, ldots, A_ {d}) cdot { mathcal {A}}: = (A_ {1} otimes A_ {2} otimes cdots otimes A_ {d}) ({ mathcal {A}})}

и

{ displaystyle A_ {k} cdot _ {k} { mathcal {A}}: = ( operatorname {Id} _ {V_ {1}}, ldots, operatorname {Id} _ {V_ {k- 1}}, A_ {k}, operatorname {Id} _ {V_ {k + 1}}, ldots, operatorname {Id} _ {V_ {d}}) cdot { mathcal {A}}, }

куда

{ displaystyle operatorname {Id} _ {V_ {k}}: V_ {k} to V_ {k}}

это оператор идентификации.

Определение в координатах

В вычислительной полилинейной алгебре принято работать в координатах. Предположим, что внутренний продукт закреплен на ${ displaystyle V_ {k}}$ и разреши ${ displaystyle V_ {k} ^ {*}}$ обозначить двойное векторное пространство из ${ displaystyle V_ {k}}$ . Позволять ${ displaystyle {e_ {1} ^ {k}, ldots, e_ {n_ {k}} ^ {k} }}$ быть основой для ${ displaystyle V_ {k}}$ , позволять ${ displaystyle {(е_ {1} ^ {k}) ^ {*}, ldots, (e_ {n_ {k}} ^ {k}) ^ {*} }}$ - дуальный базис, и пусть ${ Displaystyle {е_ {1} ^ {к}, ldots, е_ {м_ {к}} ^ {к} }}$ быть основой для ${ displaystyle W_ {k}}$ . Линейная карта ${ textstyle M_ {k} = sum _ {i = 1} ^ {m_ {k}} sum _ {j = 1} ^ {n_ {k}} m_ {i, j} ^ {(k)} f_ {i} ^ {k} otimes (e_ {j} ^ {k}) ^ {*}}$ тогда представляется матрицей ${ displaystyle { widehat {M}} _ {k} = [m_ {i, j} ^ {(k)}] in F ^ {m_ {k} times n_ {k}}}$ . Аналогично, относительно базиса стандартного тензорного произведения ${ displaystyle {e_ {j_ {1}} ^ {1} otimes e_ {j_ {2}} ^ {2} otimes cdots otimes e_ {j_ {d}} ^ {d} } _ { j_ {1}, j_ {2}, ldots, j_ {d}}}$ , абстрактный тензор

{ displaystyle { mathcal {A}} = sum _ {j_ {1} = 1} ^ {n_ {1}} sum _ {j_ {2} = 1} ^ {n_ {2}} cdots сумма _ {j_ {d} = 1} ^ {n_ {d}} a_ {j_ {1}, j_ {2}, ldots, j_ {d}} e_ {j_ {1}} ^ {1} otimes e_ {j_ {2}} ^ {2} otimes cdots otimes e_ {j_ {d}} ^ {d}}

представлен многомерным массивом

{ displaystyle { widehat { mathcal {A}}} = [a_ {j_ {1}, j_ {2}, ldots, j_ {d}}] in F ^ {n_ {1} times n_ { 2} times cdots times n_ {d}}}

. Заметьте, что

{ displaystyle { widehat { mathcal {A}}} = sum _ {j_ {1} = 1} ^ {n_ {1}} sum _ {j_ {2} = 1} ^ {n_ {2} } cdots sum _ {j_ {d} = 1} ^ {n_ {d}} a_ {j_ {1}, j_ {2}, ldots, j_ {d}} mathbf {e} _ {j_ { 1}} ^ {1} otimes mathbf {e} _ {j_ {2}} ^ {2} otimes cdots otimes mathbf {e} _ {j_ {d}} ^ {d},}

куда ${ displaystyle mathbf {e} _ {j} ^ {k} in F ^ {n_ {k}}}$ это jстандартный базисный вектор ${ displaystyle F ^ {n_ {k}}}$ а тензорное произведение векторов - аффинное Карта Сегре ${ displaystyle otimes: ( mathbf {v} ^ {(1)}, mathbf {v} ^ {(2)}, ldots, mathbf {v} ^ {(d)}) mapsto [v_ {i_ {1}} ^ {(1)} v_ {i_ {2}} ^ {(2)} cdots v_ {i_ {d}} ^ {(d)}] _ {i_ {1}, i_ { 2}, ldots, i_ {d}}}$ . Из вышеприведенного выбора базисов следует, что полилинейное умножение ${ Displaystyle { mathcal {B}} = (M_ {1}, M_ {2}, ldots, M_ {d}) cdot { mathcal {A}}}$ становится

{ displaystyle { begin {align} { widehat { mathcal {B}}} & = ({ widehat {M}} _ {1}, { widehat {M}} _ {2}, ldots, { widehat {M}} _ {d}) cdot sum _ {j_ {1} = 1} ^ {n_ {1}} sum _ {j_ {2} = 1} ^ {n_ {2}} cdots sum _ {j_ {d} = 1} ^ {n_ {d}} a_ {j_ {1}, j_ {2}, ldots, j_ {d}} mathbf {e} _ {j_ {1 }} ^ {1} otimes mathbf {e} _ {j_ {2}} ^ {2} otimes cdots otimes mathbf {e} _ {j_ {d}} ^ {d} & = sum _ {j_ {1} = 1} ^ {n_ {1}} sum _ {j_ {2} = 1} ^ {n_ {2}} cdots sum _ {j_ {d} = 1} ^ {n_ {d}} a_ {j_ {1}, j_ {2}, ldots, j_ {d}} ({ widehat {M}} _ {1}, { widehat {M}} _ {2} , ldots, { widehat {M}} _ {d}) cdot ( mathbf {e} _ {j_ {1}} ^ {1} otimes mathbf {e} _ {j_ {2}} ^ {2} otimes cdots otimes mathbf {e} _ {j_ {d}} ^ {d}) & = sum _ {j_ {1} = 1} ^ {n_ {1}} sum _ {j_ {2} = 1} ^ {n_ {2}} cdots sum _ {j_ {d} = 1} ^ {n_ {d}} a_ {j_ {1}, j_ {2}, ldots , j_ {d}} ({ widehat {M}} _ {1} mathbf {e} _ {j_ {1}} ^ {1}) otimes ({ widehat {M}} _ {2} mathbf {e} _ {j_ {2}} ^ {2}) otimes cdots otimes ({ widehat {M}} _ {d} mathbf {e} _ {j_ {d}} ^ {d} ). end {выравнивается}}}

Результирующий тензор ${ displaystyle { widehat { mathcal {B}}}}$ живет в ${ displaystyle F ^ {m_ {1} times m_ {2} times cdots times m_ {d}}}$ .

Поэлементное определение

Из приведенного выше выражения получается поэлементное определение полилинейного умножения. Действительно, поскольку ${ displaystyle { widehat { mathcal {B}}}}$ - многомерный массив, его можно выразить как

{ displaystyle { widehat { mathcal {B}}} = sum _ {j_ {1} = 1} ^ {n_ {1}} sum _ {j_ {2} = 1} ^ {n_ {2} } cdots sum _ {j_ {d} = 1} ^ {n_ {d}} b_ {j_ {1}, j_ {2}, ldots, j_ {d}} mathbf {e} _ {j_ { 1}} ^ {1} otimes mathbf {e} _ {j_ {2}} ^ {2} otimes cdots otimes mathbf {e} _ {j_ {d}} ^ {d},}

куда

{ displaystyle b_ {j_ {1}, j_ {2}, ldots, j_ {d}} in F}

коэффициенты. Тогда из приведенных выше формул следует, что

{ displaystyle { begin {align} & left (( mathbf {e} _ {i_ {1}} ^ {1}) ^ {T}, ( mathbf {e} _ {i_ {2}} ^ {2}) ^ {T}, ldots, ( mathbf {e} _ {i_ {d}} ^ {d}) ^ {T} right) cdot { widehat { mathcal {B}}} = {} & sum _ {j_ {1} = 1} ^ {n_ {1}} sum _ {j_ {2} = 1} ^ {n_ {2}} cdots sum _ {j_ { d} = 1} ^ {n_ {d}} b_ {j_ {1}, j_ {2}, ldots, j_ {d}} left (( mathbf {e} _ {i_ {1}} ^ { 1}) ^ {T} mathbf {e} _ {j_ {1}} ^ {1} right) otimes left (( mathbf {e} _ {i_ {2}} ^ {2}) ^ {T} mathbf {e} _ {j_ {2}} ^ {2} right) otimes cdots otimes left (( mathbf {e} _ {i_ {d}} ^ {d}) ^ {T} mathbf {e} _ {j_ {d}} ^ {d} right) = {} & sum _ {j_ {1} = 1} ^ {n_ {1}} sum _ { j_ {2} = 1} ^ {n_ {2}} cdots sum _ {j_ {d} = 1} ^ {n_ {d}} b_ {j_ {1}, j_ {2}, ldots, j_ {d}} delta _ {i_ {1}, j_ {1}} cdot delta _ {i_ {2}, j_ {2}} cdots delta _ {i_ {d}, j_ {d}} = {} & b_ {i_ {1}, i_ {2}, ldots, i_ {d}}, end {выровнено}}}

куда ${ displaystyle delta _ {я, j}}$ это Дельта Кронекера. Следовательно, если ${ Displaystyle { mathcal {B}} = (M_ {1}, M_ {2}, ldots, M_ {d}) cdot { mathcal {A}}}$ , тогда

{ displaystyle { begin {align} & b_ {i_ {1}, i_ {2}, ldots, i_ {d}} = left (( mathbf {e} _ {i_ {1}} ^ {1} ) ^ {T}, ( mathbf {e} _ {i_ {2}} ^ {2}) ^ {T}, ldots, ( mathbf {e} _ {i_ {d}} ^ {d}) ^ {T} right) cdot { widehat { mathcal {B}}} = {} & left (( mathbf {e} _ {i_ {1}} ^ {1}) ^ {T }, ( mathbf {e} _ {i_ {2}} ^ {2}) ^ {T}, ldots, ( mathbf {e} _ {i_ {d}} ^ {d}) ^ {T} right) cdot ({ widehat {M}} _ {1}, { widehat {M}} _ {2}, ldots, { widehat {M}} _ {d}) cdot sum _ {j_ {1} = 1} ^ {n_ {1}} sum _ {j_ {2} = 1} ^ {n_ {2}} cdots sum _ {j_ {d} = 1} ^ {n_ { d}} a_ {j_ {1}, j_ {2}, ldots, j_ {d}} mathbf {e} _ {j_ {1}} ^ {1} otimes mathbf {e} _ {j_ { 2}} ^ {2} otimes cdots otimes mathbf {e} _ {j_ {d}} ^ {d} = {} & sum _ {j_ {1} = 1} ^ {n_ { 1}} sum _ {j_ {2} = 1} ^ {n_ {2}} cdots sum _ {j_ {d} = 1} ^ {n_ {d}} a_ {j_ {1}, j_ { 2}, ldots, j_ {d}} (( mathbf {e} _ {i_ {1}} ^ {1}) ^ {T} { widehat {M}} _ {1} mathbf {e} _ {j_ {1}} ^ {1}) otimes (( mathbf {e} _ {i_ {2}} ^ {2}) ^ {T} { widehat {M}} _ {2} mathbf {e} _ {j_ {2}} ^ {2}) otimes cdots otimes (( mathbf {e} _ {i_ {d}} ^ {d}) ^ {T} { widehat {M} } _ {d} mathbf {e} _ {j_ {d}} ^ {d}) = {} & sum _ {j_ {1} = 1} ^ {n_ {1}} sum _ {j_ {2} = 1} ^ {n_ {2}} cdots sum _ {j_ {d} = 1} ^ {n_ {d}} a_ {j_ {1}, j_ {2}, ldots, j_ {d}} m_ {i_ {1}, j_ {1}} ^ {(1)} cdot m_ {i_ {2}, j_ {2}} ^ {(2)} cdots m_ {i_ {d}, j_ {d}} ^ {(d)}, end {align}}}

где ${ displaystyle m_ {я, j} ^ {(k)}}$ элементы ${ displaystyle { widehat {M}} _ {k}}$ как определено выше.

Характеристики

Позволять ${ displaystyle { mathcal {A}} in V_ {1} otimes V_ {2} otimes cdots otimes V_ {d}}$ - тензор порядка d над тензорным произведением ${ displaystyle F}$ -векторные пространства.

Поскольку полилинейное умножение является тензорным произведением линейных отображений, мы имеем следующее свойство полилинейности (при построении карты):^[1]^[2]

{ displaystyle A_ {1} otimes cdots otimes A_ {k-1} otimes ( alpha A_ {k} + beta B) otimes A_ {k + 1} otimes cdots otimes A_ {d } = alpha A_ {1} otimes cdots otimes A_ {d} + beta A_ {1} otimes cdots otimes A_ {k-1} otimes B otimes A_ {k + 1} otimes cdots otimes A_ {d}}

Мультилинейное умножение - это линейная карта:^[1]^[2]

{ displaystyle (M_ {1}, M_ {2}, ldots, M_ {d}) cdot ( alpha { mathcal {A}} + beta { mathcal {B}}) = alpha ; (M_ {1}, M_ {2}, ldots, M_ {d}) cdot { mathcal {A}} + beta ; (M_ {1}, M_ {2}, ldots, M_ {d }) cdot { mathcal {B}}}

Из определения следует, что сочинение двух полилинейных умножений также является полилинейным умножением:^[1]^[2]

{ displaystyle (M_ {1}, M_ {2}, ldots, M_ {d}) cdot left ((K_ {1}, K_ {2}, ldots, K_ {d}) cdot { mathcal {A}} right) = (M_ {1} circ K_ {1}, M_ {2} circ K_ {2}, ldots, M_ {d} circ K_ {d}) cdot { mathcal {A}},}

куда ${ displaystyle M_ {k}: U_ {k} to W_ {k}}$ и ${ displaystyle K_ {k}: V_ {k} to U_ {k}}$ являются линейными отображениями.

Обратите особое внимание на то, что полилинейные умножения на разные множители коммутируют,

{ Displaystyle M_ {k} cdot _ {k} left (M _ { ell} cdot _ { ell} { mathcal {A}} right) = M _ { ell} cdot _ { ell } left (M_ {k} cdot _ {k} { mathcal {A}} right) = M_ {k} cdot _ {k} M _ { ell} cdot _ { ell} { mathcal {A}},}

если ${ Displaystyle к neq ell.}$

Вычисление

Мультилинейное умножение фактора k ${ Displaystyle M_ {k} cdot _ {k} { mathcal {A}}}$ можно вычислить в координатах следующим образом. Прежде всего заметьте, что

{ displaystyle { begin {align} M_ {k} cdot _ {k} { mathcal {A}} & = M_ {k} cdot _ {k} sum _ {j_ {1} = 1} ^ {n_ {1}} sum _ {j_ {2} = 1} ^ {n_ {2}} cdots sum _ {j_ {d} = 1} ^ {n_ {d}} a_ {j_ {1} , j_ {2}, ldots, j_ {d}} mathbf {e} _ {j_ {1}} ^ {1} otimes mathbf {e} _ {j_ {2}} ^ {2} otimes cdots otimes mathbf {e} _ {j_ {d}} ^ {d} & = sum _ {j_ {1} = 1} ^ {n_ {1}} cdots sum _ {j_ { k-1} = 1} ^ {n_ {k-1}} sum _ {j_ {k + 1} = 1} ^ {n_ {k + 1}} cdots sum _ {j_ {d} = 1 } ^ {n_ {d}} mathbf {e} _ {j_ {1}} ^ {1} otimes cdots otimes mathbf {e} _ {j_ {k-1}} ^ {k-1} otimes M_ {k} left ( sum _ {j_ {k} = 1} ^ {n_ {k}} a_ {j_ {1}, j_ {2}, ldots, j_ {d}} mathbf { e} _ {j_ {k}} ^ {k} right) otimes mathbf {e} _ {j_ {k + 1}} ^ {k + 1} otimes cdots otimes mathbf {e} _ {j_ {d}} ^ {d}. end {align}}}

Далее, поскольку

{ displaystyle F ^ {n_ {1}} otimes F ^ {n_ {2}} otimes cdots otimes F ^ {n_ {d}} simeq F ^ {n_ {k}} otimes (F ^ {n_ {1}} otimes cdots otimes F ^ {n_ {k-1}} otimes F ^ {n_ {k + 1}} otimes cdots otimes F ^ {n_ {d}}) simeq F ^ {n_ {k}} otimes F ^ {n_ {1} cdots n_ {k-1} n_ {k + 1} cdots n_ {d}},}

существует биективное отображение, называемое фактор-k стандарт сплющивание,^[1] обозначается ${ Displaystyle ( cdot) _ {(к)}}$ , который определяет ${ Displaystyle M_ {k} cdot _ {k} { mathcal {A}}}$ с элементом из последнего пространства, а именно

{ displaystyle left (M_ {k} cdot _ {k} { mathcal {A}} right) _ {(k)}: = sum _ {j_ {1} = 1} ^ {n_ {1 }} cdots sum _ {j_ {k-1} = 1} ^ {n_ {k-1}} sum _ {j_ {k + 1} = 1} ^ {n_ {k + 1}} cdots sum _ {j_ {d} = 1} ^ {n_ {d}} M_ {k} left ( sum _ {j_ {k} = 1} ^ {n_ {k}} a_ {j_ {1}, j_ {2}, ldots, j_ {d}} mathbf {e} _ {j_ {k}} ^ {k} right) otimes mathbf {e} _ { mu _ {k} (j_ { 1}, ldots, j_ {k-1}, j_ {k + 1}, ldots, j_ {d})}: = M_ {k} { mathcal {A}} _ {(k)},}

куда ${ displaystyle mathbf {e} _ {j}}$ это jстандартный базисный вектор ${ displaystyle F ^ {N_ {k}}}$ , ${ displaystyle N_ {k} = n_ {1} cdots n_ {k-1} n_ {k + 1} cdots n_ {d}}$ , и ${ displaystyle { mathcal {A}} _ {(k)} in F ^ {n_ {k}} otimes F ^ {N_ {k}} simeq F ^ {n_ {k} times N_ {k} }}}$ это фактор-k матрица уплощения из ${ displaystyle { mathcal {A}}}$ чьи столбцы фактор-k векторов ${ displaystyle [a_ {j_ {1}, ldots, j_ {k-1}, i, j_ {k + 1}, ldots, j_ {d}}] _ {i = 1} ^ {n_ {k }}}$ в некотором порядке, определяемом конкретным выбором биективного отображения

{ displaystyle mu _ {k}: [1, n_ {1}] times cdots times [1, n_ {k-1}] times [1, n_ {k + 1}] times cdots times [1, n_ {d}] to [1, N_ {k}].}

Другими словами, мультилинейное умножение ${ Displaystyle (M_ {1}, M_ {2}, ldots, M_ {d}) cdot { mathcal {A}}}$ можно вычислить как последовательность d фактор-k мультилинейные умножения, которые сами по себе могут быть эффективно реализованы как классические умножения матриц.

Приложения

В разложение по сингулярным числам высшего порядка (HOSVD) факторизует тензор, заданный в координатах ${ displaystyle { mathcal {A}} in F ^ {n_ {1} times n_ {2} times cdots times n_ {d}}}$ как мультилинейное умножение ${ Displaystyle { mathcal {A}} = (U_ {1}, U_ {2}, ldots, U_ {d}) cdot { mathcal {S}}}$ , куда ${ displaystyle U_ {k} in F ^ {n_ {k} times n_ {k}}}$ ортогональные матрицы и ${ displaystyle { mathcal {S}} in F ^ {n_ {1} times n_ {2} times cdots times n_ {d}}}$ .

дальнейшее чтение

^ ^а ^б ^c ^d ^е ^ж М., Ландсберг Дж. (2012). Тензоры: геометрия и приложения. Провиденс, Р.И .: Американское математическое общество. ISBN 9780821869079. OCLC 733546583.
^ ^а ^б ^c ^d ^е Полилинейная алгебра | Вернер Гройб | Springer. Universitext. Springer. 1978 г. ISBN 9780387902845.

[:0-1] а ^б ^c ^d ^е ^ж М., Ландсберг Дж. (2012). Тензоры: геометрия и приложения. Провиденс, Р.И .: Американское математическое общество. ISBN 9780821869079. OCLC 733546583.

[:1-2] а ^б ^c ^d ^е Полилинейная алгебра | Вернер Гройб | Springer. Universitext. Springer. 1978 г. ISBN 9780387902845.

[1]

[2]