Матрица Граница Чернова - Matrix Chernoff bound

Для некоторых приложений в линейная алгебра, полезно знать свойства распределение вероятностей из крупнейших собственное значение из конечная сумма из случайные матрицы. Предполагать конечная последовательность случайных матриц. По аналогии с известным Граница Чернова для сумм скаляров ищется оценка для заданного параметрат:

Следующие теоремы дают ответ на этот общий вопрос при различных предположениях; эти предположения называются ниже по аналогии с их классическими скалярными аналогами. Все эти теоремы можно найти в (Тропп 2010 ), как частное применение общего результата, который выводится ниже. Дается краткое содержание родственных работ.

Матрица Гаусса и рядов Радемахера

Случай самосопряженных матриц

Рассмотрим конечную последовательность фиксированных самосопряженных матриц размерности , и разреши конечная последовательность независимый стандарт нормальный или независимый Радемахер случайные переменные.

Тогда для всех ,

куда

Прямоугольный корпус

Рассмотрим конечную последовательность фиксированных самосопряженных матриц размерности , и разреши - конечная последовательность независимых стандартных нормальных или независимых случайных величин Радемахера. Определить параметр дисперсии

Тогда для всех ,

Матричные неравенства Чернова

Классический Границы Чернова относятся к сумме независимых, неотрицательных и равномерно ограниченных случайных величин. В матричной установке аналогичная теорема касается суммы положительно-полуопределенный случайные матрицы, подвергнутые равномерной оценке собственных значений.

Матрица Чернова I

Рассмотрим конечную последовательность независимых, случайных, самосопряженных матриц размерности Предположим, что каждая случайная матрица удовлетворяет

почти наверняка.

Определять

потом

Матрица Чернова II

Рассмотрим последовательность независимых, случайных, самосопряженных матриц, удовлетворяющих

почти наверняка.

Вычислить минимальное и максимальное собственные значения среднего ожидания,

потом

Расхождение двоичной информации определяется как

за .

Матричные неравенства Беннета и Бернштейна

В скалярной настройке Неравенства Беннета и Бернштейна описывают верхний хвост суммы независимых случайных величин с нулевым средним, которые либо ограничены, либо субэкспоненциальный. В матричном случае аналогичные результаты относятся к сумме случайных матриц с нулевым средним.

Ограниченный случай

Рассмотрим конечную последовательность независимых, случайных, самосопряженных матриц размерности Предположим, что каждая случайная матрица удовлетворяет

почти наверняка.

Вычислите норму общей дисперсии,

Тогда для всех справедлива следующая цепочка неравенств. :

Функция определяется как за .

Субэкспоненциальный случай

Рассмотрим конечную последовательность независимых, случайных, самосопряженных матриц размерности .Предположить, что

за .

Вычислить параметр дисперсии,

Тогда для всех справедлива следующая цепочка неравенств. :

Прямоугольный корпус

Рассмотрим конечную последовательность независимых случайных матриц размерности Предположим, что каждая случайная матрица удовлетворяет

почти наверняка. Определите параметр дисперсии

Тогда для всех

держит.[1]

Матричные неравенства Адзумы, Хёффдинга и МакДиармида

Матрица Адзума

Скалярная версия Неравенство Адзумы утверждает, что скаляр мартингейл показывает нормальную концентрацию относительно своего среднего значения, а шкала отклонений контролируется общим максимальным квадратом диапазона разностной последовательности. Ниже показано расширение в настройке матрицы.

Рассмотрим конечную адаптированную последовательность самосопряженных матриц размерности , и фиксированная последовательность самосопряженных матриц, удовлетворяющих

почти наверняка.

Вычислить параметр дисперсии

Тогда для всех

Константа 1/8 может быть увеличена до 1/2 при наличии дополнительной информации. Один случай возникает, когда каждое слагаемое условно симметрична. Другой пример требует предположения, что почти наверняка ездит с .

Матрица Хёффдинг

Добавление предположения о том, что слагаемые в Matrix Azuma независимы, дает матричное расширение Неравенства Хёффдинга.

Рассмотрим конечную последовательность независимых, случайных, самосопряженных матриц размерности , и разреши - последовательность фиксированных самосопряженных матриц. Предположим, что каждая случайная матрица удовлетворяет

почти наверняка.

Тогда для всех

куда

Улучшение этого результата было установлено в (Mackey et al. 2012 г. ):для всех

куда

Матричная ограниченная разность (МакДиармид)

В скалярной настройке Неравенство МакДиармида предоставляет один общий способ ограничения различий путем применения Неравенство Адзумы к Дуб мартингейл. В матричной установке выполняется вариант неравенства ограниченных разностей.

Позволять - независимое семейство случайных величин, и пусть быть функцией, отображающей переменных в самосопряженную матрицу размерности .Рассмотрим последовательность фиксированных самосопряженных матриц, удовлетворяющих

куда и диапазон всех возможных значений для каждого индекса . Вычислить параметр дисперсии

Тогда для всех

куда .

Улучшение этого результата было установлено в (Полин, Макки и Тропп, 2013 г. ) (смотрите также (Полин, Макки и Тропп, 2016 г. )):для всех

куда и

Обзор родственных теорем

Первые оценки этого типа были получены с помощью (Альсведе и зима 2003 ). Напомним Теорема выше для самосопряженных матричных оценок Гаусса и Радемахера: Для конечной последовательности фиксированных самосопряженных матриц размерности и для конечная последовательность независимый стандарт нормальный или независимый Радемахер случайные величины, тогда

куда

Альсведе и Винтер дадут тот же результат, за исключением

.

Для сравнения: в теореме выше коммутирует и ; то есть это наибольшее собственное значение суммы, а не сумма наибольших собственных значений. Оно никогда не превышает значения Альсведе – Винтера ( норма неравенство треугольника ), но может быть намного меньше. Следовательно, приведенная выше теорема дает более жесткую оценку, чем результат Альсведе – Винтера.

Главный вклад (Альсведе и зима 2003 ) был расширением метода преобразования Лапласа, использованного для доказательства скалярной границы Чернова (см. Граница Чернова # Теорема для аддитивной формы (абсолютная ошибка) ) на случай самосопряженных матриц. Процедура, приведенная в происхождение ниже. Все недавние работы по этой теме следуют той же процедуре, и основные отличия вытекают из последующих шагов. Ahlswede & Winter используют Неравенство Голдена – Томпсона для продолжения, тогда как Tropp (Тропп 2010 ) использует Теорема Либа.

Предположим, что кто-то хочет изменить длину ряда (п) и размерности матриц (d), при этом правая часть остается примерно постоянной. Thenn должна варьироваться примерно в зависимости от журналаd. В нескольких работах предпринимались попытки установить границу без зависимости от размеров. Рудельсон и Вершинин (Рудельсон и Вершинин 2007 ) дают результат для матриц, которые являются внешним произведением двух векторов. (Magen & Zouzias 2010 ) дают результат без размерной зависимости для матриц низкого ранга. Первоначальный результат был получен независимо от подхода Альсведе – Винтера, но (Оливейра 2010b ) доказывает аналогичный результат с использованием подхода Альсведе – Винтера.

Наконец, Оливейра (Оливьера 2010a ) доказывает результат для матричных мартингалов независимо от модели Альсведе – Винтера. Тропп (Тропп 2011 ) немного улучшает результат при использовании схемы Алсведе – Винтера. Ни один из результатов не представлен в этой статье.

Вывод и доказательство

Альсведе и зима

Аргумент преобразования Лапласа, найденный в (Альсведе и зима 2003 ) является самостоятельным значительным результатом: Пусть - случайная самосопряженная матрица. потом

Чтобы доказать это, исправим . потом

Предпоследнее неравенство Неравенство Маркова. Последнее неравенство выполнено, поскольку . Поскольку самая левая величина не зависит от , инфимум закончился остается его верхней границей.

Итак, наша задача понять Тем не менее, поскольку след и математическое ожидание линейны, мы можем их коммутировать, поэтому достаточно рассмотреть , которую мы называем производящей функцией матрицы. Вот где методы (Альсведе и зима 2003 ) и (Тропп 2010 ) расходятся. Сразу после этого следует представление (Альсведе и зима 2003 ).

В Неравенство Голдена – Томпсона подразумевает, что

, где мы несколько раз использовали линейность математического ожидания.

Предполагать . Мы можем найти верхнюю оценку для повторяя этот результат. Отмечая, что , тогда

Повторяя это, мы получаем

Пока что мы нашли границу с точной нижней гранью по . В свою очередь, это может быть ограничено. Во всяком случае, можно увидеть, как возникает оценка Альсведе – Винтера как сумма наибольших собственных значений.

Тропп

Основной вклад (Тропп 2010 ) является применением Теорема Либа куда (Альсведе и зима 2003 ) применил Неравенство Голдена – Томпсона. Следствие Троппа следующее: если - фиксированная самосопряженная матрица и - случайная самосопряженная матрица, то

Доказательство: Пусть . Тогда теорема Либа говорит нам, что

вогнутая. Последний шаг - использовать Неравенство Дженсена чтобы переместить ожидание внутри функции:

Это дает нам главный результат статьи: субаддитивность журнала производящей функции матрицы.

Субаддитивность log mgf

Позволять - конечная последовательность независимых случайных самосопряженных матриц. Тогда для всех ,

Доказательство: достаточно позволить . Расширяя определения, нам нужно показать, что

Для завершения доказательства воспользуемся закон полного ожидания. Позволять ожидание обусловлено . Поскольку мы предполагаем, что все независимы,

Определять .

Наконец, у нас есть

где на каждом шаге m мы используем следствие Троппа с

Мастер хвост связан

Следующее сразу следует из предыдущего результата:

Все приведенные выше теоремы выводятся из этой оценки; теоремы состоят в различных способах ограничения нижней грани. Эти шаги значительно проще, чем приведенные доказательства.

Рекомендации

  • Ahlswede, R .; Уинтер А. (2003). «Сильный разговор для идентификации через квантовые каналы». IEEE Transactions по теории информации. 48 (3): 569–579. arXiv:Quant-ph / 0012127. Дои:10.1109/18.985947. S2CID  523176.CS1 maint: ref = harv (связь)
  • Mackey, L .; Jordan, M. I .; Chen, R. Y .; Farrell, B .; Тропп, Дж. А. (2012). «Неравенства концентраций матриц методом обменных пар». Анналы вероятности. 42 (3): 906–945. arXiv:1201.6002. Дои:10.1214 / 13-AOP892. S2CID  9635314.CS1 maint: ref = harv (связь)
  • Маген, А.; Зузиас, А. (2010). "Матричнозначные границы Чернова низкого ранга и приближенное матричное умножение". arXiv:1005.2724 [cs.DS ].CS1 maint: ref = harv (связь)
  • Оливейра, Р.И. (2010). «Концентрация матрицы смежности и лапласиана в случайных графах с независимыми ребрами». arXiv:0911.0600 [math.CO ].CS1 maint: ref = harv (связь)
  • Оливейра, Р.И. (2010). «Суммы случайных эрмитовых матриц и неравенство Рудельсона». arXiv:1004.3821 [math.PR ].CS1 maint: ref = harv (связь)
  • Паулин, Д .; Mackey, L .; Тропп, Дж. А. (2013). «Получение матричных концентрационных неравенств из связей ядра». arXiv:1305.0612 [math.PR ].CS1 maint: ref = harv (связь)
  • Паулин, Д .; Mackey, L .; Тропп, Дж. А. (2016). «Неравенства Эфрона – Стейна для случайных матриц». Анналы вероятности. 44 (5): 3431–3473. arXiv:1408.3470. Дои:10.1214 / 15-AOP1054. S2CID  16263460.CS1 maint: ref = harv (связь)
  • Рудельсон, М .; Вершинин, Р. (2007). «Выборка из больших матриц: подход через геометрический функциональный анализ». J. Assoc. Comput. Мах. (4-е изд.). 54. arXiv:математика / 9608208. Bibcode:1996математика ...... 8208R. Дои:10.1145/1255443.1255449. S2CID  6054789.CS1 maint: ref = harv (связь)
  • Тропп, Дж. (2011). «Неравенство Фридмана для матричных мартингалов». arXiv:1101.3039 [math.PR ].CS1 maint: ref = harv (связь)
  • Тропп, Дж. (2010). «Удобные хвостовые границы для сумм случайных матриц». Основы вычислительной математики. 12 (4): 389–434. arXiv:1004.4389. Дои:10.1007 / s10208-011-9099-z. S2CID  17735965.CS1 maint: ref = harv (связь)