Преобразование Адамара - Hadamard transform

В товар из Логическая функция и Матрица Уолша это его Спектр Уолша:[1]
(1, 0, 1, 0, 0, 1, 1, 0) × H (8) = (4, 2, 0, −2, 0, 2, 0, 2)
Быстрое преобразование Уолша – Адамара, более быстрый способ вычисления спектра Уолша (1, 0, 1, 0, 0, 1, 1, 0).
Исходная функция может быть выражена с помощью ее спектра Уолша в виде арифметического полинома.

В Преобразование Адамара (также известный как Преобразование Уолша-Адамара, Преобразование Адамара – Радемахера – Уолша, Преобразование Уолша, или Преобразование Уолша – Фурье) является примером обобщенного класса Преобразования Фурье. Он выполняет ортогональный, симметричный, инволютивный, линейный режим на 2м действительные числа (или сложный, или гиперкомплексные числа, хотя сами матрицы Адамара вполне реальны).

Преобразование Адамара можно рассматривать как построенное из размера-2 дискретные преобразования Фурье (ДПФ), и фактически эквивалентно многомерному ДПФ размера 2 × 2 × ⋯ × 2 × 2.[2] Он разлагает произвольный входной вектор на суперпозицию Функции Уолша.

Преобразование названо в честь Французский математик Жак Адамар, немецко-американский математик Ганс Радемахер, и американский математик Джозеф Л. Уолш.

Определение

Преобразование Адамара ЧАСм это 2м × 2м матрица, Матрица Адамара (масштабируется с помощью коэффициента нормализации), который преобразует 2м действительные числа Иксп в 2м действительные числа Иксk. Преобразование Адамара можно определить двумя способами: рекурсивно, или используя двоичный (база -2) представление индексов п и k.

Рекурсивно определим преобразование Адамара 1 × 1 ЧАС0 посредством идентичность ЧАС0 = 1, а затем определим ЧАСм для м > 0 по:

где 1 /2 это нормализация, которая иногда опускается.

Для м > 1, мы также можем определить ЧАСм от:

где представляет Кронекер продукт. Таким образом, за исключением этого нормировочного коэффициента, матрицы Адамара полностью состоят из 1 и -1.

Эквивалентно, мы можем определить матрицу Адамара ее (kп) -я запись письменно

где kj и пj двоичные цифры (0 или 1) k и псоответственно. Обратите внимание, что для элемента в верхнем левом углу мы определяем: . В этом случае мы имеем:

Это как раз многомерный ДПФ, нормализованное к унитарный, если входы и выходы рассматриваются как многомерные массивы, индексируемые пj и kjсоответственно.

Ниже приведены некоторые примеры матриц Адамара.

где - побитовое скалярное произведение двоичных представлений чисел i и j. Например, если , тогда , согласившись с вышеизложенным (игнорируя общую константу). Обратите внимание, что первая строка, первый элемент столбца матрицы обозначается как .

ЧАС1 это именно ДПФ размера 2. Его также можно рассматривать как преобразование Фурье на двухэлементном добавка группа Z/(2).

Строки матриц Адамара - это Функции Уолша.

Вычислительная сложность

В классической области преобразование Адамара может быть вычислено в операции (), с использованием быстрое преобразование Адамара алгоритм.

В квантовой области преобразование Адамара можно вычислить в время, как это квантовый логический вентиль это может быть распараллеленный.

Приложения квантовых вычислений

В квантовая обработка информации преобразование Адамара, чаще называемое Ворота Адамара в этом контексте (ср. квантовые ворота ), является одно-кубит вращение, отображая состояния кубита и в два состояния суперпозиции с равным весом вычислительной основа состояния и . Обычно фазы выбираются так, чтобы у нас было

в Обозначение Дирака. Это соответствует матрица преобразования

в основа, также известная как вычислительная база. Штаты и известны как и соответственно, и вместе составляют полярная основа в квантовые вычисления.

Много квантовые алгоритмы используйте преобразование Адамара в качестве начального шага, поскольку оно отображает м кубиты инициализированы с помощью к суперпозиции всех 2м ортогональные состояния в основа с равным весом.

Примечательно, что вычисление квантового преобразования Адамара - это просто применение логического элемента Адамара к каждому кубиту индивидуально из-за структуры тензорного произведения преобразования Адамара. Этот простой результат означает, что квантовое преобразование Адамара требует журналп операций, по сравнению с классическим случаем п журналп операции.

Операции с воротами Адамара

Одно применение вентилей Адамара либо к 0, либо к 1 кубиту создаст квантовое состояние, которое, если будет наблюдаться, будет равно 0 или 1 с равной вероятностью (как показано в первых двух операциях). Это похоже на подбрасывание справедливой монеты в стандартном вероятностная модель расчета. Однако, если вентиль Адамара применяется дважды подряд (как это фактически делается в последних двух операциях), то конечное состояние всегда совпадает с начальным.

Приложения для молекулярной филогенетики (эволюционной биологии)

Преобразование Адамара можно использовать для оценки филогенетические деревья из молекулярных данных.[3][4][5] Филогенетика это подполе эволюционная биология сосредоточены на понимании взаимоотношений между организмами. Преобразование Адамара, примененное к вектору (или матрице) частот паттернов сайтов, полученных из ДНК. множественное выравнивание последовательностей может использоваться для генерации другого вектора, который несет информацию о топологии дерева. Обратимый характер филогенетического преобразования Адамара также позволяет вычислить вероятность сайта из вектора топологии дерева, что позволяет использовать преобразование Адамара для оценка максимального правдоподобия филогенетических деревьев. Однако последнее приложение менее полезно, чем преобразование вектора шаблона сайта в вектор дерева, потому что есть другие способы вычисления вероятности сайта.[6][7] которые намного эффективнее. Однако обратимая природа филогенетического преобразования Адамара действительно представляет собой элегантный инструмент математической филогенетики.[8][9]

Механика филогенетического преобразования Адамара включает вычисление вектора который предоставляет информацию о топологии и длинах ветвей для дерева с использованием вектора или матрицы шаблона сайта .

где - матрица Адамара подходящего размера. Это уравнение можно переписать в виде серии из трех уравнений, чтобы упростить его интерпретацию:

Обратимый характер этого уравнения позволяет рассчитать вектор (или матрицу) ожидаемого шаблона сайта следующим образом:

Мы можем использовать Cavender-Farris-Нейман (CFN) с двумя состояниями модель замещения для ДНК путем кодирования нуклеотиды как двоичные символы ( пурины A и G кодируются как R, а пиримидины C и T кодируются как Y). Это позволяет кодировать множественное выравнивание последовательностей как вектор паттерна сайта. который может быть преобразован в древовидный вектор , как показано в следующем примере:

Пример, показывающий преобразование Адамара для конкретного дерева (значения для рабочего примера адаптированы из Waddell et al. 1997[10])
ПоказательБинарный паттернШаблоны совмещения
00000РРРР и ГГГГ-0.475010.6479
10001RRRY и YYYR0.2-0.50.60650.1283
20010RRYR и YYRY0.025-0.150.86070.02
3*0011RRYY и YYRR0.025-0.450.63760.0226
40100РЫРР и ЫРЫЙ0.2-0.450.63760.1283
5*0101РЫРЬ и ИРЫР0-0.850.42740.0258
6*0110RYYR и YRRY0-0.50.60650.0070
70111RYYY и YRRR0.025-0.90.40660.02

В примере, показанном в этой таблице, используется упрощенная схема трех уравнений, и это для дерева четырех таксонов, которое может быть записано как ((A, B), (C, D)); в формат newick. Шаблоны сайта записываются в порядке ABCD. Это конкретное дерево имеет две длинные конечные ветви (0,2 трансверсия замен на сайт), две короткие концевые ветви (0,025 трансверсионных замен на сайт) и короткую внутреннюю ветвь (0,025 трансверсионных замен на сайт); таким образом, он будет записан как ((A: 0,025, B: 0,2): 0,025, (C: 0,025, D: 0,2)); в формате newick. Это дерево будет выставлено аттракцион длинной ветви если данные анализируются с помощью максимальная экономия критерий (при условии, что анализируемая последовательность достаточно длинна, чтобы наблюдаемые частоты паттернов сайтов были близки к ожидаемым частотам, показанным столбец). Привлекательность длинной ветви отражает тот факт, что ожидаемое количество шаблонов сайтов с индексом 6 - которые поддерживают дерево ((A, C), (B, D)); - превышает ожидаемое количество шаблонов сайтов, поддерживающих истинное дерево (индекс 4). Очевидно, обратимый характер филогенетического преобразования Адамара означает, что древовидный вектор означает, что древовидный вектор соответствует правильному дереву. Следовательно, анализ экономичности после преобразования статистически согласованный,[11] как и стандартный анализ максимального правдоподобия с использованием правильной модели (в данном случае модели CFN).

Обратите внимание, что образец сайта с 0 соответствует сайтам, которые не изменились (после кодирования нуклеотидов как пуринов или пиримидинов). Индексы со звездочками (3, 5 и 6) являются «экономно-информативными», а. остальные индексы представляют собой паттерны участков, в которых один таксон отличается от трех других таксонов (таким образом, они эквивалентны длине конечных ветвей в стандартном филогенетическом дереве максимального правдоподобия).

Если кто-то желает использовать нуклеотидные данные без перекодирования как R и Y (и, в конечном счете, как 0 и 1), можно закодировать шаблоны сайтов в виде матрицы. Если мы рассмотрим дерево из четырех таксонов, то всего будет 256 паттернов сайтов (четыре нуклеотида против 4th мощность). Однако симметрии Трехпараметрическая модель Кимуры (или К81) позволяют сократить 256 возможных паттернов сайтов для ДНК до 64 паттернов, что дает возможность кодировать нуклеотидные данные для дерева с четырьмя таксонами в виде матрицы 8 x 8[12] аналогично вектору из 8 элементов, использованному выше для шаблонов сайтов трансверсии (RY). Это достигается путем перекодирования данных с использованием Кляйн четыре группы:

Четырехгрупповое кодирование Клейна для филогенетического преобразования Адамара
Нуклеотид 1Нуклеотид 2Нуклеотид 3Нуклеотид 4
А (0,0)G (1,0)С (0,1)Т (1,1)
С (0,0)Т (1,0)А (0,1)G (1,1)
G (0,0)А (1,0)Т (0,1)С (1,1)
Т (0,0)С (1,0)G (0,1)А (1,1)

Как и в случае с данными RY, шаблоны сайтов индексируются относительно базы в произвольно выбранном первом таксоне, а базы в последующих таксонах кодируются относительно этой первой базы. Таким образом, первый таксон получает битовую пару (0,0). Используя эти пары битов, можно создать два вектора, похожие на векторы RY, а затем заполнить матрицу, используя эти векторы. Это можно проиллюстрировать на примере Hendy et al. (1994),[12] который основан на множественном выравнивании последовательностей четырех псевдогенов гемоглобина приматов:

Пример выравнивания кодируемых последовательностей (от Hendy et al. 1994[12])(значения рассчитаны из 9879 сайтов)
08162432404856
08988910122490
1419**
24513
354*143
49420
51
622
73561175

Намного большее количество шаблонов сайтов в столбце 0 отражает тот факт, что столбец 0 соответствует переход различия, которые накапливаются быстрее, чем трансверсионные различия практически во всех сравнениях геномных областей (и определенно накапливаются быстрее в псевдогенах гемоглобина, используемых для этого рабочего примера[13]). Если мы рассмотрим шаблон сайта AAGG, это будет двоичный шаблон 0000 для второго элемента битовой пары группы Клейна и 0011 для первого элемента. в этом случае двоичный шаблон, основанный на первом элементе первого элемента, соответствует индексу 3 (таким образом, строка 3 в столбце 0; обозначена одной звездочкой в ​​таблице). Шаблоны сайтов GGAA, CCTT и TTCC будут закодированы точно так же. Шаблон сайта AACT будет закодирован двоичным шаблоном 0011 на основе второго элемента и 0001 на основе первого элемента; это дает индекс 1 для первого элемента и индекс 3 для второго. Индекс, основанный на второй паре битов группы Клейна, умножается на 8, чтобы получить индекс столбца (в данном случае это будет столбец 24). Ячейка, которая будет включать количество шаблонов сайтов AACT, обозначена двумя звездочками; однако отсутствие номера в примере указывает на то, что выравнивание последовательностей не включает паттерны сайтов AACT (аналогично, паттерны сайтов CCAG, GGTC и TTGA, которые кодируются таким же образом, отсутствуют).

Другие приложения

Преобразование Адамара также используется в шифрование данных, а также многие обработка сигнала и Сжатие данных алгоритмы, такие как JPEG XR и MPEG-4 AVC. В сжатие видео приложений, он обычно используется в виде сумма абсолютных преобразованных разностей. Это также важная часть Алгоритм Гровера и Алгоритм Шора в квантовых вычислениях. Преобразование Адамара также применяется в экспериментальных методах, таких как ЯМР, масс-спектрометрии и кристаллография. Дополнительно используется в некоторых версиях хеширование с учетом местоположения, чтобы получить псевдослучайные повороты матрицы.

Смотрите также

внешние ссылки

использованная литература

  1. ^ Сравните рисунок 1 в Townsend, W. J .; Торнтон, М. А. "Вычисления спектра Уолша с использованием графов Кэли". CiteSeerX  10.1.1.74.8029. Цитировать журнал требует | журнал = (Помогите)
  2. ^ Кунц, Х. (1979). "Об эквивалентности одномерного дискретного преобразования Уолша-Адамара и многомерного дискретного преобразования Фурье". Транзакции IEEE на компьютерах. 28 (3): 267–8. Дои:10.1109 / TC.1979.1675334.
  3. ^ Хенди, Майкл Д .; Пенни, Дэвид (декабрь 1989 г.). «Основы количественного исследования эволюционных деревьев». Систематическая зоология. 38 (4): 297. Дои:10.2307/2992396.
  4. ^ Хенди, Майкл Д .; Пенни, Дэвид (январь 1993). «Спектральный анализ филогенетических данных». Журнал классификации. 10 (1): 5–24. Дои:10.1007 / BF02638451. ISSN  0176-4268.
  5. ^ Секели, Л. А., Эрдёш, П. Л., Стил, М. А., и Пенни, Д. (1993). Формула обращения Фурье для эволюционных деревьев. Письма по прикладной математике, 6(2), 13-16.
  6. ^ Фельзенштейн, Джозеф (ноябрь 1981 г.). «Эволюционные деревья из последовательностей ДНК: подход максимального правдоподобия». Журнал молекулярной эволюции. 17 (6): 368–376. Дои:10.1007 / BF01734359. ISSN  0022-2844.
  7. ^ Стаматакис, Александрос (2019), Варнов, Тэнди (ред.), «Обзор подходов к оптимизации вычислений филогенетического правдоподобия», Биоинформатика и филогенетика, Cham: Springer International Publishing, 29, стр. 1–19, Дои:10.1007/978-3-030-10837-3_1, ISBN  978-3-030-10836-6, получено 2020-10-10
  8. ^ Чор, Бенни; Хенди, Майкл Д .; Голландия, Барбара Р .; Пенни, Дэвид (2000-10-01). «Множественные максимумы правдоподобия в филогенетических деревьях: аналитический подход». Молекулярная биология и эволюция. 17 (10): 1529–1541. Дои:10.1093 / oxfordjournals.molbev.a026252. ISSN  1537-1719.
  9. ^ Matsen, Frederick A .; Сталь, Майк (2007-10-01). Ане, Сесиль; Салливан, Джек (ред.). «Филогенетические смеси на одном дереве могут имитировать дерево с другой топологией». Систематическая биология. 56 (5): 767–775. Дои:10.1080/10635150701627304. ISSN  1076-836X.
  10. ^ Уодделл, Питер Дж; Стил, Массачусетс (декабрь 1997 г.). «Общие обратимые во времени расстояния с неравными скоростями между сайтами: смешивание Γ и обратных гауссовских распределений с инвариантными сайтами». Молекулярная филогенетика и эволюция. 8 (3): 398–414. Дои:10.1006 / mpev.1997.0452.
  11. ^ Steel, M. A .; Hendy, M.D .; Пенни, Д. (1993-12-01). «Экономия может быть последовательной!». Систематическая биология. 42 (4): 581–587. Дои:10.1093 / sysbio / 42.4.581. ISSN  1063-5157.
  12. ^ а б c Hendy, M.D .; Penny, D .; Стил, М.А. (1994-04-12). «Дискретный анализ Фурье для эволюционных деревьев». Труды Национальной академии наук. 91 (8): 3339–3343. Дои:10.1073 / пнас.91.8.3339. ISSN  0027-8424. ЧВК  43572. PMID  8159749.
  13. ^ Миямото, М. М .; Koop, B. F .; Slightom, J. L .; Goodman, M .; Теннант, М. Р. (1988-10-01). «Молекулярная систематика высших приматов: генеалогические отношения и классификация». Труды Национальной академии наук. 85 (20): 7627–7631. Дои:10.1073 / pnas.85.20.7627. ISSN  0027-8424. ЧВК  282245. PMID  3174657.