Каноническая корреляция - Canonical correlation
Часть серии по |
Машинное обучение и сбор данных |
---|
Площадки для машинного обучения |
В статистика, канонико-корреляционный анализ (CCA), также называется канонический анализ переменных, способ получения информации из кросс-ковариационные матрицы. Если у нас есть два вектора Икс = (Икс1, ..., Иксп) и Y = (Y1, ..., Yм) из случайные переменные, и здесь корреляции среди переменных, то канонический корреляционный анализ найдет линейные комбинации Икс и Y которые имеют максимальную корреляцию друг с другом.[1] Т. Р. Кнапп отмечает, что «практически все часто встречающиеся параметрические тесты значимости можно рассматривать как частные случаи канонического корреляционного анализа, который представляет собой общую процедуру исследования отношений между двумя наборами переменных ».[2] Метод был впервые представлен Гарольд Хотеллинг в 1936 г.,[3] хотя в контексте углы между квартирами математическая концепция была опубликована Джорданом в 1875 году.[4]
Определение
Учитывая два векторы-столбцы и из случайные переменные с участием конечный вторые моменты, можно определить кросс-ковариация быть матрица чья запись - это ковариация . На практике мы будем оценивать ковариационную матрицу на основе выборочных данных из и (т.е. из пары матриц данных).
Канонический корреляционный анализ ищет векторы () и () такие, что случайные величины и максимизировать корреляция . Случайные величины и являются первая пара канонических переменных. Затем ищут векторы, максимизирующие ту же корреляцию, при условии, что они не коррелируют с первой парой канонических переменных; это дает вторая пара канонических переменных. Эта процедура может быть продолжена до раз.
Вычисление
Вывод
Позволять быть матрица кросс-ковариации для любых случайных величин и . Параметр для максимизации:
Первый шаг - определить изменение основы и определить
Итак, мы имеем
Посредством Неравенство Коши – Шварца, у нас есть
Равенство имеет место, если векторы и коллинеарны. Кроме того, максимум корреляции достигается, если это собственный вектор с максимальным собственным значением для матрицы (увидеть Фактор Рэлея ). Последующие пары находятся с помощью собственные значения уменьшающихся величин. Ортогональность гарантируется симметрией корреляционных матриц.
Другой способ взглянуть на это вычисление: и левый и правый сингулярные векторы корреляционной матрицы X и Y, соответствующей наивысшему сингулярному значению.
Решение
Поэтому решение:
- является собственным вектором
- пропорционально
Соответственно, также есть:
- является собственным вектором
- пропорционально
Обращая вспять изменение координат, мы имеем
- является собственным вектором ,
- пропорционально
- является собственным вектором
- пропорционально .
Канонические переменные определяются:
Реализация
CCA можно вычислить, используя разложение по сингулярным числам на корреляционной матрице.[5] Он доступен как функция в[6]
- MATLAB так как канонкорр (также в Октава )
- р как стандартная функция канкор и несколько других пакетов, включая CCA и веган. КПК для проверки статистических гипотез в каноническом корреляционном анализе.
- SAS так как proc cancorr
- Python в библиотеке scikit-learn, так как Перекрестное разложение И в statsmodels, так как CanCorr.
- SPSS как макрос CanCorr, поставляемый с основным программным обеспечением
- Юлия (язык программирования) в MultivariateStats.jl пакет.
Расчет CCA с использованием разложение по сингулярным числам на корреляционной матрице связана с косинус из углы между квартирами. В косинус функция плохо воспитанный для малых углов, что приводит к очень неточному вычислению сильно коррелированных главных векторов в конечных точность компьютерная арифметика. Чтобы исправить эту проблему, альтернативные алгоритмы[7] доступны в
- SciPy так как функция линейной алгебры subspace_angles
- MATLAB так как Подпространство функции FileExchange
Проверка гипотезы
Каждую строку можно проверить на значимость с помощью следующего метода. Поскольку корреляции отсортированы, говоря, что строка равен нулю, значит, все дальнейшие корреляции также равны нулю. Если у нас есть независимые наблюдения в выборке и - оценочная корреляция для . Для -я строка, статистика теста:
который асимптотически распределен как хи-квадрат с участием степени свободы для больших .[8] Поскольку все корреляции из к логически равны нулю (и оцениваются таким же образом), произведение для членов после этой точки не имеет значения.
Обратите внимание, что в ограниченном размере выборки с то нам гарантировано, что верх корреляции будут одинаково равны 1 и, следовательно, проверка бессмысленна.[9]
Практическое использование
Типичное использование канонической корреляции в экспериментальном контексте - взять два набора переменных и посмотреть, что общего между этими двумя наборами.[10] Например, в психологическом тестировании можно взять два хорошо известных многомерных личностные тесты такой как Миннесотский многофазный опросник личности (MMPI-2) и НЕО. Увидев, как факторы MMPI-2 соотносятся с факторами NEO, можно было понять, какие измерения были общими между тестами и какая разница была общей. Например, можно обнаружить, что экстраверсия или невротизм Размерность составила значительную часть общих различий между двумя тестами.
Можно также использовать анализ канонической корреляции для создания уравнения модели, которое связывает два набора переменных, например, набор показателей эффективности и набор независимых переменных или набор выходных данных и набор входных данных. На такую модель могут быть наложены ограничения, чтобы гарантировать, что она отражает теоретические требования или интуитивно очевидные условия. Этот тип модели известен как модель максимальной корреляции.[11]
Визуализация результатов канонической корреляции обычно осуществляется с помощью гистограмм коэффициентов двух наборов переменных для пар канонических переменных, показывающих значительную корреляцию. Некоторые авторы предполагают, что их лучше всего визуализировать, построив их в виде гелиографов, кругового формата с лучевыми полосами, каждая половина которых представляет два набора переменных.[12]
Примеры
Позволять с нуля ожидаемое значение, т.е. . Если , т.е. и идеально коррелируют, то, например, и , так что первая (и только в этом примере) пара канонических переменных равна и . Если , т.е. и идеально антикоррелированы, то, например, и , так что первая (и только в этом примере) пара канонических переменных равна и . Заметим, что в обоих случаях , который показывает, что анализ канонической корреляции рассматривает коррелированные и антикоррелированные переменные одинаково.
Подключение к основным углам
При условии, что и иметь ноль ожидаемые значения, т.е. , их ковариация матрицы и можно рассматривать как Матрицы Грама в внутренний продукт для записей и , соответственно. В этой интерпретации случайные величины, записи из и из рассматриваются как элементы векторного пространства со скалярным продуктом, задаваемым ковариация ; увидеть Ковариация # Отношение к внутренним продуктам.
Определение канонических переменных и тогда эквивалентно определению главные векторы для пары подпространств, натянутых на элементы и в отношении этого внутренний продукт. Канонические соотношения равно косинус из главные углы.
Отбеливание и вероятностный канонический корреляционный анализ
CCA также можно рассматривать как особый отбеливающее преобразование где случайные векторы и одновременно трансформируются таким образом, что взаимная корреляция между белыми векторами и диагональный.[13]Канонические корреляции затем интерпретируются как коэффициенты регрессии, связывающие и а также может быть отрицательным. Представление регрессии CCA также обеспечивает способ построения вероятностной генеративной модели скрытых переменных для CCA с некоррелированными скрытыми переменными, представляющими разделяемую и не разделяемую изменчивость.
Смотрите также
- Обобщенная каноническая корреляция
- Мультилинейное подпространственное обучение
- Коэффициент RV
- Углы между квартирами
- Анализ главных компонентов
- Линейный дискриминантный анализ
- Регуляризованный канонический корреляционный анализ
- Разложение по сингулярным числам
- Частичная регрессия наименьших квадратов
использованная литература
- ^ Хердле, Вольфганг; Симар, Леопольд (2007). «Канонический корреляционный анализ». Прикладной многомерный статистический анализ. С. 321–330. CiteSeerX 10.1.1.324.403. Дои:10.1007/978-3-540-72244-1_14. ISBN 978-3-540-72243-4.
- ^ Кнапп, Т. Р. (1978). «Канонический корреляционный анализ: общая параметрическая система проверки значимости». Психологический бюллетень. 85 (2): 410–416. Дои:10.1037/0033-2909.85.2.410.
- ^ Хотеллинг, Х. (1936). «Отношения между двумя наборами вариантов». Биометрика. 28 (3–4): 321–377. Дои:10.1093 / biomet / 28.3-4.321. JSTOR 2333955.
- ^ Джордан, К. (1875). "Essai sur la géométrie à Габаритные размеры". Бык. Soc. Математика. Франция. 3: 103.
- ^ Hsu, D .; Какаде, С. М .; Чжан, Т. (2012). «Спектральный алгоритм для изучения скрытых марковских моделей» (PDF). Журнал компьютерных и системных наук. 78 (5): 1460. arXiv:0811.4413. Дои:10.1016 / j.jcss.2011.12.025.
- ^ Huang, S. Y .; Lee, M. H .; Сяо, К. К. (2009). «Нелинейные меры связи с каноническим корреляционным анализом ядра и приложениями» (PDF). Журнал статистического планирования и вывода. 139 (7): 2162. Дои:10.1016 / j.jspi.2008.10.011.
- ^ Князев, А.В .; Аргентати, M.E. (2002), "Главные углы между подпространствами в скалярном произведении на основе A: алгоритмы и оценки возмущений", Журнал SIAM по научным вычислениям, 23 (6): 2009–2041, CiteSeerX 10.1.1.73.2914, Дои:10.1137 / S1064827500377332
- ^ Канти В. Мардиа, Дж. Т. Кент и Дж. М. Бибби (1979). Многомерный анализ. Академическая пресса.
- ^ Ян Сонг, Питер Дж. Шрайер, Дэвид Рамирез и Танудж Хасиджа Канонический корреляционный анализ многомерных данных с поддержкой очень малых выборок arXiv:1604.02047
- ^ Sieranoja, S .; Сахидулла, штат Мэриленд; Киннунен, Т .; Komulainen, J .; Хадид, А. (июль 2018 г.). «Обнаружение аудиовизуальной синхронизации с оптимизированными звуковыми функциями» (PDF). IEEE 3rd Int. Конференция по обработке сигналов и изображений (ICSIP 2018).
- ^ Тофаллис, К. (1999). «Построение модели с множественными зависимыми переменными и ограничениями». Журнал Королевского статистического общества, серия D. 48 (3): 371–378. arXiv:1109.0725. Дои:10.1111/1467-9884.00195.
- ^ Дегани, А .; Шафто, М .; Олсон, Л. (2006). «Канонический корреляционный анализ: использование составных гелиографов для представления множественных паттернов» (PDF). Схематическое представление и вывод. Конспект лекций по информатике. 4045. п. 93. CiteSeerX 10.1.1.538.5217. Дои:10.1007/11783183_11. ISBN 978-3-540-35623-3.
- ^ Jendoubi, T .; Стриммер, К. (2018). «Отбеливающий подход к вероятностному каноническому корреляционному анализу для интеграции данных omics». BMC Bioinformatics. 20 (1): 15. arXiv:1802.03490. Дои:10.1186 / s12859-018-2572-9. ЧВК 6327589. PMID 30626338.
внешние ссылки
- Дискриминантный корреляционный анализ (DCA)[1] (MATLAB )
- Hardoon, D. R .; Szedmak, S .; Шоу-Тейлор, Дж. (2004). «Канонический корреляционный анализ: обзор в применении к методам обучения». Нейронные вычисления. 16 (12): 2639–2664. CiteSeerX 10.1.1.14.6452. Дои:10.1162/0899766042321814. PMID 15516276.
- Примечание о порядковом канонико-корреляционном анализе двух наборов рейтинговых оценок. (Также предоставляет FORTRAN программа) - в Journal of Quantitative Economics 7 (2), 2009 г., стр. 173–199.
- Канонический корреляционный анализ с ограничениями на представление: гибридизация канонической корреляции и анализа главных компонентов (Также предоставляет FORTRAN программа) - в Journal of Applied Economic Sciences 4 (1), 2009 г., стр. 115–124.
- ^ Хагигхат, Мохаммад; Абдель-Мотталеб, Мохамед; Алхалаби, Уэди (2016). «Дискриминантный корреляционный анализ: объединение уровней функций в реальном времени для мультимодального биометрического распознавания». IEEE Transactions по информационной криминалистике и безопасности. 11 (9): 1984–1996. Дои:10.1109 / TIFS.2016.2569061.