Модель распределения точек - Point distribution model
В модель распределения точек представляет собой модель для представления средней геометрии фигуры и некоторых статистических режимов геометрической вариации, выведенных из обучающего набора фигур.
Фон
Концепция модели распределения точек была разработана Кутсом,[1] Тейлор и другие.[2] и стал стандартом в компьютерное зрение для статистическое исследование формы[3] и для сегментация из медицинские изображения[2] где априорность формы действительно помогает интерпретировать шумные и малоконтрастные пиксели /воксели. Последний пункт приводит к активные модели формы (ASM) и модели активного внешнего вида (ААМ).
Модели распределения точек полагаются на ориентиры. Ориентир - это точка аннотации, поставленная анатомом на заданное место для каждого экземпляра формы в популяции обучающего набора. Например, тот же ориентир будет обозначать верхушку указательный палец в тренировочном наборе 2D контуров рук. Анализ главных компонентов (PCA), например, является подходящим инструментом для изучения корреляций движения между группами ориентиров среди населения обучающей выборки. Как правило, он может обнаружить, что все ориентиры, расположенные вдоль одного пальца, перемещаются точно вместе в примерах обучающего набора, показывая разное расстояние между пальцами для коллекции рук с плоскими положениями.
Подробности
Во-первых, на набор обучающих изображений вручную наносят ориентиры с достаточным количеством соответствующих ориентиров, чтобы в достаточной степени аппроксимировать геометрию исходных форм. Эти ориентиры выравниваются с помощью обобщенный анализ прокрастов, что минимизирует ошибку наименьшего квадрата между точками.
выровненные ориентиры в двух измерениях представлены как
- .
Важно отметить, что каждый ориентир должен представлять одно и то же анатомическое расположение. Например, ориентир №3, может представлять кончик безымянного пальца на всех обучающих изображениях.
Теперь очертания фигур сведены к последовательностям ориентиры, так что данная обучающая фигура определяется как вектор . Предполагая, что рассеяние равно гауссовский в этом пространстве PCA используется для вычисления нормализованных собственные векторы и собственные значения из ковариационная матрица во всех формах обучения. Матрица верха собственные векторы задаются как , и каждый собственный вектор описывает основную моду изменения вдоль множества.
Наконец, линейная комбинация собственных векторов используется для определения новой формы , математически определяется как:
куда определяется как средняя форма по всем обучающим изображениям, и - вектор масштабных значений для каждого главного компонента. Следовательно, изменяя переменную можно определить бесконечное количество форм. Чтобы гарантировать, что все новые формы находятся в пределах вариации, наблюдаемой в обучающем наборе, обычно разрешается только каждый элемент быть внутри 3 стандартных отклонения, где стандартное отклонение заданного главного компонента определяется как квадратный корень из соответствующего собственного значения.
PDM можно расширить до любого произвольного количества измерений, но обычно они используются в приложениях для 2D-изображений и 3D-объемов (где каждая точка ориентира или же ).
Обсуждение
Собственный вектор, интерпретируемый в евклидово пространство, можно рассматривать как последовательность евклидовы векторы, связанные с соответствующим ориентиром и обозначающие составное движение для всей фигуры. Глобальные нелинейные вариации обычно хорошо обрабатываются, если нелинейные вариации поддерживаются на разумном уровне. Обычно скрутка нематода червь используется в качестве примера в обучении ядро PCA -основанные методы.
Благодаря свойствам PCA: собственные векторы взаимно ортогональный, образуют основу облака обучающего набора в пространстве формы и пересекают точку 0 в этом пространстве, которая представляет собой среднюю форму. Кроме того, PCA - это традиционный способ подгонки замкнутого эллипсоида к гауссовскому облаку точек (независимо от их размера): это предполагает концепцию ограниченной вариации.
Идея PDM заключается в том, что собственные векторы можно линейно комбинировать для создания бесконечного количества новых экземпляров форм, которые будут «выглядеть» как один в обучающем наборе. Коэффициенты ограничены так же, как и значения соответствующих собственных значений, чтобы гарантировать, что сгенерированная 2n / 3n-мерная точка останется в гиперэллипсоидальной разрешенной области -допустимая область формы (ASD).[2]
Смотрите также
Рекомендации
- ^ Т. Ф. Кутс (май 2004 г.), Статистические модели внешнего вида для компьютерного зрения (PDF)
- ^ а б c Д. Х. Купер; Т.Ф. Кутс; Си Джей Тейлор; Дж. Грэм (1995), "Активные модели формы - их обучение и применение", Компьютерное зрение и понимание изображений (61): 38–59
- ^ Родри Х. Дэвис и Кэрол Дж. Твининг и П. Дэниел Аллен, Тим Ф. Кутс и Крис Дж. Тейлор (2003 г.), Дискриминация формы в гиппокампе с использованием модели MDL, заархивировано из оригинал на 2008-10-08, получено 2007-07-27
внешняя ссылка
- Гибкие модели для компьютерного зрения, Тим Кутс, Манчестерский университет.
- Практическое введение в PDM и ASM.