Фильтр Габора - Gabor filter

Пример двумерного фильтра Габора

В обработка изображений, а Фильтр Габора, названный в честь Деннис Габор, это линейный фильтр используется для текстура Анализ, что по сути означает, что он анализирует, есть ли какое-либо конкретное частотное содержание в изображении в определенных направлениях в локализованной области вокруг точки или области анализа. Представления частот и ориентации фильтров Габора утверждаются многими современными учеными, занимающимися зрением, как аналогичные представлениям фильтров Габора. зрительная система человека.[1] Было обнаружено, что они особенно подходят для представления текстуры и различения. В пространственной области 2D-фильтр Габора представляет собой Гауссовский функция ядра модулируется синусоидальный плоская волна (увидеть Преобразование Габора ).

Некоторые авторы утверждают, что простые клетки в зрительная кора из мозг млекопитающих можно моделировать функциями Габора.[2][3] Таким образом, анализ изображений с фильтрами Габора, по мнению некоторых, аналогичны восприятию в зрительная система человека.

Определение

это импульсивный ответ определяется синусоидальный волна (а плоская волна для 2D-фильтров Габора), умноженное на Функция Гаусса.[4]Из-за свойства умножения-свертки (Теорема свертки ), преобразование Фурье импульсной характеристики фильтра Габора является свертка преобразования Фурье гармонической функции (синусоидальной функции) и преобразования Фурье функции Гаусса. Фильтр имеет действительную и мнимую составляющие, представляющие ортогональный направления.[5] Эти два компонента могут быть сформированы в комплексное число или используются индивидуально.

Сложный

Реальный

Воображаемый

где

и

В этом уравнении представляет длину волны синусоидального фактора, представляет ориентацию нормали к параллельным полосам Функция Габора, фазовый сдвиг, - сигма / стандартное отклонение гауссовой огибающей и является пространственным соотношением сторон и определяет эллиптичность опоры функции Габора.

Вейвлет-пространство

Демонстрация применения фильтра Габора к китайскому OCR. Справа показаны четыре ориентации: 0 °, 45 °, 90 ° и 135 °. Слева показано исходное изображение персонажа и наложение всех четырех ориентаций.

Фильтры Габора напрямую связаны с Вейвлеты Габора, поскольку они могут быть рассчитаны на несколько расширений и поворотов. Однако, как правило, разложение не применяется для вейвлетов Габора, поскольку это требует вычисления биортогональных вейвлетов, что может занять очень много времени. Поэтому обычно создается набор фильтров, состоящий из фильтров Габора с различными масштабами и поворотами. Фильтры сворачиваются с сигналом, в результате получается так называемое пространство Габора. Этот процесс тесно связан с процессами в первичной зрительная кора.[6]Джонс и Палмер показали, что реальная часть сложной функции Габора хорошо согласуется с весовыми функциями рецептивного поля, обнаруженными в простых клетках полосатой коры головного мозга кошки.[7]

Извлечение функций из изображений

Набор фильтров Габора с разными частотами и ориентациями может быть полезен для извлечения полезных функций из изображения.[8] В дискретной области двумерные фильтры Габора имеют вид

где B и C - нормализующие коэффициенты, которые необходимо определить.

Двухмерные фильтры Габора находят широкое применение в обработке изображений, особенно в извлечение признаков для анализа текстур и сегментации.[9] определяет частоту, которую ищут в текстуре. Изменяя , мы можем искать текстуру, ориентированную в определенном направлении. Изменяя , мы меняем опору основы или размер анализируемой области изображения.

Применение двумерных фильтров Габора в обработке изображений

При обработке изображений документа функции Gabor идеально подходят для определения написания слова в многоязычном документе.[10] Фильтры Габора с разными частотами и ориентацией в разных направлениях использовались для локализации и извлечения областей, содержащих только текст, из сложных изображений документа (как серых, так и цветных), поскольку текст богат высокочастотными компонентами, тогда как изображения имеют относительно гладкий характер.[11][12][13] Он также применялся для распознавания выражения лица. [14]Фильтры Габора также широко используются в приложениях для анализа образов. Например, он был использован для изучения распределения направленности внутри пористой губчатой трабекулярный кость в позвоночник.[15] Пространство Габора очень полезно в обработка изображений такие приложения, как оптическое распознавание символов, распознавание радужной оболочки глаза и распознавание отпечатков пальцев. Отношения между активациями для определенного пространственного положения очень различны между объектами на изображении. Кроме того, важные активации могут быть извлечены из пространства Габора для создания разреженного представления объекта.

Примеры реализации

(Код для извлечения функции Gabor из изображений в MATLAB можно найти на http://www.mathworks.com/matlabcentral/fileexchange/44630.)

Это пример реализации в Python:

импорт тупой так как нпdef Габор(сигма, тета, Лямбда, psi, гамма):    "" "Извлечение признаков Габора." ""    sigma_x = сигма    sigma_y = плавать(сигма) / гамма    # Ограничительная рамка    nstds = 3  # Количество стандартного отклонения сигмы    xmax = Максимум(пресс(nstds * sigma_x * нп.потому что(тета)), пресс(nstds * sigma_y * нп.грех(тета)))    xmax = нп.потолок(Максимум(1, xmax))    ymax = Максимум(пресс(nstds * sigma_x * нп.грех(тета)), пресс(nstds * sigma_y * нп.потому что(тета)))    ymax = нп.потолок(Максимум(1, ymax))    xmin = -xmax    ymin = -ymax    (у, Икс) = нп.сетка(нп.оранжевая(ymin, ymax + 1), нп.оранжевая(xmin, xmax + 1))    # Вращение    x_theta = Икс * нп.потому что(тета) + у * нп.грех(тета)    y_theta = -Икс * нп.грех(тета) + у * нп.потому что(тета)    gb = нп.exp(-.5 * (x_theta ** 2 / sigma_x ** 2 + y_theta ** 2 / sigma_y ** 2)) * нп.потому что(2 * нп.Пи / Лямбда * x_theta + psi)    вернуть gb

Для реализации на изображениях см. [1].

Это пример реализации в MATLAB /Октава:

функцияgb=gabor_fn(сигма, тета, лямбда, пси, гамма)sigma_x = сигма;sigma_y = сигма / гамма;% Ограничительная рамкаnstds = 3;xmax = Максимум(пресс(nstds * sigma_x * потому что(тета)), пресс(nstds * sigma_y * грех(тета)));xmax = потолок(Максимум(1, xmax));ymax = Максимум(пресс(nstds * sigma_x * грех(тета)), пресс(nstds * sigma_y * потому что(тета)));ymax = потолок(Максимум(1, ymax));xmin = -xmax; ymin = -ymax;[Икс,у] = сетка(xmin:xmax, ymin:ymax);% Вращения x_theta = Икс * потому что(тета) + у * грех(тета);y_theta = -Икс * грех(тета) + у * потому что(тета);gb = exp(-.5*(x_theta.^2/sigma_x^2+y_theta.^2/sigma_y^2)).*потому что(2*Пи/лямбда*x_theta+psi);

Это еще один пример реализации в Haskell:

импорт Data.Complex (Сложный((:+)))Габор λ θ ψ σ γ Икс у = exp ( (-0.5) * ((Икс'^2 + γ^2*y '^2) / (σ^2)) :+ 0) * exp ( 0 :+ (2*Пи*Икс'/λ+ψ) )    где Икс' =  Икс * потому что θ + у * грех θ          y ' = -Икс * грех θ + у * потому что θ

(Заметка: а: + б следует читать как )

Смотрите также

использованная литература

  1. ^ Ольсхаузен Б. А. и Филд Д. Дж. (1996). «Появление свойств рецептивного поля простых клеток путем изучения разреженного кода для естественных изображений». Природа. 381 (6583): 607–609. Bibcode:1996Натура.381..607O. Дои:10.1038 / 381607a0. PMID  8637596. S2CID  4358477.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  2. ^ Марчеля, С. (1980). «Математическое описание ответов простых корковых клеток». Журнал Оптического общества Америки. 70 (11): 1297–1300. Bibcode:1980JOSA ... 70.1297M. Дои:10.1364 / JOSA.70.001297. PMID  7463179.
  3. ^ Даугман, Джон Г. (1985-07-01). «Отношение неопределенности для разрешения в пространстве, пространственной частоты и ориентации, оптимизированных двумерными визуальными кортикальными фильтрами». Журнал Оптического общества Америки A. 2 (7): 1160–9. Bibcode:1985JOSAA ... 2.1160D. CiteSeerX  10.1.1.465.8506. Дои:10.1364 / JOSAA.2.001160. ISSN  1084-7529. PMID  4020513.
  4. ^ Fogel, I .; Саги, Д. (июнь 1989 г.). «Фильтры Габора как дискриминатор текстуры». Биологическая кибернетика. 61 (2). CiteSeerX  10.1.1.367.2700. Дои:10.1007 / BF00204594. ISSN  0340-1200. OCLC  895625214. S2CID  14952808.
  5. ^ Трехмерное отслеживание поверхности и аппроксимация с использованием фильтров Габора, Джеспер Юул Хенриксен, Университет Южной Дании, 28 марта 2007 г.
  6. ^ Даугман, Дж. (1980), "Двумерный спектральный анализ профилей рецептивного поля коры", Vision Res., 20 (10): 847–56, Дои:10.1016/0042-6989(80)90065-6, PMID  7467139, S2CID  40518532
  7. ^ Jones, J.P .; Палмер, Л.А. (1987). «Оценка двухмерной модели фильтра Габора простых рецептивных полей в полосатом коре головного мозга кошки» (PDF). J. Neurophysiol. 58 (6): 1233–1258. Дои:10.1152 / jn.1987.58.6.1233. PMID  3437332. S2CID  16809045.
  8. ^ Haghighat, M .; Зоноуз, С .; Абдель-Мотталеб, М. (2013). «Идентификация с использованием зашифрованной биометрии». Компьютерный анализ изображений и паттернов. Конспект лекций по информатике. 8048. п. 440. Дои:10.1007/978-3-642-40246-3_55. ISBN  978-3-642-40245-6.
  9. ^ Рамакришнан, А.Г .; Kumar Raja, S .; Рагху Рам, H.V. (2002). «Сегментация текстур на основе нейронных сетей с использованием функций Габора» (PDF). Труды 12-го семинара IEEE по нейронным сетям для обработки сигналов. Мартиньи, Швейцария: IEEE: 365–374. Дои:10.1109 / ННСП.2002.1030048. ISBN  978-0-7803-7616-8. OCLC  812617471. S2CID  10994982.
  10. ^ Пати, Пит Баса; Рамакришнан, А.Г. (июль 2008 г.). «Многословная идентификация на уровне слов». Письма с распознаванием образов. 29 (9): 1218–1229. Дои:10.1016 / j.patrec.2008.01.027. ISSN  0167-8655.
  11. ^ Raju S, S .; Pati, P.B .; Рамакришнан, А.Г. (2004). «Анализ энергии блоков на основе фильтра Габора для извлечения текста из изображений цифрового документа» (PDF). Первый международный семинар по анализу изображений документов для библиотек, 2004 г. Труды. Пало-Альто, Калифорния, США: IEEE: 233–243. Дои:10.1109 / DIAL.2004.1263252. ISBN  978-0-7695-2088-9. LCCN  2003116308. ПР  8067708M. S2CID  21856192.
  12. ^ Раджу, С. Сабари; Pati, P. B .; Рамакришнан А.Г. (2005). «Локализация текста и извлечение из сложных цветных изображений». Конспект лекций по информатике. 3804: 486–493. Дои:10.1007/11595755_59. ISBN  978-3-540-30750-1. ISSN  0302-9743. LCCN  2005936803. ПР  9056158M.
  13. ^ Сабари Раджу, П. Б. Пати и А. Г. Рамакришнан, «Локализация текста и извлечение из сложных цветных изображений», Proc. Первая международная конференция по достижениям в области визуальных вычислений (ISVC05), Невада, США, LNCS 3804, Springer Verlag, 5-7 декабря 2005 г., стр. 486-493.
  14. ^ Lyons, M .; Akamatsu, S .; Камачи, М .; Гёба, Дж. (1998). Кодирование мимики с помощью вейвлетов Габора. С. 200–205. Дои:10.1109 / AFGR.1998.670949. ISBN  0-8186-8344-9. ПР  11390549M. S2CID  1586662.
  15. ^ Gdyczynski, C.M .; Manbachi, A .; и другие. (2014). «Об оценке распределения направленности в трабекулярной кости ножки по изображениям микро-КТ». Журнал физиологических измерений. 35 (12): 2415–2428. Bibcode:2014ФИМ ... 35.2415G. Дои:10.1088/0967-3334/35/12/2415. PMID  25391037.

внешние ссылки

дальнейшее чтение