Фильтр Габора - Gabor filter
эта статья может быть слишком техническим для большинства читателей, чтобы понять. Пожалуйста помогите улучшить это к сделать понятным для неспециалистов, не снимая технических деталей. (Февраль 2017 г.) (Узнайте, как и когда удалить этот шаблон сообщения) |
В обработка изображений, а Фильтр Габора, названный в честь Деннис Габор, это линейный фильтр используется для текстура Анализ, что по сути означает, что он анализирует, есть ли какое-либо конкретное частотное содержание в изображении в определенных направлениях в локализованной области вокруг точки или области анализа. Представления частот и ориентации фильтров Габора утверждаются многими современными учеными, занимающимися зрением, как аналогичные представлениям фильтров Габора. зрительная система человека.[1] Было обнаружено, что они особенно подходят для представления текстуры и различения. В пространственной области 2D-фильтр Габора представляет собой Гауссовский функция ядра модулируется синусоидальный плоская волна (увидеть Преобразование Габора ).
Некоторые авторы утверждают, что простые клетки в зрительная кора из мозг млекопитающих можно моделировать функциями Габора.[2][3] Таким образом, анализ изображений с фильтрами Габора, по мнению некоторых, аналогичны восприятию в зрительная система человека.
Определение
В этом разделе фактическая точность оспаривается.Февраль 2013) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
это импульсивный ответ определяется синусоидальный волна (а плоская волна для 2D-фильтров Габора), умноженное на Функция Гаусса.[4]Из-за свойства умножения-свертки (Теорема свертки ), преобразование Фурье импульсной характеристики фильтра Габора является свертка преобразования Фурье гармонической функции (синусоидальной функции) и преобразования Фурье функции Гаусса. Фильтр имеет действительную и мнимую составляющие, представляющие ортогональный направления.[5] Эти два компонента могут быть сформированы в комплексное число или используются индивидуально.
Сложный
Реальный
Воображаемый
где
и
В этом уравнении представляет длину волны синусоидального фактора, представляет ориентацию нормали к параллельным полосам Функция Габора, фазовый сдвиг, - сигма / стандартное отклонение гауссовой огибающей и является пространственным соотношением сторон и определяет эллиптичность опоры функции Габора.
Вейвлет-пространство
Фильтры Габора напрямую связаны с Вейвлеты Габора, поскольку они могут быть рассчитаны на несколько расширений и поворотов. Однако, как правило, разложение не применяется для вейвлетов Габора, поскольку это требует вычисления биортогональных вейвлетов, что может занять очень много времени. Поэтому обычно создается набор фильтров, состоящий из фильтров Габора с различными масштабами и поворотами. Фильтры сворачиваются с сигналом, в результате получается так называемое пространство Габора. Этот процесс тесно связан с процессами в первичной зрительная кора.[6]Джонс и Палмер показали, что реальная часть сложной функции Габора хорошо согласуется с весовыми функциями рецептивного поля, обнаруженными в простых клетках полосатой коры головного мозга кошки.[7]
Извлечение функций из изображений
Набор фильтров Габора с разными частотами и ориентациями может быть полезен для извлечения полезных функций из изображения.[8] В дискретной области двумерные фильтры Габора имеют вид
где B и C - нормализующие коэффициенты, которые необходимо определить.
Двухмерные фильтры Габора находят широкое применение в обработке изображений, особенно в извлечение признаков для анализа текстур и сегментации.[9] определяет частоту, которую ищут в текстуре. Изменяя , мы можем искать текстуру, ориентированную в определенном направлении. Изменяя , мы меняем опору основы или размер анализируемой области изображения.
Применение двумерных фильтров Габора в обработке изображений
При обработке изображений документа функции Gabor идеально подходят для определения написания слова в многоязычном документе.[10] Фильтры Габора с разными частотами и ориентацией в разных направлениях использовались для локализации и извлечения областей, содержащих только текст, из сложных изображений документа (как серых, так и цветных), поскольку текст богат высокочастотными компонентами, тогда как изображения имеют относительно гладкий характер.[11][12][13] Он также применялся для распознавания выражения лица. [14]Фильтры Габора также широко используются в приложениях для анализа образов. Например, он был использован для изучения распределения направленности внутри пористой губчатой трабекулярный кость в позвоночник.[15] Пространство Габора очень полезно в обработка изображений такие приложения, как оптическое распознавание символов, распознавание радужной оболочки глаза и распознавание отпечатков пальцев. Отношения между активациями для определенного пространственного положения очень различны между объектами на изображении. Кроме того, важные активации могут быть извлечены из пространства Габора для создания разреженного представления объекта.
Примеры реализации
(Код для извлечения функции Gabor из изображений в MATLAB можно найти на http://www.mathworks.com/matlabcentral/fileexchange/44630.)
Это пример реализации в Python:
импорт тупой так как нпdef Габор(сигма, тета, Лямбда, psi, гамма): "" "Извлечение признаков Габора." "" sigma_x = сигма sigma_y = плавать(сигма) / гамма # Ограничительная рамка nstds = 3 # Количество стандартного отклонения сигмы xmax = Максимум(пресс(nstds * sigma_x * нп.потому что(тета)), пресс(nstds * sigma_y * нп.грех(тета))) xmax = нп.потолок(Максимум(1, xmax)) ymax = Максимум(пресс(nstds * sigma_x * нп.грех(тета)), пресс(nstds * sigma_y * нп.потому что(тета))) ymax = нп.потолок(Максимум(1, ymax)) xmin = -xmax ymin = -ymax (у, Икс) = нп.сетка(нп.оранжевая(ymin, ymax + 1), нп.оранжевая(xmin, xmax + 1)) # Вращение x_theta = Икс * нп.потому что(тета) + у * нп.грех(тета) y_theta = -Икс * нп.грех(тета) + у * нп.потому что(тета) gb = нп.exp(-.5 * (x_theta ** 2 / sigma_x ** 2 + y_theta ** 2 / sigma_y ** 2)) * нп.потому что(2 * нп.Пи / Лямбда * x_theta + psi) вернуть gb
Для реализации на изображениях см. [1].
Это пример реализации в MATLAB /Октава:
функцияgb=gabor_fn(сигма, тета, лямбда, пси, гамма)sigma_x = сигма;sigma_y = сигма / гамма;% Ограничительная рамкаnstds = 3;xmax = Максимум(пресс(nstds * sigma_x * потому что(тета)), пресс(nstds * sigma_y * грех(тета)));xmax = потолок(Максимум(1, xmax));ymax = Максимум(пресс(nstds * sigma_x * грех(тета)), пресс(nstds * sigma_y * потому что(тета)));ymax = потолок(Максимум(1, ymax));xmin = -xmax; ymin = -ymax;[Икс,у] = сетка(xmin:xmax, ymin:ymax);% Вращения x_theta = Икс * потому что(тета) + у * грех(тета);y_theta = -Икс * грех(тета) + у * потому что(тета);gb = exp(-.5*(x_theta.^2/sigma_x^2+y_theta.^2/sigma_y^2)).*потому что(2*Пи/лямбда*x_theta+psi);
Это еще один пример реализации в Haskell:
импорт Data.Complex (Сложный((:+)))Габор λ θ ψ σ γ Икс у = exp ( (-0.5) * ((Икс'^2 + γ^2*y '^2) / (σ^2)) :+ 0) * exp ( 0 :+ (2*Пи*Икс'/λ+ψ) ) где Икс' = Икс * потому что θ + у * грех θ y ' = -Икс * грех θ + у * потому что θ
(Заметка: а: + б
следует читать как )
Смотрите также
использованная литература
- ^ Ольсхаузен Б. А. и Филд Д. Дж. (1996). «Появление свойств рецептивного поля простых клеток путем изучения разреженного кода для естественных изображений». Природа. 381 (6583): 607–609. Bibcode:1996Натура.381..607O. Дои:10.1038 / 381607a0. PMID 8637596. S2CID 4358477.CS1 maint: несколько имен: список авторов (ссылка на сайт)
- ^ Марчеля, С. (1980). «Математическое описание ответов простых корковых клеток». Журнал Оптического общества Америки. 70 (11): 1297–1300. Bibcode:1980JOSA ... 70.1297M. Дои:10.1364 / JOSA.70.001297. PMID 7463179.
- ^ Даугман, Джон Г. (1985-07-01). «Отношение неопределенности для разрешения в пространстве, пространственной частоты и ориентации, оптимизированных двумерными визуальными кортикальными фильтрами». Журнал Оптического общества Америки A. 2 (7): 1160–9. Bibcode:1985JOSAA ... 2.1160D. CiteSeerX 10.1.1.465.8506. Дои:10.1364 / JOSAA.2.001160. ISSN 1084-7529. PMID 4020513.
- ^ Fogel, I .; Саги, Д. (июнь 1989 г.). «Фильтры Габора как дискриминатор текстуры». Биологическая кибернетика. 61 (2). CiteSeerX 10.1.1.367.2700. Дои:10.1007 / BF00204594. ISSN 0340-1200. OCLC 895625214. S2CID 14952808.
- ^ Трехмерное отслеживание поверхности и аппроксимация с использованием фильтров Габора, Джеспер Юул Хенриксен, Университет Южной Дании, 28 марта 2007 г.
- ^ Даугман, Дж. (1980), "Двумерный спектральный анализ профилей рецептивного поля коры", Vision Res., 20 (10): 847–56, Дои:10.1016/0042-6989(80)90065-6, PMID 7467139, S2CID 40518532
- ^ Jones, J.P .; Палмер, Л.А. (1987). «Оценка двухмерной модели фильтра Габора простых рецептивных полей в полосатом коре головного мозга кошки» (PDF). J. Neurophysiol. 58 (6): 1233–1258. Дои:10.1152 / jn.1987.58.6.1233. PMID 3437332. S2CID 16809045.
- ^ Haghighat, M .; Зоноуз, С .; Абдель-Мотталеб, М. (2013). «Идентификация с использованием зашифрованной биометрии». Компьютерный анализ изображений и паттернов. Конспект лекций по информатике. 8048. п. 440. Дои:10.1007/978-3-642-40246-3_55. ISBN 978-3-642-40245-6.
- ^ Рамакришнан, А.Г .; Kumar Raja, S .; Рагху Рам, H.V. (2002). «Сегментация текстур на основе нейронных сетей с использованием функций Габора» (PDF). Труды 12-го семинара IEEE по нейронным сетям для обработки сигналов. Мартиньи, Швейцария: IEEE: 365–374. Дои:10.1109 / ННСП.2002.1030048. ISBN 978-0-7803-7616-8. OCLC 812617471. S2CID 10994982.
- ^ Пати, Пит Баса; Рамакришнан, А.Г. (июль 2008 г.). «Многословная идентификация на уровне слов». Письма с распознаванием образов. 29 (9): 1218–1229. Дои:10.1016 / j.patrec.2008.01.027. ISSN 0167-8655.
- ^ Raju S, S .; Pati, P.B .; Рамакришнан, А.Г. (2004). «Анализ энергии блоков на основе фильтра Габора для извлечения текста из изображений цифрового документа» (PDF). Первый международный семинар по анализу изображений документов для библиотек, 2004 г. Труды. Пало-Альто, Калифорния, США: IEEE: 233–243. Дои:10.1109 / DIAL.2004.1263252. ISBN 978-0-7695-2088-9. LCCN 2003116308. ПР 8067708M. S2CID 21856192.
- ^ Раджу, С. Сабари; Pati, P. B .; Рамакришнан А.Г. (2005). «Локализация текста и извлечение из сложных цветных изображений». Конспект лекций по информатике. 3804: 486–493. Дои:10.1007/11595755_59. ISBN 978-3-540-30750-1. ISSN 0302-9743. LCCN 2005936803. ПР 9056158M.
- ^ Сабари Раджу, П. Б. Пати и А. Г. Рамакришнан, «Локализация текста и извлечение из сложных цветных изображений», Proc. Первая международная конференция по достижениям в области визуальных вычислений (ISVC05), Невада, США, LNCS 3804, Springer Verlag, 5-7 декабря 2005 г., стр. 486-493.
- ^ Lyons, M .; Akamatsu, S .; Камачи, М .; Гёба, Дж. (1998). Кодирование мимики с помощью вейвлетов Габора. С. 200–205. Дои:10.1109 / AFGR.1998.670949. ISBN 0-8186-8344-9. ПР 11390549M. S2CID 1586662.
- ^ Gdyczynski, C.M .; Manbachi, A .; и другие. (2014). «Об оценке распределения направленности в трабекулярной кости ножки по изображениям микро-КТ». Журнал физиологических измерений. 35 (12): 2415–2428. Bibcode:2014ФИМ ... 35.2415G. Дои:10.1088/0967-3334/35/12/2415. PMID 25391037.
внешние ссылки
- Код MATLAB для фильтров Габора и извлечения признаков Габора
- 3D Габор продемонстрировал с помощью Mathematica
- реализация log-Gabors на python для неподвижных изображений
- Фильтр Габора для обработки изображений и компьютерного зрения (демонстрация)
дальнейшее чтение
- Файхтингер, Ханс Г.; Strohmer, Thomas, eds. (1998). Анализ и алгоритмы Габора: теория и приложения. Бостон: Биркхойзер. ISBN 0-8176-3959-4. LCCN 97032252. OCLC 37761814. ПР 685385M.
- Грёчениг, Карлхайнц (2001). Основы частотно-временного анализа: с 15 цифрами. Прикладной и численный гармонический анализ. Бостон: Биркхойзер. Дои:10.1007/978-1-4612-0003-1. ISBN 0-8176-4022-3. LCCN 00044508. OCLC 44420790. ПР 8074618M.
- Даугман, Дж. (1988). «Полное дискретное двухмерное преобразование Габора с помощью нейронных сетей для анализа и сжатия изображений» (PDF). Транзакции IEEE по акустике, речи и обработке сигналов. 36 (7): 1169–1179. CiteSeerX 10.1.1.371.5847. Дои:10.1109/29.1644. ISSN 0096-3518.
- "Онлайн-демонстрация фильтра Габора". Архивировано из оригинал на 2009-06-15. Получено 2009-05-25.
- Мовеллан, Хавьер Р. «Учебник по фильтрам Габора» (PDF). Архивировано из оригинал (PDF) на 2009-04-19. Получено 2008-05-14.
- Лагаэ, Арес; Лефевр, Сильвен; Дреттакис, Джордж; Дютре, Филипп (2009). «Процедурный шум с использованием разреженной свертки Габора». Транзакции ACM на графике. 28 (3): 1. CiteSeerX 10.1.1.232.5566. Дои:10.1145/1531326.1531360. Получено 2009-09-12.
- Управляемые пирамиды:
- Страница Ээро Симончелли на Управляемые пирамиды
- Manduchi, R .; Perona, P .; Шай, Д. (апрель 1998 г.). «Эффективные деформируемые блоки фильтров» (PDF). Транзакции IEEE при обработке сигналов. 46 (4): 1168–1173. Bibcode:1998ITSP ... 46.1168M. Дои:10.1109/78.668570. ISSN 1053-587X. OCLC 926890247. (PDF ) (Код )
- Фишер, Сильвен; Шроубек, Филип; Perrinet, Laurent; Редондо, Рафаэль; Кристобаль, Габриэль (2007). "Самоинвертируемые двумерные вейвлеты лог-Габора" (PDF). Международный журнал компьютерного зрения. 75 (2): 231–246. CiteSeerX 10.1.1.329.6283. Дои:10.1007 / s11263-006-0026-8. ISSN 0920-5691. S2CID 1452724.