Ускоренные надежные функции - Speeded up robust features

В компьютерное зрение, ускоренные надежные функции (СЕРФ) является запатентованным местным детектор особенностей и дескриптор. Его можно использовать для таких задач, как распознавание объекта, регистрация изображения, классификация, или же 3D реконструкция. Частично он вдохновлен масштабно-инвариантное преобразование признаков (SIFT) дескриптор. Стандартная версия SURF в несколько раз быстрее, чем SIFT, и, как утверждают ее авторы, более устойчива к различным преобразованиям изображений, чем SIFT.

Для обнаружения точек интереса SURF использует целочисленное приближение определитель гессиана детектор капель, который может быть вычислен с помощью 3 целочисленных операций с использованием предварительно вычисленного целостный образ. Его дескриптор функции основан на сумме Вейвлет Хаара ответ вокруг интересующей точки. Их также можно вычислить с помощью интегрального изображения.

Дескрипторы SURF использовались для поиска и распознавания объектов, людей или лиц, для реконструкции трехмерных сцен, для отслеживания объектов и для извлечения достопримечательностей.

SURF был впервые опубликован Герберт Бэй, Tinne Tuytelaars и Luc Van Gool, представленные на выставке 2006 г. Европейская конференция по компьютерному зрению. Применение алгоритма запатентовано в США.[1] «Вертикальная» версия SURF (называемая U-SURF) не инвариантна к вращению изображения и, следовательно, быстрее вычисляется и лучше подходит для приложений, где камера остается более или менее горизонтальной.

Изображение преобразуется в координаты с помощью пирамидальная техника с несколькими разрешениями, чтобы скопировать исходное изображение с пирамидальным гауссовым или Лапласианская пирамида shape для получения изображения того же размера, но с меньшей пропускной способностью. Таким образом достигается особый эффект размытия исходного изображения, называемый «Масштаб-пространство», и гарантируется, что интересующие точки не изменятся в масштабе.

Алгоритм и особенности

Алгоритм SURF основан на тех же принципах и шагах, что и SIFT; но детали на каждом этапе разные. Алгоритм состоит из трех основных частей: обнаружение точек интереса, описание местного района и сопоставление.

Обнаружение

SURF использует квадратные фильтры как приближение Гауссово сглаживание. (Подход SIFT использует каскадные фильтры для обнаружения масштабно-инвариантных характеристических точек, где разность гауссианов (DoG) вычисляется для масштабированных изображений постепенно.) Фильтрация изображения с квадратом выполняется намного быстрее, если целостный образ используется:

Сумму исходного изображения внутри прямоугольника можно быстро оценить с помощью интегрального изображения, что потребует оценки в четырех углах прямоугольника.

SURF использует детектор капель на основе Матрица Гессе чтобы найти достопримечательности. В детерминант матрицы Гессе используется как мера локального изменения вокруг точки, и выбираются точки, в которых этот определитель максимален. В отличие от детектора Гессе-Лапласа Миколайчика и Шмида, SURF также использует детерминант Гессе для выбора масштаба, как это также сделал Линдеберг. Для точки p = (x, y) на изображении I матрица Гессе H (p, σ) в точке p и масштабе σ равна:

куда и т. д. - свертка второй производной гауссиана с изображением в момент .

Ящичный фильтр размером 9 × 9 представляет собой аппроксимацию гауссиана с σ = 1,2 и представляет самый низкий уровень (самое высокое пространственное разрешение) для карт отклика blob.

Масштабно-пространственное представление и расположение достопримечательностей

Интересные моменты можно найти в разных масштабах, отчасти потому, что для поиска соответствий часто требуются сравнительные изображения, на которых они видны в разных масштабах. В других алгоритмах обнаружения признаков масштабное пространство обычно реализуется в виде пирамиды изображений. Изображения многократно сглаживаются с помощью фильтра Гаусса, затем они подвергаются субдискретизации, чтобы получить следующий более высокий уровень пирамиды. Поэтому рассчитывается несколько этажей или лестниц с различными размерами масок:

Пространство шкалы разделено на несколько октав, где октава относится к серии карт отклика, покрывающих удвоение шкалы. В SURF самый низкий уровень масштабного пространства получается на выходе фильтров 9 × 9.

Следовательно, в отличие от предыдущих методов, масштабные пространства в SURF реализуются путем применения прямоугольных фильтров разных размеров. Соответственно, масштабное пространство анализируется путем увеличения размера фильтра, а не итеративного уменьшения размера изображения. Результат вышеупомянутого фильтра 9 × 9 рассматривается как начальный масштабный слой в масштабе s = 1,2 (соответствует гауссовским производным с σ = 1,2). Следующие слои получаются путем фильтрации изображения с постепенно увеличивающимися масками, принимая во внимание дискретный характер целостных изображений и особую структуру фильтра. В результате получаются фильтры размером 9 × 9, 15 × 15, 21 × 21, 27 × 27, .... Для локализации точек интереса на изображении и в больших масштабах применяется не максимальное подавление в окрестности 3 × 3 × 3. . Максимумы определителя матрицы Гессе затем интерполируются в масштабе и пространстве изображения с помощью метода, предложенного Брауном и др. Интерполяция шкалы в пространстве особенно важна в этом случае, поскольку разница в шкале между первыми слоями каждой октавы относительно велика.

Дескриптор

Цель дескриптора - предоставить уникальное и надежное описание изображения. особенность, например, описывая распределение интенсивности пикселей в окрестности интересующей точки. Таким образом, большинство дескрипторов вычисляются локально, следовательно, описание получается для каждой точки интереса, определенной ранее.

Размерность дескриптора напрямую влияет как на его вычислительную сложность, так и на надежность / точность сопоставления точек. Короткий дескриптор может быть более устойчивым к вариациям внешнего вида, но может не обеспечивать достаточной дискриминации и, таким образом, давать слишком много ложных срабатываний.

Первый шаг состоит в фиксации воспроизводимой ориентации на основе информации из круговой области вокруг интересующей точки. Затем мы создаем квадратную область, выровненную по выбранной ориентации, и извлекаем из нее дескриптор SURF.

Назначение ориентации

Чтобы добиться инвариантности вращения, необходимо определить ориентацию интересующей точки. Отклики вейвлета Хаара как в x-, так и в y-направлениях в круговой окрестности радиуса вокруг интересующей точки вычисляются, где - масштаб, в котором объект интереса был обнаружен. Полученные ответы взвешиваются с помощью функции Гаусса с центром в интересующей точке, затем отображаются в виде точек в двумерном пространстве с горизонтальным откликом в абсцисса и вертикальный отклик в ордината. Доминирующая ориентация оценивается путем вычисления суммы всех ответов в пределах скользящего окна ориентации размером π / 3. Суммируются горизонтальные и вертикальные отклики внутри окна. Затем два суммированных ответа дают вектор локальной ориентации. Самый длинный такой вектор в целом определяет ориентацию интересующей точки. Размер скользящего окна - это параметр, который необходимо тщательно выбирать для достижения желаемого баланса между надежностью и угловым разрешением.

Дескриптор на основе суммы откликов вейвлета Хаара

Чтобы описать область вокруг точки, извлекается квадратная область, центрируется на точке интереса и ориентируется по ориентации, как указано выше. Размер этого окна - 20 сек.

Область интереса разделена на более мелкие квадратные подобласти 4x4, и для каждой из них вейвлет-отклики Хаара извлекаются в точках выборки 5x5 с регулярным интервалом. Отклики взвешиваются с помощью гауссиана (чтобы обеспечить большую устойчивость к деформациям, шуму и перемещению).

Соответствие

Сравнивая дескрипторы, полученные из разных изображений, можно найти совпадающие пары.

Смотрите также

Рекомендации

  1. ^ США 2009238460, Рюдзи Фунаяма, Хиромити Янагихара, Люк Ван Гул, Тинне Туйтелаарс, Герберт Бэй, "НАДЕЖНЫЙ ДЕТЕКТОР И ОПИСАНИЕ ИНТЕРЕСНОЙ ТОЧКИ", опубликовано 24 сентября 2009 г. 

Источники

внешняя ссылка