Определение ключевых слов - Keyword spotting

Определение ключевых слов (или проще, определение слов) - проблема, которая исторически впервые была определена в контексте обработка речи.[1][2]При обработке речи определение ключевых слов связано с идентификацией ключевые слова в высказываниях.

Определение ключевых слов также определяется как отдельная, но связанная проблема в контексте обработки изображения документа.[1]При обработке изображений документа обнаружение ключевых слов - это проблема поиска всех экземпляров слова запроса, которые существуют в отсканированном изображении документа, без его полного распознавания.

В обработке речи

Первые работы по поиску ключевых слов появились в конце 1980-х годов.[2]

Особым случаем обнаружения ключевых слов является обнаружение бодрствующего слова (также называемого горячим словом), используемого персональными цифровыми помощниками, например Алекса или же Siri «просыпаться», когда произносится их имя.

В Соединенных Штатах Национальное Агенство Безопасности использует определение ключевых слов как минимум с 2006 года.[3] Эта технология позволяет аналитикам искать в больших объемах записанных разговоров и выделять упоминания подозрительных ключевых слов. Записи можно индексировать, а аналитики могут выполнять запросы к базе данных, чтобы найти интересующие разговоры. IARPA профинансированное исследование обнаружения ключевых слов в Вавилонская программа.

Некоторые алгоритмы, используемые для этой задачи:

В обработке изображений документа

Определение ключевых слов при обработке изображений документа можно рассматривать как пример более общей проблемы: поиск изображений на основе содержимого (CBIR) .По запросу цель состоит в том, чтобы получить наиболее релевантные экземпляры слов в коллекции отсканированных документов.[1]Запрос может быть текстовой строкой (поиск ключевых слов по строкам) или изображением слова (поиск ключевых слов по примеру).

Рекомендации

  1. ^ а б c Giotis, A.P; Sfikas, G .; Gatos, B .; Нику, К. (2017). «Обзор методов определения слов в изображениях документов». Распознавание образов. 68: 310–332. Дои:10.1016 / j.patcog.2017.02.023.
  2. ^ а б Rohlicek, J .; Russell, W .; Roukos, S .; Гиш, Х. (1989). «Непрерывное скрытое марковское моделирование для распознавания слов независимо от говорящего». Труды 14-й Международной конференции IEEE по акустике, речи и обработке сигналов (ICASSP). 1: 627–630.
  3. ^ Фрумкин, Дан. «КОМПЬЮТЕРЫ СЛУШАЮТ». Перехват. Получено 20 июн 2015.
  4. ^ Сайнат, Тара Н и Парада, Каролина (2015). "Сверточные нейронные сети для поиска ключевых слов с малым размером". Шестнадцатая ежегодная конференция Международной ассоциации речевой коммуникации. arXiv:1711.00333.CS1 maint: несколько имен: список авторов (связь)