Определение ключевых слов - Keyword spotting

Определение ключевых слов (или проще, определение слов) - проблема, которая исторически впервые была определена в контексте обработка речи.^[1]^[2]При обработке речи определение ключевых слов связано с идентификацией ключевые слова в высказываниях.

Определение ключевых слов также определяется как отдельная, но связанная проблема в контексте обработки изображения документа.^[1]При обработке изображений документа обнаружение ключевых слов - это проблема поиска всех экземпляров слова запроса, которые существуют в отсканированном изображении документа, без его полного распознавания.

В обработке речи

Первые работы по поиску ключевых слов появились в конце 1980-х годов.^[2]

Особым случаем обнаружения ключевых слов является обнаружение бодрствующего слова (также называемого горячим словом), используемого персональными цифровыми помощниками, например Алекса или же Siri «просыпаться», когда произносится их имя.

В Соединенных Штатах Национальное Агенство Безопасности использует определение ключевых слов как минимум с 2006 года.^[3] Эта технология позволяет аналитикам искать в больших объемах записанных разговоров и выделять упоминания подозрительных ключевых слов. Записи можно индексировать, а аналитики могут выполнять запросы к базе данных, чтобы найти интересующие разговоры. IARPA профинансированное исследование обнаружения ключевых слов в Вавилонская программа.

Некоторые алгоритмы, используемые для этой задачи:

В обработке изображений документа

Определение ключевых слов при обработке изображений документа можно рассматривать как пример более общей проблемы: поиск изображений на основе содержимого (CBIR) .По запросу цель состоит в том, чтобы получить наиболее релевантные экземпляры слов в коллекции отсканированных документов.^[1]Запрос может быть текстовой строкой (поиск ключевых слов по строкам) или изображением слова (поиск ключевых слов по примеру).

Рекомендации

^ ^а ^б ^c Giotis, A.P; Sfikas, G .; Gatos, B .; Нику, К. (2017). «Обзор методов определения слов в изображениях документов». Распознавание образов. 68: 310–332. Дои:10.1016 / j.patcog.2017.02.023.
^ ^а ^б Rohlicek, J .; Russell, W .; Roukos, S .; Гиш, Х. (1989). «Непрерывное скрытое марковское моделирование для распознавания слов независимо от говорящего». Труды 14-й Международной конференции IEEE по акустике, речи и обработке сигналов (ICASSP). 1: 627–630.
^ Фрумкин, Дан. «КОМПЬЮТЕРЫ СЛУШАЮТ». Перехват. Получено 20 июн 2015.
^ Сайнат, Тара Н и Парада, Каролина (2015). "Сверточные нейронные сети для поиска ключевых слов с малым размером". Шестнадцатая ежегодная конференция Международной ассоциации речевой коммуникации. arXiv:1711.00333.CS1 maint: несколько имен: список авторов (связь)

[giotis17-1] а ^б ^c Giotis, A.P; Sfikas, G .; Gatos, B .; Нику, К. (2017). «Обзор методов определения слов в изображениях документов». Распознавание образов. 68: 310–332. Дои:10.1016 / j.patcog.2017.02.023.

[rohlicek89-2] а ^б Rohlicek, J .; Russell, W .; Roukos, S .; Гиш, Х. (1989). «Непрерывное скрытое марковское моделирование для распознавания слов независимо от говорящего». Труды 14-й Международной конференции IEEE по акустике, речи и обработке сигналов (ICASSP). 1: 627–630.

[3] Фрумкин, Дан. «КОМПЬЮТЕРЫ СЛУШАЮТ». Перехват. Получено 20 июн 2015.

[4] Сайнат, Тара Н и Парада, Каролина (2015). "Сверточные нейронные сети для поиска ключевых слов с малым размером". Шестнадцатая ежегодная конференция Международной ассоциации речевой коммуникации. arXiv:1711.00333.CS1 maint: несколько имен: список авторов (связь)

[1]

[2]

[3]

[4]