Глубокая лингвистическая обработка - Deep linguistic processing
Глубокая лингвистическая обработка это обработка естественного языка рамки, которые опираются на теоретические и описательная лингвистика. Он моделирует язык преимущественно посредством теоретической синтаксической / семантической теории (например, CCG, HPSG, LFG, ТЕГ, то Пражская школа ). Подходы глубокой лингвистической обработки отличаются от «более мелких» методов тем, что они дают более выразительные и структурные представления, которые непосредственно фиксируют зависимости на большом расстоянии и лежащие в основе предикат -аргумент конструкции.[1]
Наукоемкий подход к глубокой лингвистической обработке требует значительных вычислительных мощностей и в прошлом иногда считался неразрешимым. Однако исследования в начале 2000-х годов значительно повысили эффективность глубокой обработки.[2][3] Сегодня эффективность больше не является серьезной проблемой для приложений, использующих глубокую лингвистическую обработку.
В отличие от «поверхностной лингвистической обработки»
Традиционно глубокая лингвистическая обработка связана с разработкой компьютерной грамматики (для использования в обоих разбор и поколение). Эти грамматики разрабатывались, обслуживались вручную и требовали больших вычислительных затрат на выполнение. В последние годы подходы машинного обучения (также известные как неглубокая лингвистическая обработка ) коренным образом изменили сферу обработка естественного языка. Быстрое создание надежных и универсальных инструментов машинного обучения НЛП требует значительно меньшего количества ручного труда. Таким образом, методы глубокой лингвистической обработки получили меньше внимания.
Однако некоторые компьютерные лингвисты считают, что[ВОЗ? ] чтобы компьютеры понимали естественный язык или вывод, подробный синтаксис и семантическое представление необходимо. Более того, хотя люди могут легко понять предложение и его значение, неглубокой лингвистической обработке может не хватать «понимания» человеческого языка. Например:[4]
- а) Все было бы иначе, если бы Microsoft располагалась в Грузии.
В предложении (а) неглубокий извлечение информации Система могла ошибочно сделать вывод, что штаб-квартира Microsoft находится в Джорджии. В то время как люди, мы понимаем из предложения, что офис Microsoft никогда не был в Джорджии.
- б) Национальный институт психологии в Израиле был основан в мае 1971 года как Израильский центр психобиологии профессором Джоэлем.
В предложении (b) поверхностная система может ошибочно сделать вывод о том, что Израиль был основан в мае 1971 года. Люди знают, что это Национальный институт психобиологии, который был основан в 1971 году.
Подводя итог сравнению глубокой и поверхностной языковой обработки, можно сказать, что глубокая лингвистическая обработка обеспечивает богатый знаниями анализ языка с помощью грамматик и языковых ресурсов, разработанных вручную. Принимая во внимание, что неглубокая лингвистическая обработка обеспечивает основанный на знаниях анализ языка посредством статистического / машинного обучения манипулирования текстами и / или аннотированный лингвистический ресурс.
Суб-сообщества
«Глубокие» компьютерные лингвисты делятся на различные подсообщества на основе грамматического формализма, который они приняли для глубокой лингвистической обработки. Основные подсообщества включают:
- DEep Lпаховый пработа с ЧАСПСЖ - Винициативный (DELPH-IN ) сотрудничество, работающее с HPSG формализм. В Конференция HPSG центральная конференция по обмену знаниями / продвижению HPSG на основе глубокой обработки.
- ParGram/ParSem международное сотрудничество по LFG разработка грамматики и семантики на основе. В LFG конференция центральная конференция по обмену знаниями / продвижению LFG на основе глубокой обработки.
- Исследовательская группа XTAG, работающая с формализмом TAG. В TAG + конференция центральная конференция по обмену знаниями / продвижению ТЕГ на основе глубокой обработки.
Приведенный выше список не является исчерпывающим представителем всех сообществ, работающих над глубокой лингвистической обработкой.
Смотрите также
- Комбинаторно-категориальная грамматика
- Грамматика структуры фраз, управляемая головой
- Лексическая функциональная грамматика
- Обработка естественного языка
- Грамматика, примыкающая к дереву
Рекомендации
- ^ Тимоти Болдуин, Марк Драс, Джулия Хокенмайер, Трейси Холлоуэй Кинг и Гертьян ван Норд. 2007 г. Влияние глубокой лингвистической обработки на технологию синтаксического анализа. В Proc. 10-го Международного семинара по технологиям синтаксического анализа (IWPT-2007), страницы 36–8, Прага, Чешская Республика.
- ^ Ульрих Каллмайер. ПЭТ - платформа для экспериментов с эффективными методами обработки HPSG. Инженерия естественного языка, 6 (1): 99-108, 2000.
- ^ Ганс Ушкорейт. Новые возможности для глубокой лингвистической обработки В архиве 2005-11-03 на Wayback Machine. В Proceedings of COLING 2002, страницы xiv – xxvii, Тайбэй, Тайвань, 2002.
- ^ У. Шафер. 2007. ¨ Интеграция компонентов глубокой и поверхностной обработки естественного языка - представления и гибридные архитектуры. Кандидат наук. защитил диссертацию на факультете математики и информатики Саарландского университета, Саарбрюккен, Германия.