Грамматика структуры фраз, управляемая головой - Head-driven phrase structure grammar
Грамматика структуры фраз, управляемая головой (HPSG) является сильно лексикализованным, грамматика на основе ограничений[1] разработан Карл Поллард и Иван Саг.[2][3] Это тип грамматика фразовой структуры, в отличие от грамматика зависимостей, и это непосредственный преемник грамматика обобщенной фразовой структуры. HPSG опирается на другие области, такие как Информатика (теория типов данных и представление знаний ) и использует Фердинанд де Соссюр представление о знак. Он использует единый формализм и организован по модульному принципу, что делает его привлекательным для обработка естественного языка.
Грамматика HPSG включает в себя принципы и правила грамматики, а также лексикон статьи, которые обычно не считаются принадлежащими грамматике. Формализм основан на лексикализме. Это означает, что лексика - это больше, чем просто список статей; он сам по себе богато структурирован. Отдельные записи отмечены типами. Типы образуют иерархию. Ранние версии грамматики были очень лексикализованы с использованием нескольких грамматических правил (схем). Более поздние исследования имели тенденцию добавлять больше и более богатых правил, становясь более похожими на строительная грамматика.[4]
Основным типом HPSG является знак. Слова и фразы два разных подтипа знака. Слово имеет две особенности: [PHON] (звук, фонетический форма) и [SYNSEM] (в синтаксический и семантический информация), оба из которых разделены на подфункции. Знаки и правила оформляются в виде напечатанный структуры функций.
Образец грамматики
HPSG генерирует строки, комбинируя знаки, которые определяются их положением в иерархии типов и их внутренней структурой признаков, представленной матрицы значений атрибутов (ПТрМ).[3][5] Функции принимают типы или списки типов в качестве своих значений, и эти значения, в свою очередь, могут иметь свою собственную структуру функций. Грамматические правила в значительной степени выражаются через знаки ограничений, накладываемые друг на друга. Структура признаков знака описывает его фонологические, синтаксические и семантические свойства. В общепринятых обозначениях АВМ пишутся с элементами в верхнем регистре, а типы в нижнем регистре курсивом. Пронумерованные индексы в AVM представляют идентичные значения токенов.
В упрощенном AVM для слова (в данном случае глагола, а не существительного, как в «приятных прогулках на выходные») «прогулки» ниже категориальная информация глагола (CAT) разделена на характеристики, которые его описывают (HEAD) и особенности, которые описывают его аргументы (ВАЛЕНЦИЯ).
«Прогулки» - знак типа слово с головой типа глагол. Как непереходный глагол, "прогулки" не имеет дополнения, но требует подлежащего, который является существительным в единственном числе от третьего лица. Семантическое значение подлежащего (СОДЕРЖАНИЕ) коиндексируется с единственным аргументом глагола (человек, совершающий ходьбу). Следующая AVM для «она» представляет собой знак со значением SYNSEM, который может удовлетворить эти требования.
Знаки типа фраза объединиться с одним или несколькими дочерними элементами и распространять информацию вверх. Следующий AVM кодирует правило немедленного доминирования для заглавная-фраза, для которого требуются два дочерних элемента: главный дочерний элемент (глагол) и дочерний элемент без головы, который удовлетворяет ограничениям SUBJ глагола.
Конечным результатом является знак с заголовком глагола, пустыми элементами подкатегории и фонологическим значением, которое упорядочивает двух детей.
Хотя фактическая грамматика HPSG полностью состоит из структур признаков, лингвисты часто используют деревья для представления объединения знаков, где эквивалентная AVM была бы громоздкой.
Реализации
Разные парсеры на основе формализма HPSG были написаны и в настоящее время исследуются возможности оптимизации. Пример системы анализа Немецкий фразы обеспечивается Freie Universität Berlin.[6] Кроме того, CoreGram[7] проект Группы грамматики Freie Universität Berlin предоставляет грамматики с открытым исходным кодом, которые были реализованы в системе TRALE. В настоящее время существуют грамматики для Немецкий,[8] Датский,[9] Мандаринский китайский,[10] Мальтийский,[11] и Персидский[12] которые имеют общее ядро и являются общедоступными.
Большие HPSG-грамматики различных языков разрабатываются в рамках Deep Linguistic Processing with HPSG Initiative (DELPH-IN ).[13] Грамматики английского языка с широким охватом,[14] Немецкий,[15] и Японский[16] доступны по лицензии с открытым исходным кодом. Эти грамматики могут использоваться с множеством взаимосовместимых анализаторов HPSG с открытым исходным кодом: LKB, ДОМАШНИЙ ПИТОМЕЦ,[17] Туз,[18] и согласны.[19] Все они производят семантические представления в формате «Семантика минимальной рекурсии», MRS.[20] Декларативный характер формализма HPSG означает, что эти вычислительные грамматики обычно могут использоваться как для разбор и поколение (создание поверхностных строк из семантических входов). Treebanks, также распространяется DELPH-IN, используются для разработки и тестирования грамматик, а также для обучения моделей ранжирования для принятия решения о правдоподобных интерпретациях при синтаксическом анализе (или реализации при генерации).
Эндзю это свободно доступный вероятностный анализатор HPSG с широким охватом для английского языка, разработанный лабораторией Tsujii в Токийский университет в Япония.[21]
Смотрите также
- Лексико-функциональная грамматика
- Семантика минимальной рекурсии
- Реляционная грамматика
- Семантика ситуации
- Синтаксис
- Трансформационная грамматика
- Тип Описание Язык
Рекомендации
- ^ «HPSG».
- ^ Поллард, Карл и Иван А. Саг. 1987. Информационный синтаксис и семантика. Том 1. Основы. Лекционные заметки CLSI 13.
- ^ а б Поллард, Карл; Иван А. Саг. (1994). Грамматика структуры фраз, управляемая головой. Чикаго: Издательство Чикагского университета.
- ^ Саг, Иван Анатольевич 1997. Конструкции английских относительных придаточных предложений[постоянная мертвая ссылка ]. Журнал лингвистики. 33,2: 431-484
- ^ Саг, Иван А .; Томас Вазоу; И Эмили Бендер. (2003). Синтаксическая теория: формальное введение. 2-е изд. Чикаго: Издательство Чикагского университета.
- ^ Вавилонская система: интерактивная HPSG
- ^ Проект CoreGram
- ^ Берлиграм
- ^ DanGram
- ^ Китайский
- ^ Мальтийский
- ^ Персидский
- ^ DELPH-IN: глубокая обработка с открытым исходным кодом
- ^ Грамматика и лексика английских ресурсов
- ^ Бертольд Кризманн
- ^ JacyTop - глубокая лингвистическая обработка с HPSG (DELPH-IN)
- ^ Парсер DELPH-IN PET
- ^ Ace: механизм ограничения ответов
- ^ согласен грамматическая инженерия
- ^ Копестейк, А., Фликингер, Д., Поллард, К., & Саг, И. А. (2005). Семантика минимальной рекурсии: введение. Исследования языка и вычислений, 3 (2-3), 281-332.
- ^ Tsuji Lab: домашняя страница парсера Enju В архиве 2010-03-07 на Wayback Machine (получено 24 ноября 2009 г.)
дальнейшее чтение
- Карл Поллард, Иван А. Саг (1987): Информационный синтаксис и семантика. Том 1: Основы. Стэнфорд: публикации CSLI.
- Карл Поллард, Иван А. Саг (1994): Грамматика структуры фраз, управляемой головой. Чикаго: Издательство Чикагского университета. ([1] )
- Иван А. Саг, Томас Вазоу, Эмили М. Бендер (2003): Синтаксическая теория: формальное введение, второе издание. Чикаго: Издательство Чикагского университета. ([2] )
- Левин, Роберт Д.; В. Детмар Мерерс (2006). "Управляемая головой грамматика структуры фраз: лингвистический подход, формальные основы и вычислительная реализация" (PDF). В Кейт Браун (ред.). Энциклопедия языка и лингвистики (второе изд.). Оксфорд: Эльзевир. Архивировано из оригинал (PDF) на 2008-09-05. Получено 2008-03-07.
- Мюллер, Стефан (2013). «Объединение всего: несколько замечаний по упрощенному синтаксису, строительной грамматике, минимализму и HPSG». Язык. 89 (4): 920–950. Дои:10.1353 / lan.2013.0061.
внешняя ссылка
- Стэнфордская домашняя страница HPSG - включает онлайн-материалы ежегодной конференции HPSG
- Домашняя страница HPSG штата Огайо
- Международная конференция по грамматике структуры фраз, управляемой головой
- Сеть DELPH-IN для разработки грамматики HPSG
- Базовый обзор HPSG
- Сравнение HPSG с альтернативами и историческая перспектива
- Библиография публикаций HPSG
- Пакет LaTeX для рисования AVM - включает документацию