PropBank - PropBank

PropBank это корпус то есть аннотированный со словесными предложениями и их аргументами - «банк предложений». Хотя «PropBank» относится к конкретному корпусу, созданному Мартой Палмер и другие.,[1] период, термин пропбанк также будет использоваться как имя нарицательное ссылаясь на любой корпус, который был аннотирован предложениями и их аргументами.

Проект PropBank сыграл роль в недавнем[когда? ] исследования в обработка естественного языка,[нужна цитата ] и использовался в маркировка семантических ролей.

Сравнение

PropBank отличается от FrameNet, ресурс, с которым его чаще всего сравнивают, несколькими способами.

PropBank - это ресурс, ориентированный на глаголы, в то время как FrameNet сосредоточен на более абстрактном понятии фреймов, которое обобщает описания похожих глаголов (например, «описать» и «характеризовать»), а также существительных и других слов (например, «описание»). PropBank не аннотирует события или положения дел, описанные с помощью существительных. PropBank обязуется аннотировать все глаголы в корпусе, тогда как проект FrameNet выбирает наборы примеров предложений из большого корпуса и только в некоторых случаях аннотирует более длинные непрерывные участки текста.

Аннотации в стиле PropBank часто остаются близкими к синтаксическому уровню, в то время как аннотации в стиле FrameNet иногда более семантически мотивированы. С самого начала PropBank был разработан с целью использования в качестве обучающих данных для машинное обучение -основан маркировка семантических ролей системы в уме. Требуется, чтобы все аргументы глагола были синтаксические составляющие и разные значения слова различаются только в том случае, если различия имеют отношение к аргументам.[2] Из-за таких различий маркировка семантических ролей по отношению к PropBank часто оказывается несколько более простой задачей, чем создание аннотаций в стиле FrameNet.

Смотрите также

Рекомендации

  1. ^ Палмер М., Кингсбери П., Гилдеа Д. (2005). «Банк предложений: аннотированный корпус семантических ролей». Компьютерная лингвистика. 31 (1): 71–106. CiteSeerX  10.1.1.136.8985. Дои:10.1162/0891201053630264. S2CID  2486369.
  2. ^ Эдвард Лопер; Су-тинг Йи и Марта Палмер (2007). «Объединение лексических ресурсов: отображение между PropBank и VerbNet» (PDF). Материалы 7-го международного семинара по компьютерной лингвистике.

внешняя ссылка