PropBank - PropBank
PropBank это корпус то есть аннотированный со словесными предложениями и их аргументами - «банк предложений». Хотя «PropBank» относится к конкретному корпусу, созданному Мартой Палмер и другие.,[1] период, термин пропбанк также будет использоваться как имя нарицательное ссылаясь на любой корпус, который был аннотирован предложениями и их аргументами.
Проект PropBank сыграл роль в недавнем[когда? ] исследования в обработка естественного языка,[нужна цитата ] и использовался в маркировка семантических ролей.
Сравнение
PropBank отличается от FrameNet, ресурс, с которым его чаще всего сравнивают, несколькими способами.
PropBank - это ресурс, ориентированный на глаголы, в то время как FrameNet сосредоточен на более абстрактном понятии фреймов, которое обобщает описания похожих глаголов (например, «описать» и «характеризовать»), а также существительных и других слов (например, «описание»). PropBank не аннотирует события или положения дел, описанные с помощью существительных. PropBank обязуется аннотировать все глаголы в корпусе, тогда как проект FrameNet выбирает наборы примеров предложений из большого корпуса и только в некоторых случаях аннотирует более длинные непрерывные участки текста.
Аннотации в стиле PropBank часто остаются близкими к синтаксическому уровню, в то время как аннотации в стиле FrameNet иногда более семантически мотивированы. С самого начала PropBank был разработан с целью использования в качестве обучающих данных для машинное обучение -основан маркировка семантических ролей системы в уме. Требуется, чтобы все аргументы глагола были синтаксические составляющие и разные значения слова различаются только в том случае, если различия имеют отношение к аргументам.[2] Из-за таких различий маркировка семантических ролей по отношению к PropBank часто оказывается несколько более простой задачей, чем создание аннотаций в стиле FrameNet.
Смотрите также
Рекомендации
- ^ Палмер М., Кингсбери П., Гилдеа Д. (2005). «Банк предложений: аннотированный корпус семантических ролей». Компьютерная лингвистика. 31 (1): 71–106. CiteSeerX 10.1.1.136.8985. Дои:10.1162/0891201053630264. S2CID 2486369.
- ^ Эдвард Лопер; Су-тинг Йи и Марта Палмер (2007). «Объединение лексических ресурсов: отображение между PropBank и VerbNet» (PDF). Материалы 7-го международного семинара по компьютерной лингвистике.
внешняя ссылка
Этот компьютерная лингвистика -связанная статья является заглушка. Вы можете помочь Википедии расширяя это. |