Немецкий справочный корпус - German Reference Corpus
Эта статья поднимает множество проблем. Пожалуйста помоги Улучши это или обсудите эти вопросы на страница обсуждения. (Узнайте, как и когда удалить эти сообщения-шаблоны) (Узнайте, как и когда удалить этот шаблон сообщения)
|
В Немецкий справочный корпус (оригинал: Deutsches Referenzkorpus; короткая: ДеРеКо) представляет собой электронный архив текстовые корпуса из современный письменный немецкий. Впервые он был создан в 1964 году и размещен в Институте немецкого языка (IDS) в Мангейм, Германия. Архив корпуса постоянно обновляется и расширяется. В настоящее время он включает более 4,0 миллиардов словарных знаков (по состоянию на август 2010 г.) и представляет собой крупнейшую лингвистически мотивированную коллекцию современных немецких текстов. Сегодня это один из основных мировых ресурсов по изучению письменного немецкого языка.
Альтернативные названия
Немецкий справочный корпус часто называют другими именами, например Корпуса Мангейма, Корпуса IDS, КОСМАС корпус и соответствующие немецкие переводы. Название Deutsches Referenzkorpus (DeReKo) Первоначально использовался для определенной части текущего архива, который был собран в период с 1999 по 2002 год рядом учреждений в рамках совместного проекта под тем же названием. С 2004 г. Deutsches Referenzkorpus (DeReKo) - официальное название полного архива корпуса.
Концепция и состав
Немецкий справочный корпус включает художественные и академические тексты, большое количество газетных текстов и несколько других типов текстов. Тексты охватывают временной диапазон примерно с 1950 года по настоящее время.
В отличие от других известных корпусов и корпусных архивов (таких как Британский национальный корпус ), однако Немецкий справочный корпус явно не задуман как сбалансированный корпус: Распределение текстов DeReKo по времени или типам текста не соответствует некоторым предопределенным процентам.
Эта концепция соответствует тому факту, что независимо от того, является ли данный корпус сбалансированным или даже репрезентативным языком образец могут быть оценены только в отношении конкретной языковой области (т. е. статистическая совокупность ). Поскольку различные лингвистические исследования обычно нацелены на разные языковые области, заявленная цель Немецкого справочного корпуса - служить универсальным вышестоящим образцом или изначальный образец (Немецкий: Ур-Стичпроб) современного письменного немецкого языка, из которого пользователи корпуса могут извлечь специализированную подвыборку (так называемую виртуальный корпус ) для представления языковой области, которую они хотят исследовать.
Доступ
Из-за авторских прав и лицензионных ограничений архив DeReKo не может быть скопирован или предложен для загрузки. Его можно бесплатно запросить и проанализировать через систему. КОСМА II - конечные пользователи должны регистрироваться по имени и давать согласие на использование данных корпуса исключительно в некоммерческих академических целях. КОСМА II позволяет пользователям компилировать из DeReKo a виртуальный корпус подходит для их конкретных исследовательских вопросов.
Смотрите также
- Текстовый корпус
- Корпусная лингвистика
- Американский национальный корпус
- Банк английского языка
- Британский национальный корпус
- Корпус современного американского английского (COCA)
- Oxford English Corpus
Рекомендации
- Купец, М. и К. Белица, Х. Кейбель и А. Витт (2010): Немецкий справочный корпус DeReKo: исходный образец для лингвистических исследований. В: Calzolari, N. et al. (ред.): Материалы 7-й конференции по международным языковым ресурсам и оценке (LREC 2010) (стр. 1848–1854). Валлетта, Мальта: Европейская ассоциация языковых ресурсов (ELRA).
- Купец, М. и Х. Кейбель (2009): Mannheim German Reference Corpus (DeReKo) как основа для эмпирических лингвистических исследований. В: Рабочие документы по корпусной лингвистике и языковому образованию, № 3 (стр. 53–59). Токио: Токийский университет иностранных языков (TUFS).
внешняя ссылка
- Сайт DeReKo (немецкий)
- КОСМА II - бесплатный интерфейс DeReKo (немецкий сайт)