КАКАО (цифровые гуманитарные науки) - COCOA (digital humanities)

КАКАО (аббревиатура, производная от COunt и COncordance Generation в Атласе) была ранней текстовый файл утилита и связанный формат файла для цифровые гуманитарные науки, затем известный как гуманитарные вычисления. Было примерно 4000 перфокарты из FORTRAN и создан в конце 1960-х - начале 1970-х годов на Университетский колледж Лондона и Компьютерная лаборатория Атлас в Харвелл, Оксфордшир. Функциональность включала подсчет слов и согласованность строительство.[1][2][3][4]

Оксфордская программа согласования

В Оксфордская программа согласования (OCP) формат был прямым потомком COCOA, разработанным в Вычислительные услуги Оксфордского университета. В Оксфордский текстовый архив содержит элементы в этом формате.[5]

Более поздние разработки

Формат файла COCOA имеет хотя бы мимолетное сходство с более поздними языки разметки Такие как SGML и XML. Заметное отличие от его преемников заключается в том, что теги COCOA плоские и не имеют древовидной структуры. В этом формате каждый тип информации и значение, закодированные тегом, следует рассматривать как истинные, пока тот же тег не изменит свое значение. Члены Инициатива кодирования текста Сообщество поддерживает устаревшую поддержку COCOA,[6][7] хотя большинство востребованных текстов и корпусов уже переведены в более понятные форматы, такие как TEI XML[8]


Рекомендации

  1. ^ Пол Э. Коркоран (ноябрь 1974 г.). "COCOA: Программа FORTRAN для согласования и подсчета слов текстов естественного языка". Методы и инструменты исследования поведения. 6 (6): 566. Дои:10.3758 / BF03201351.
  2. ^ Колин Дэй и Ян Марриотт (февраль 1976 г.). «Обзоры программного обеспечения: COCOA: генератор подсчета слов и соответствия». Компьютеры и гуманитарные науки. 10 (1): 56. Дои:10.1007 / BF02399143.
  3. ^ Д. Б. Рассел (1965). «КАКАО - Генератор количества слов и соответствия». Associates Technology Literature Applications Society. Получено 20 октября 2013.
  4. ^ Сьюзан Хоккей. «История гуманитарных вычислений». Университет Иллинойса. Архивировано из оригинал 18 сентября 2013 г.. Получено 20 октября 2013.
  5. ^ "Concordia discordantium canonum ac primum de iure naturae et конституция". Архив текстов Оксфордского университета. Получено 20 октября 2013.
  6. ^ Джеймс Каммингс, Себастьян Ратц (2010). «Этот скрипт используется для преобразования COCOA в TEI» (XSL ). Оксфордский университет. Получено 3 апреля 2018.
  7. ^ https://github.com/TEIC/Stylesheets/tree/master/cocoa
  8. ^ http://www.helsinki.fi/varieng/CoRD/corpora/HelsinkiCorpus/HC_XML.html