Протокол инициативы открытых архивов для сбора метаданных - Open Archives Initiative Protocol for Metadata Harvesting

В Инициатива открытых архивов Протокол для сбора метаданных (OAI-PMH) - это протокол, разработанный для сбор урожая метаданные описания записей в архиве, чтобы службы могли быть построены с использованием метаданных из многих архивов. Реализация OAI-PMH должна поддерживать представление метаданных в Дублинское ядро, но также может поддерживать дополнительные представления.[1]

Протокол обычно называют протоколом OAI.

OAI-PMH использует XML над HTTP. Версия 2.0 протокола была выпущена в 2002 году; документ последний раз обновлялся в 2015 году. Лицензия Creative Commons BY-SA.

История

В конце 1990-х гг. Герберт Ван де Сомпель (Гентский университет ) работал с исследователями и библиотекарями в Лос-Аламосская национальная лаборатория (США) и созвали собрание для решения трудностей, связанных с проблемами взаимодействия серверов электронной печати и цифровые репозитории. Встреча прошла в г. Санта-Фе, Нью-Мексико в октябре 1999 года. Ключевым событием встречи стало определение интерфейса, позволяющего серверам электронной печати открывать метаданные для документов, которые он хранил в структурированном виде, чтобы другие хранилища могли идентифицировать и копировать интересующие документы друг с другом. Этот интерфейс / протокол получил название «Конвенция Санта-Фе».[1]

В 2000 г. на конференции ACM Digital Libraries было проведено несколько семинаров.[2] и в другом месте, чтобы поделиться идеями из Конвенции Санта-Фе. На семинарах было обнаружено, что проблемы, с которыми сталкивается сообщество электронной печати, также разделяются библиотеками, музеями, издателями журналов и другими лицами, которым необходимо делиться распределенными ресурсами. Чтобы удовлетворить эти потребности, Коалиция сетевой информации[3] и Федерация электронных библиотек[4] предоставил финансирование для создания Инициатива открытых архивов (OAI) секретариат, которым руководят Герберт Ван де Сомпель и Карл Лагозе. OAI провела встречу в Корнелл Университет (Итака, Нью-Йорк ) в сентябре 2000 г. для улучшения интерфейса, разработанного на съезде Санта-Фе. Спецификации были уточнены по электронной почте.

Версия 1.0 OAI-PMH была представлена ​​общественности в январе 2001 г. на семинаре в г. Вашингтон, округ Колумбия., и еще один в феврале в Берлин, Германия. Последующие изменения в XML стандарт W3C потребовалось внести незначительные изменения в OAI-PMH, в результате чего появилась версия 1.1. Текущая версия 2.0 была выпущена в июне 2002 года. Она содержит несколько технических изменений и улучшений и не имеет обратной совместимости.

Использует

Некоторые коммерческие поисковые системы используйте OAI-PMH, чтобы получить больше ресурсов. Google изначально включал поддержку OAI-PMH при запуске карт сайта, однако решил поддерживать только стандартный XML Файлы Sitemap формат в мае 2008 года.[5] В 2004 г. Yahoo! приобретенный контент из OAIster (университет Мичигана ), который был получен путем сбора метаданных с помощью OAI-PMH. Викимедиа использует репозиторий OAI-PMH для предоставления фидов Википедия и соответствующие обновления сайта для поисковых систем и другие попытки массового анализа / повторной публикации.[6] OAI-PMH может помочь в сокращении сетевого трафика и использования других ресурсов, особенно при работе с тысячами файлов, собираемых каждый день, путем инкрементного сбора.[7] НАСА Меркурий Система поиска метаданных использует OAI-PMH для ежедневного индексирования тысяч записей метаданных из Global Change Master Directory (GCMD).[8]

В mod_oai проект использует OAI-PMH для предоставления веб-поисковым роботам контента, доступного из Веб-серверы Apache.

Программного обеспечения

OAI-PMH основан на клиент – сервер архитектура, в которой «комбайны» запрашивают информацию об обновленных записях из «репозиториев». Запросы данных могут быть основаны на диапазоне отметок даты и могут быть ограничены именованными наборами, определенными поставщиком. Поставщики данных обязаны предоставлять XML метаданные в Дублинское ядро формат, а также может предоставлять его в других форматах XML.

Ряд программных систем поддерживает OAI-PMH, в том числе Fedora, EThOS от Британская библиотека, GNU EPrints от Саутгемптонский университет, Системы открытых журналов от Общественный проект знаний, Desire2Learn, DSpace из Массачусетский технологический институт, HyperJournal из Пизанский университет, Digibib от Digibis, MyCoRe, Primo, DigiTool, Rosetta и MetaLib из Экслибрис, ArchivalWare из PTFS, ДВЕРЬ [9] из электронной лаборатории[10] в Лугано, Швейцария, panFMP от PANGEA (библиотека данных),[11] SimpleDL от Roaring Development и jOAI.[12]

Архивы

Ряд больших архивов поддерживают протокол, включая arXiv и ЦЕРН Сервер документов.

Смотрите также

Примечания

  1. ^ а б Маршалл Бридинг (сентябрь 2002 г.). «Понимание протокола для сбора метаданных Инициативы открытых архивов». Компьютеры в библиотеках. 8 (24): 24–29. Получено 11 октября, 2013.
  2. ^ Конференция ACM по электронным библиотекам
  3. ^ Коалиция сетевой информации
  4. ^ Федерация электронных библиотек
  5. ^ Блог Google для веб-мастеров
  6. ^ "Служба обновления Викимедиа". Викимедиа Мета-Вики. Получено 14 июля 2013. Цитировать журнал требует | журнал = (помощь)
  7. ^ инкрементный сбор урожая
  8. ^ Р. Девараконда; Г. Паланисами; Дж. Грин; Б. Уилсон (2010). «Обмен и поиск данных использует OAI-PMH». Информатика наук о Земле. Springer Berlin / Heidelberg. 4 (1): 1–5. Дои:10.1007 / s12145-010-0073-0. S2CID  46330319.
  9. ^ ДВЕРЬ
  10. ^ eLab
  11. ^ panFMP
  12. ^ "ДЖОАЙ". Архивировано из оригинал на 2010-01-15. Получено 2009-11-16.

Рекомендации

внешняя ссылка