ALTO (XML) - ALTO (XML)
АЛЬТО (Анализируемый макет и текстовый объект) является открытым XML Схема разработана в рамках финансируемого ЕС проекта под названием METAe.
Стандарт изначально разрабатывался для описания текста. OCR и информация о макете страниц для оцифрованного материала. Цель состояла в том, чтобы описать макет и текст в форме, позволяющей восстановить первоначальный внешний вид на основе оцифрованной информации - аналогично подходу к операции сохранения изображения без потерь.
ALTO часто используется в сочетании с Стандарт кодирования и передачи метаданных (METS) для описания всего оцифрованного объекта и создания ссылок в файлах ALTO, например описание последовательности чтения.
Стандарт размещен в Библиотеке Конгресса с 2010 года и поддерживается редакционной коллегией, инициализированной в то же время.
После окончательной версии стандарта ALTO в июне 2004 г. (версия 1.0) ALTO поддерживалась CCS. CCS Content Conversion Specialists GmbH, Гамбург до версии 1.4.
Версии
Последнюю версию схемы и обзор всех версий со ссылками на схему можно найти по адресу https://github.com/altoxml
Структура
Файл ALTO состоит из трех основных разделов, являющихся дочерними по отношению к корневому элементу
- Раздел <Описание> содержит метаданные о самом файле ALTO и обработке информации о том, как файл был создан.
- Раздел
содержит стили текста и абзацев с их индивидуальными описаниями: имеет описания шрифтов содержит описания абзацев, например информация о выравнивании
- Раздел
содержит информацию о содержимом. Он разделен на элементы .
<?xml version="1.0"?><alto> <Description> <MeasurementUnit/> <sourceImageInformation/> <Processing/> </Description> <Styles> <TextStyle/> <ParagraphStyle/> </Styles> <Layout> <Page> <TopMargin/> <LeftMargin/> <RightMargin/> <BottomMargin/> <PrintSpace/> </Page> </Layout></alto>
Рекомендации
Смотрите также
- Стандарт кодирования и передачи метаданных (МЕТ)
- Дублинское ядро, стандарт метаданных ISO
- Сохранение метаданных: стратегии внедрения (PREMIS)
- Протокол инициативы открытых архивов для сбора метаданных (OAI-PMH)
- hOCR
внешняя ссылка
- Стандарты ALTO (анализируемый макет и текстовый объект) на сайте Библиотеки Конгресса
- https://altoxml.github.io/ соотв. https://github.com/altoxml ALTOxml на GitHub
- Больше информации о METS / ALTO by CCS GmbH
- METS ALTO Введение от CCS GmbH
- XSLT-преобразования из и в ALTO