Сравнение программ оптического распознавания символов - Comparison of optical character recognition software
Эта сравнение оптическое распознавание символов программное обеспечение включает:
- Механизмы OCR, которые выполняют фактическую идентификацию символов
- Программное обеспечение для анализа макета, которое разделяет отсканированные документы на зоны, подходящие для OCR
- Графические интерфейсы к одному или нескольким механизмам OCR
- Комплекты для разработки программного обеспечения которые используются для добавления возможностей OCR в другое программное обеспечение (например, приложения для обработки форм, системы управления изображениями документов, электронное открытие системы, решения для управления записями)
имя | Год основания | Последняя стабильная версия | Год выпуска | Лицензия | онлайн | Windows | Mac OS X | Linux | BSD | Язык программирования | SDK ? | Языки | Шрифты | Форматы вывода | Заметки |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Гугл Диск OCR или Google Cloud Vision | 2015 | Проприетарный | да | Браузер | Браузер | Браузер | Неизвестно | Неизвестно | да | 200+ | Все шрифты | текст | Сообщение в блоге Google [1] [2] | ||
Тессеракт | 1985 | 4.1.1 | 2019 | Apache | Нет | да | да | да | да | C ++, C | да | 100+[3] | Любой печатный шрифт | Текст, АЛЬТО, hOCR,[4] PDF, другие с разными пользовательскими интерфейсами[5] или API | Создан Hewlett Packard; в стадии дальнейшей разработки Google[6] |
ABBYY FineReader | 1989 | 15 | 2019 | Проприетарный | да | да | да | да | да | C / C ++ | да | 192[7] | Все шрифты | DOC, DOCX, XLS, XLSX, PPTX, RTF, PDF, HTML, CSV, TXT, ODT, DjVu, EPUB, FB2[8] | ABBYY также поставляет SDK для встраиваемых и мобильных устройств. Версии Professional, Corporate и Site License для Windows, Express Edition для Mac.[9] |
Е-Акшараян | 2010 | да | Нет | да | Нет | 14 | RTF, TXT, BRL | ||||||||
Asprise OCR SDK | 1998 | 15 | 2015 | Проприетарный | да | да | да | да | да | Java, C #, VB.NET, C / C ++ / Delphi | да | 20+[10] | ? | Обычный текст, PDF, XML с возможностью поиска[11] | Пакеты SDK Java, C #, VB.NET, C / C ++ / Delphi для OCR и распознавания штрих-кода в Windows, Linux, Mac OS X и Unix.[12] |
Программное обеспечение AnyDoc | 1989 | ? | ? | Проприетарный | Нет | да | Нет | Нет | Нет | VBScript | ? | ? | ? | Работает со структурированными, полуструктурированными и неструктурированными документами. | |
CuneiForm | 1996 | 1.1 | 2011-04-19 | BSD вариант | Нет | да | да | да | да | C / C ++ | да | 28 | Любой печатный шрифт | HTML, hOCR, нативный, RTF, TeX, ТЕКСТ[13] | Система корпоративного класса, может сохранять форматирование текста и распознавать сложные таблицы любой структуры |
SDK Dynamsoft OCR | 2003 | 8.2 | 2012 | Проприетарный | да | да | Нет | Нет | Нет | C / C ++ | да | 40+[14] | ? | PDF, TXT | |
OmniPage | 1970-е годы | 19.2 | 2015 | Проприетарный | да | да | да | да | Нет | C / C ++, C #[15] | да | 125[16] | Машинные и ручные шрифты | DOC / DOCX XLS / XLSX PPTX RTF PDF PDF / A PDF с возможностью поиска HTML Текст XML ePUB MP3 | Продукт Nuance Communications |
Microsoft Office OneNote 2007 | 2011 | ? | 2007 | Проприетарный | Нет | да | Нет | Нет | Нет | ? | ? | ? | ? | ||
GOCR | 2000 | 0.52[17] | 2018-10-15 | GPL | да[18] | да | да | да | да | C | ? | 20+ | ? | ||
Окрад | ? | 0.26[19] | 2017-03-31 | GPL | да | Нет | да | да | да | C ++ | да | Латинский алфавит | ? | Командная строка | |
SmartScore | 1991 | 10.5.8 | 2015-07 | Проприетарный | Нет | да | да | Нет | Нет | ? | ? | ? | ? | Для нот | |
Обработка изображений документов Microsoft Office | ? | Office 2007 | 2007 | Проприетарный | Нет | да | Нет | Нет | Нет | ? | ? | ? | ? | Использует OmniPage[нужна цитата ] | |
Puma.NET | ? | ? | 2009-10-29 | BSD | Нет | да | Нет | Нет | Нет | C # | да | 28 | Любой печатный шрифт | .СЕТЬ OCR SDK на основе механизма распознавания CuneiForm от Cognitive Technologies. Обертывает Puma COM-сервер и упрощает API для приложений .NET | |
ReadSoft | ? | ? | ? | Проприетарный | Нет | да | Нет | Нет | Нет | ? | ? | ? | ? | Сканируйте, регистрируйте и классифицируйте бизнес-документы, такие как счета, формы и заказы на поставку, интегрированные с бизнес-процессами. | |
Scantron | ? | ? | ? | Проприетарный | Нет | да | Нет | Нет | Нет | ? | ? | ? | ? | Для работы с локализованными интерфейсами требуется соответствующая языковая поддержка. | |
OCRFeeder | 2009-03 | 0.8.1 | 2014-12-22 | GPL | Нет | Нет | Нет | да | Нет | Python | ? | ? | ? | Имеет полный пользовательский интерфейс и инструмент командной строки для автоматических операций. Имеет собственный алгоритм сегментации, но использует общесистемные механизмы распознавания текста, такие как Тессеракт или Окрад | |
OCRopus | 2007 | 1.3.3 | 2017-12-16 | Apache | Нет | Нет | да | да | да | Python | ? | Все языки, использующие Латинский шрифт (другие языки можно обучать) | Нормальный латинский шрифт и Fraktur (другие скрипты можно обучить) | TXT, hOCR,[20] PDF[21] | Подключаемый фреймворк в активной разработке, используется для Google Книги |
имя | Год основания | Последняя стабильная версия | Год выпуска | Лицензия | онлайн | Windows | Mac OS X | Linux | BSD | Язык программирования | SDK? | Языки | Шрифты | Форматы вывода | Заметки |
Оценка
Анализ точности и надежности пакетов OCR Гугл документы OCR, Тессеракт, ABBYY FineReader, и Transym, используя набор данных, включающий 1227 изображений из 15 различных категорий, пришли к выводу, что Google Docs OCR и ABBYY работают лучше, чем другие.[22]
использованная литература
- ^ Дмитрий Гензель; Ашок Попат (6 мая 2015 г.). «Бумага в цифровую форму на 200+ языках».
- ^ Ашок Попат (4 сентября, 2015). «IEEE SPS: оптическое распознавание символов для большинства языков мира».
- ^ На основе количества файлов языковой подготовки для версии 3.04. Доступны на страница загрузки.
- ^ Использование объяснено в Тессеракте Прочти меня и Вопросы-Ответы
- ^ Такие как ODF с OCRFeeder
- ^ "GitHub - tesseract-ocr / tesseract: Tesseract Open Source OCR Engine (основной репозиторий)". Получено 2018-11-05.
- ^ «ABBYY FineReader 14: Технические характеристики». Finereader.abbyy.com. Получено 2017-02-23.
- ^ «ABBYY FineReader 11: Технические характеристики». Finereader.abbyy.com. Получено 2013-09-12.
- ^ «Лучшее программное обеспечение для оптического распознавания текста». Ocrworld.com. 30 марта 2010 г. Архивировано из оригинал на 2017-02-23. Получено 2013-09-12.
- ^ «Возможности Asprise OCR SDK». asprise.com. Получено 2014-06-21.
- ^ «Возможности библиотеки Asprise Java OCR». asprise.com. Получено 2014-06-21.
- ^ "Asprise Java, C # / VB.NET OCR API". asprise.com. 2015-11-19. Получено 2015-11-19.
- ^ Debian страница руководства для Cuneiform для Linux версии 1.1.0
- ^ "Загрузка языковых пакетов OCR SDK". Dynamsoft.com. Получено 2013-09-12.
- ^ «OmniPage CSDK - Набор инструментов для распознавания документов с оптическим распознаванием текста | Обработка изображений и распознавание текста». Нюанс. Архивировано из оригинал на 24.08.2010. Получено 2013-09-12.
- ^ «Преобразование стандартного документа OmniPage». Нюанс. Архивировано из оригинал на 2014-03-13. Получено 2014-02-25.
- ^ "Домашняя страница GOCR". wasd.urz.uni-magdeburg.de. Получено 2018-10-17.
- ^ «ГОКР». Jocr.sourceforge.net. Получено 2013-09-12.
- ^ Диас, Антонио (16 апреля 2015 г.). "Выпущен GNU Ocrad 0.26" (Список рассылки). инфо-гну.
- ^ OCRopus включает инструмент ocropus-hocr, который производит hOCR на основе результатов распознавания.
- ^ В сочетании с инструментами hocr
- ^ Ассефи, Мехди (01.12.2016). «OCR как услуга: экспериментальная оценка Google Docs OCR, Tesseract, ABBYY FineReader и Transym». Ворота исследования. Получено 2019-01-31.