Byte/RE ИТ-издание

Новое поколение OCR Smart Engines для замещения продуктов ABBYY

Компания Smart Engines объявила о выпуске системы распознавания текста нового поколения. Она умеет находить документ на фотографии или скане и распознавать текстовые данные на 102 языках. Решение является частью продукта Smart Document Engine, включенного в реестр российского ПО. Собственная технология распознавания символов GreenOCR, используемая во всех продуктах компании, позволяет достигать высокой точности даже на некачественных фотографиях. ПО предназначено для замещения продуктов ABBYY и созданных на их основе решений в России, а также другого иностранного ПО в корпоративном и государственном секторе.

Разработанная система, подчеркивают в Smart Engines, обеспечивает технологический суверенитет, так как в продукте для распознавания и обработки изображений не используется код open source и иностранные программные компоненты. На современном смартфоне весь процесс от фотографии до текста занимает 3–4 секунды, что позволяет обойтись без планшетного сканера. Кроме распознавания, система автоматически обрезает, разглаживает сложенные документы и улучшает изображение. В серверных решениях на 32-ядерном HPC без применения GPU скорость полнотекстового распознавания достигает 15 страниц в секунду.

Как поясняют в Smart Engines, ранее в подобных задачах часто использовали OCR-решения компании ABBYY, но в начале 2022 г. после 30 лет работы в стране она покинула Россию, исключив ряд продуктов из реестра российских программ. Это событие создало существенные риски при реализации проектов цифровой трансформации.

Технология распознавания текстовых документов доступна разработчикам и заказчикам для встраивания в серверные, мобильные, десктопные и веб-приложения в составе программного продукта Smart Document Engine. Система функционирует без подключения к сторонним сервисам и внешним ресурсам, не требует GPU. Для распознавания не нужно наличие интернета, все вычисления выполняются на центральном процессоре устройства и не требуют видеокарт.

Кроме привычных языков, базирующихся на кириллических и латинских алфавитах, система распознает арабский, армянский, греческий, грузинский, иврит, китайский, корейский и японский. Smart Document Engine поддерживает ALT Linux, Astra Linux, «Ред ОС» и другие ОС семейства Linux, Windows, macOS, iOS, Android, ОС Аврора.

Вам также могут понравиться