Byte/RE ИТ-издание

Новая версия SDK от ABBYY

Компания ABBYY анонсировала ABBYY FineReader Engine 10, новую версию инструментария разработчика (SDK), предназначенного для встраивания функций оптического распознавания текста в приложения независимых разработчиков. По сравнению с предыдущей версией в SDK сделан ряд существенных улучшений: увеличена скорость распознавания и повышено его качество, удобнее стала интеграция технологий.

Важнейшей задачей при создании новой версии SDK было повышение скорости распознавания. Теперь ABBYY FineReader Engine обрабатывает тексты на русском языке на 44% быстрее, а скорость распознавания для основных европейских языков (английский, немецкий, французский, итальянский, испанский) увеличена почти в 2 раза. В сочетании с технологией мультипроцессорной обработки, когда части многостраничного документа распознаются на нескольких процессорах одновременно, это улучшение существенно повышает производительность конечного приложения.

Для удобства разработчиков в ABBYY FineReader Engine 10 расширены возможности API. Теперь в процессе создания собственного приложения разработчики могут воспользоваться профилями, настроенными для решения ряда типовых задач, таких как конвертация документов для сохранения в архиве, преобразование документов для их последующего редактирования, извлечение опорного текста, штрихкодов или меток.

Новая версия SDK предоставляет широкие возможности работы с файлами формата PDF (в том числе PDF/A для архивного хранения). Пользователю предлагается ряд режимов сохранения, среди которых можно выбрать оптимальный: режим наилучшего качества, максимальной скорости, с минимальным размером файла или сбалансированный. Кроме того, ABBYY FineReader Engine 10 позволяет создавать PDF-файлы с ультравысоким сжатием MRC (Mixed Raster Content), из-за которого визуальные характеристики документа не страдают.

Улучшена технология адаптивного распознавания документов (ADRT), с помощью которой SDK сохраняет структуру многостраничного документа, обрабатывая его как единое целое. Версия ADRT 2.0 выделяет не только такие элементы структуры, как колонтитулы, сноски, нумерацию страниц и заголовков, подписи картинок и графиков, но и восстанавливает оглавление документа, стили шрифтов и заголовков.

Среди ключевых возможностей ABBYY FineReader Engine 10:

  • поддержка 198 языков распознавания;
  • высокое качество распознавания азиатских языков: точность распознавания китайского, японского и корейского повышена на 40%;
  • поддержка многоязычных документов;
  • специальные функции обработки фотографий в документах;
  • распознавание более 15 видов одномерных и основных двумерных штрихкодов.
Вам также могут понравиться