За последнее десятилетие усилиями разработчиков OCR-решений технологии оптического распознавания символов прочно вошли в практику мира ИТ как для частных пользователей, так и для корпоративных заказчиков. Сегодня уже невозможно представить себе, чтобы в какой-то организации сохранились методы преобразования бумажных документов в оцифрованный вид, общепринятые еще в начале 90-х годов, — путем перепечатки текстов… Но нет предела совершенству: поставщики OCR-продуктов постоянно улучшают свою продукцию, увеличивая скорость работы решений, повышая точность распознавания, расширяя спектр обрабатываемых документов.
В последние дни августа один из ведущих поставщиков OCR-продуктов, компания ABBYY (http://www.abbyy.ru) представила новую, 8-ю версию системы распознавания документов ABBYY FineReader. Это решение предназначено для преобразования отсканированных бумажных документов, например, писем, договоров, журнальных или газетных статей, книг, факсов в электронные форматы для последующего редактирования, архивирования или поиска. Система также позволяет распознавать и редактировать PDF-файлы.
Первая версия ABBYY FineReader была выпущена еще в 1993 г. и быстро стала одним из самых популярных OCR-решений в нашей стране и хорошо известным во всем мире. С каждым обновлением этот продукт наращивал качество обработки документов и расширял набор предоставляемых пользователям функций. Восьмая версия не стала исключением.
В основе FineReader 8.0 лежат технологические и функциональные улучшения, направленные на повышение качества распознавания, сокращение времени на обработку документов и расширение областей применения продукта. Так, благодаря новым возможностям работы с документами, снятыми цифровой камерой, теперь можно использовать фотоаппарат как хорошую альтернативу сканеру в случаях, когда последнего нет под рукой, например, в библиотеке, на выставке или во время путешествия. А новые алгоритмы обработки изображений низкого разрешения позволяют лучше распознавать документы, отсканированные цифровыми копировальными аппаратами, а также факсы низкого качества.
Новый FineReader распознает не только привычные бумажные документы и PDF-файлы, но и цифровые фотографии документов и скриншоты. Программа сама определяет, получено ли изображение со сканера, с цифровой камеры или по факсу, и автоматически выбирает оптимальный способ обработки.
В ABBYY FineReader 8.0 появились следующие основные новшества по сравнению с предыдущим вариантом программы.
Распознавание изображений, полученных с помощью цифровой камеры. Точность распознавания текста на фотографиях повышена на 40%, так что теперь для ввода текста компьютер необязательно оснащать сканером — достаточно цифрового фотоаппарата. Программа адаптируется к этим изображениям, учитывая такие их особенности, как неравномерная освещенность, нечеткая фокусировка и искажения строк.
Менеджер сценариев. Эта новая функция ABBYY FineReader 8.0 позволяет автоматизировать повторяющиеся действия в процессе распознавания документов (например, открыть несколько изображений, распознать их, а результаты сохранить в один PDF-файл). Такой набор операций можно объединить в один сценарий, вызов которого доступен по команде из меню.
ABBYY Screenshot Reader. Новое приложение может распознать любую область экрана компьютера и перевести в редактируемый формат тексты, которые нельзя скопировать в буфер обмена обычным способом, например, тексты системных сообщений, страницы сайтов с использованием Flash или субтитры DVD-фильма.
Создание защищенных PDF-файлов. Сохраняя результаты распознавания в формате PDF, можно разграничивать доступ к файлу, задавая права на его открытие, печать и редактирование.
ABBYY Hot Folder & Scheduling. Новое приложение-планировщик, доступное в восьмой версии, ориентировано на бизнес-аудиторию. Оно позволяет распознавать документы в автоматическом режиме, без участия пользователя, например, ночью. Кроме того, данное приложение позволяет интегрировать ABBYY FineReader с сетевыми и персональными многофункциональными устройствами, настроив систему на автоматическую обработку изображений, получаемых при помощи таких устройств.
Распознавание изображений низкого качества. Изображения документов, которые были отсканированы с низким разрешением, например, цифровыми копировальными аппаратами, ABBYY FineReader 8.0 распознает на 15% лучше, чем предыдущая версия. Также на 30% повышено качество распознавания факсов.
В дополнение к названным возможностям, в новой версии FineReader количество поддерживаемых языков увеличено до 179, из них 36 со словарной поддержкой. Появился режим ускоренного распознавания, который будет полезен для сокращения времени на обработку документов высокого качества печати или при индексировании больших архивов документов. Кроме того, теперь продукт позволяет задавать для сохраняемых документов дополнительные свойства, такие, как автор, тема, короткое описание, ключевые слова, которые в дальнейшем могут использоваться системами индексирования и поиска. Восьмая версия FineReader поддерживает новый формат сохранения Microsoft Reader (LIT), умеет распознавать и сохранять гиперссылки и внутренние ссылки в PDF-файлах.
ABBYY FineReader 8.0 поставляется в двух версиях. Professional Edition — это профессиональный продукт для распознавания документов, предназначенный для индивидуального использования дома или в небольшом офисе, где потребности в распознавании есть у одного-двух сотрудников. Corporate Edition — решение, ориентированное на бизнес-аудиторию. Оно предоставляет возможности коллективной работы над задачами распознавания документов, обеспечивает интеграцию с многофункциональными устройствами и планирование задач распознавания благодаря приложению-планировщику ABBYY Hot Folder & Scheduling. Продукт предлагает оптимизированные под использование в локальной сети режимы установки и лицензирования.