Byte/RE ИТ-издание

ABBYY Recognition Server IFilter для поиска в графических файлах

Компания ABBYY представила свою новую разработку – ABBYY Recognition Server IFilter. С этим решением становится возможным полнотекстовый поиск по содержимому графических документов, хранящихся на серверах и компьютерах организации. Теперь поисковые системы Microsoft могут индексировать графические документы для последующего поиска по их содержимому.

Зачастую крупные организации сталкиваются с отсутствием оперативного доступа к корпоративной информации. Чтобы найти необходимые документы в электронных архивах компании, сотрудникам приходится прикладывать значительные усилия, что повышает издержки времени и соответственно снижает эффективность работы. Семейство продуктов Microsoft SharePoint в числе прочего предлагает мощный сервис корпоративного поиска, позволяющий быстро находить нужную информацию как в структурированных, так и в неструктурированных источниках данных. Схема работы сервиса такова: поисковый агент SharePoint периодически обходит корпоративные библиотеки и автоматически индексирует новые или недавно изменённые документы, после чего они становятся доступными для поиска.

Однако графические форматы документов до сих пор были непригодны. А ведь важные для организации документы (копии отсканированных договоров, факсы, входящая корреспонденция, а также архивы газет, журналов и книг) нередко сохраняются в графическом виде, что делает поиск по их содержимому невозможным.

Интегрируясь в поисковый модуль SharePoint, решение ABBYY успешно решает эту проблему: в его состав входит специальный плагин IFilter, благодаря которому поисковый сервис Microsoft может задействовать программный продукт ABBYY Recognition Server для непосредственного извлечения содержимого из файлов графических форматов. Текстовые файлы поисковый агент SharePoint индексирует самостоятельно, а для извлечения данных из изображений привлекает решение ABBYY: IFilter передает изображения в ABBYY Recognition Server, система распознаёт документы и затем возвращает распознанный текст в Microsoft SharePoint Server для индексирования. Важно, что обработка изображений не приводит к дополнительной загрузке ресурсов SharePoint: ABBYY Recognition Server устанавливается на отдельный сервер, причём производительность решения может быть в любой момент повышена путём подключения к нему дополнительных мощностей.

Помимо интеграции с Microsoft SharePoint, ABBYY Recognition Server IFilter может работать и с Microsoft Windows Search, системой локального поиска на компьютере пользователя.

Вам также могут понравиться