Byte/RE ИТ-издание

Новые возможности умного поиска в Directum RX

Компания Directum представила новшества в системе Directum RX, расширяющие ее возможности в части интеллектуальной обработки. В линейке решений Directum RX появилась «Фоновая индексация документов», а в саму систему интегрированы алгоритмы нечеткого поиска данных с помощью Elasticsearch. «Фоновая индексация документов» извлекает текстовый слой документа для удобного поиска по содержимому, а алгоритмы нечеткого поиска помогают системе точнее определять контрагента и адресата при занесении документов.

«Фоновая индексация документов» позволяет работать с документами, для которых недоступен поиск по содержимому. Это, например, документы, загруженные до внедрения интеллектуальных сервисов Ario или созданные из файла или других программ. Решение автоматически извлекает из документа текстовый слой, не требуя участия человека, нужно только настроить расписание процесса, виды и количество обрабатываемых за раз документов. В результате документы становятся доступными для поиска по содержимому, и пользователям их проще найти. Нагрузку на сетевые ресурсы можно гибко масштабировать.

Алгоритмы нечеткого поиска обеспечивают гибкий подбор контрагента и адресата. Сервисы Ario извлекают из текста поступившего в систему документа факты, на основании которых в системе заполняется его карточка. Бывает, что в документе не хватает реквизитов или из-за качества изображения какой-то из них не распознается. Для таких случаев и разработаны алгоритмы нечеткого поиска – они позволяют избежать ручного занесения информации. Сервисы Ario извлекают реквизиты организации-отправителя (ИНН, КПП и наименование) и получателя (ФИО); если не все факты распознаны, имеющиеся данные передаются в Elasticsearch, что помогает с большей долей вероятности идентифицировать контрагента и адресата, даже если в документе, например, есть только КПП и нет ИНН. В перспективе с помощью этой функциональности можно будет с высокой вероятностью заполнять любые справочные реквизиты.

Вам также могут понравиться