Byte/RE ИТ-издание

Решение GreenData для интеллектуальной обработки документов

Компания GreenData объявила о выводе на рынок решения GreenData.Mind IDP, предназначенного для распознавания, классификации и извлечения данных из документов. Это первое самостоятельное прикладное решение на базе ИИ-модуля GreenData.Mind. Разработка ориентирована на компании, которым требуется не весь набор ИИ-инструментов платформы, а конкретная система обработки документов (Intelligent Document Processing) для автоматизации документооборота.

Решение GreenData.Mind IDP предназначено для интеллектуальной обработки типовых и нетиповых документов, среди которых паспорта и другие удостоверения личности, финансовая отчетность, юридические документы, заявления, письма и выписки. Новое решение позволяет автоматически определять тип документа, извлекать атрибуты, декомпозировать многостраничные файлы, сопоставлять данные со структурой полей, а также передавать результаты для дальнейшей обработки в корпоративные системы.

В основе продукта лежит поэтапный подход к распознаванию документов. GreenData.Mind IDP использует модели для классификации и определения структуры документов, OCR-сервисы нового поколения на базе визуальных языковых моделей (VLM). Модели дообучаются на внутренних наборах данных GreenData, позволяя адаптировать open-source решения под контекст российского enterprise.

Большие языковые модели (LLM) используются в части распознавания нетиповых документов – это помогает извлекать из выделенных фрагментов документа требуемую структуру данных. Такой подход позволяет адаптировать систему под новые типы документов быстрее, чем при классическом шаблонном распознавании, и использовать ее в процессах, где документы отличаются по формату, структуре и составу полей.

Кроме того, решение поддерживает работу с PDF, изображениями, электронными таблицами, текстовыми документами, презентациями и архивами. Благодаря этому GreenData.Mind IDP можно использовать для обработки всего потока входящей документации – от массовой загрузки файлов до верификации и передачи данных в целевые ИТ-системы.

Как отмечают в GreenData, в компании видят отдельный спрос именно на IDP-системы. Для заказчиков искусственный интеллект интересен как прикладной инструмент, который решает конкретную задачу, например, сокращает ручной ввод данных или ускоряет проверку документов и снижает нагрузку на сотрудников. Более того, IDP-решения позволяют оцифровать и архивные документы – это подготавливает площадку и упрощает внедрение других технологий, например, ИИ-ассистентов.

GreenData.Mind IDP может применяться в CRM-системах, кредитных и транзакционных конвейерах, антифрод-системах, процессах планового и внепланового мониторинга, корпоративном документообороте, финансовом анализе, клиентском онбординге, а также в других сценариях, где требуется оперативное извлечение данных из документов. Особенно востребованным решение может стать для банков, финансовых организаций, промышленных компаний, госсектора и enterprise-компаний с большим объемом документов и высокими требованиями к контролю данных.

Сам модуль GreenData.Mind включен в Единый реестр российского ПО в составе платформы GreenData. А наличие GreenData.Mind IDP в его составе упрощает внедрение решения в проектах с требованиями к импортонезависимости, контролю технологического стека и использованию отечественного ПО.

Вам также могут понравиться