Byte/RE ИТ-издание

Платформа обработки документов Content AI: интеграция с LLM

Компания Content AI, разработчик решений для интеллектуальной обработки информации, представила новую версию IDP-платформы ContentCapture с возможностью атрибутивного распознавания документов с использованием больших языковых моделей (LLM).

IDP-платформа ContentCapture обеспечивает потоковую обработку документов любых форматов с их классификацией, извлечением, верификацией данных и их последующей отправкой в корпоративные информационные системы. Версия ContentCapture 14.8 интегрируется с российскими LLM YandexGPT и GigaChat. Совместное использование технологий OCR и LLM внутри платформы обеспечивает высокоточное извлечение данных из неструктурированных документов, таких как технические инструкции и регламенты, а также из документов с вариативной структурой расположения данных: договоров, претензий, уставов, протоколов, доверенностей и резюме.

По данным компании, после предварительного обучения платформа ContentCapture в связке с LLM достигает точности извлечения отдельных полей из неструктурированных документов до 98%. Новые функциональные возможности IDP-платформы востребованы для автоматизации работы вспомогательных подразделений, таких как бухгалтерия, HR, юридический блок, отдел продаж, служба поддержки клиентов и производственные подразделения.

Интеграция с облачной моделью позволяет снизить стоимость обработки документов, особенно в условиях ограниченной инфраструктуры. В будущих релизах планируется реализация совместного использования ContentCapture с локальными языковыми моделями для работы в закрытом контуре.

IDP-платформа ContentCapture включена в реестр отечественного ПО и имеет подтвержденную маркировку продукта с искусственным интеллектом. Решение доступно для использования в среде как Windows, так и Linux.

Вам также могут понравиться