Новые системы распознавания от Smart Engines
Компания Smart Engines представила новое поколение систем распознавания паспортов, других удостоверений личности, банковских карт, баркодов и документов с возможностью аутентификации и биометрической верификации. Все продукты новой линейки: Smart ID Engine, Smart Code Engine и Smart Document Engine – разработаны в соответствии с принципами ответственного ИИ и предназначены для защиты пользователей и бизнеса от мошеннических действий с документами. Компания является единым поставщиком технологий для быстрого и безопасного извлечения данных, аутентификации документов с проверкой «живости» (document liveness detection) и признаков компрометации (computational document forensics), распознавания лиц (face matching) для верификации пользователей.
Smart ID Engine позволяет распознавать российский паспорт и еще 1482 удостоверяющих документа 210 юрисдикций мира с поддержкой 99 языков, включая иероглифическую письменность. Smart Code Engine объединяет решения для оптического считывания (сканирования) данных банковских карт, баркодов и машиночитаемой зоны (MRZ). Smart Document Engine – система для автоматической классификации, распознавания и выделения реквизитов из структурированных, слабоструктурированных и неструктурированных документов: справки по форме 2-НДФЛ, бухгалтерского баланса, платежного поручения и других. Новые продукты доступны для интеграции в мобильные, десктопные и серверные приложения и работают автономно, обеспечивая безопасность обработки персональных и чувствительных данных.
В анонсированных продуктах обновлена фирменная технология ИИ GreenOCR, в которой внедрена новая 8-разрядная модель вычислений глубоких нейронных сетей. Технология создана в рамках подхода Green AI и программы устойчивого развития, реализуемой под эгидой ООН. Второе поколение GreenOCR позволяет снизить энергопотребление при распознавании, а также обрабатывать документы быстрее. Как отмечают в компании, на современных смартфонах производительность распознавания выросла на 10%, а на бюджетных устройствах с ограниченной вычислительной мощностью – на 30%. Благодаря новой технологии Deep Visual Memory, модульной архитектуре, дополнительной алгоритмической и кодовой оптимизации удалось также сократить размер дистрибутива при увеличении количества новых документов и их шаблонов. Для российского паспорта дистрибутив сокращен на 35%, для документов США и европейских ID карт – на 25%, для паспортов всего мира – на 15%, для банковских карт – на 35% и для баркодов – на 40%. Нововведения обеспечивают продление срока работы мобильных устройств на одном заряде аккумулятора.
Важная особенность новинок –поддержка распознавания арабской письменности и языков индо-иранской группы, что расширяет рынок сбыта в странах Ближнего Востока, Юго-восточной Азии и Африки. Распознавание арабского языка внедрено для 73 типов документов, включая паспорта, ID-карты и водительские удостоверения.
Smart ID Engine позволяет быстро распознавать документы в видеопотоке, на фотографиях и изображений со сканеров. Так, время распознавания данных разворота паспорта гражданина России на iPhone XR составляет 200 мс на 1 кадр. Решение всегда работает автономно на конечном устройстве (смартфоне, умной камере, терминале, компьютере, сервере), не требует сетевого соединения и не передает данные клиентов на обработку в сторонние сервисы и/или третьим лицам для ручного ввода. Таким образом, Smart ID Engine позволяет соблюдать стандарты безопасности обработки персональных данных (ФЗ-152, GDPR, CCPA) и выполнять требования регуляторов в части KYC/AML.
В процессе распознавания в видеопотоке Smart ID Engine умеет выбирать лучший кадр с изображением документа для сохранения в учетной системе компании и наименее поврежденную фотографию лица на документе, которая извлекается как отдельный реквизит. Биометрическая верификация пользователя в новых продуктах реализована на базе разработанной исследователями Smart Engines собственной технологии распознавания лиц, которая позволяет провести сверку фотографии лица в документе с лицом владельца на другой фотографии, в том числе на сделанном пользователем селфи.
Используемые в Smart ID Engine комплексные методы проверки «живости» документов в автоматическом режиме определяют попытки использования муляжей, фотокопий, а также съемку образа документа с экрана монитора компьютера, планшета или смартфона. Алгоритмы ИИ детектируют голографические элементы защиты, специальные визуальные элементы защиты (вензеля, орнаменты и т.д.), проверяют геометрию бланка и контролируют поведение документа в реальных условиях наблюдения в видеопотоке и на отдельных кадрах.
Решение Smart Code Engine обеспечивает автоматическое считывание данных банковских карт, машиночитаемой зоны и баркодов в широком классе условий захвата изображений. Система устойчива к перепадам освещения, ракурсу съемки, перекосам, углу поворота, избыточному и недостаточному освещению, она работает в реальном времени и способна на современных устройствах распознавать банковские карты и другие объекты со скоростью 25 кадров в секунду.
В платежных сервисах Smart Code Engine позволяет сканировать и распознавать банковские дебетовые и кредитные карты платежных систем МИР, VISA, MasterCard, American Express, JCB, MIR, Maestro, UnionPay и Diners Club, выпущенные различными странами мира, обеспечивая извлечение не только номера (12-19 цифр), но и срока действия и имени владельца. Поддерживается распознавание любых видов банковских карт: с нанесением данных выдавливанием, гравировкой и плоской печатью, с горизонтальным и вертикальным расположением идентификационных данных, карт, на которых данные расположены как на лицевой, так и на обратной стороне. В новом продукте доступно распознавание банковских карт с номером IBAN, которые широко распространены в странах Евросоюза.
Решение обеспечивает автоматический поиск и распознавание данных машиночитаемых зон документов (MRZ), выполненных в соответствии с международными стандартами ISO/ICAO (IEC 7501-1/ICAO Document 9303 ISO) и локальными (Россия, Франция, Швейцария, Болгария, Эквадор) стандартами, на паспортах, идентификационных картах, визах, водительских удостоверениях и других документах. При распознавании документов с MRZ доступны инструменты проверки «живости» и консистентности данных.
Smart Code Engine также обеспечивает качественное распознавание одно- и двумерных штрихкодов из различных счетов и квитанций, включая счета за коммунальные и государственные услуги, налоговых документов и счетов, а также билетов, чеков, счетов-фактур, ценников, плакатов и объявлений.
Решение Smart Document Engine решает задачи автоматического извлечения данных из типовых форм документов, форм строгой отчетности, первичных бухгалтерских, финансовых, налоговых, юридических, нотариальных и других документов, используемых в документообороте, различных тестов и опросников, на сканах и фотографиях. Система позволяет автоматически обрабатывать одно- и многостраничные документы с фиксированным положением реквизитов, документы с плавающим расположением блоков и реквизитов, неструктурированные текстовые документы и блоки, таблицы, надписи или даже отдельные строки и метки.
Продукт позволяет не только быстро распознавать данные из анкет, форм и документов, но и проверять их на соблюдение формальностей: есть ли подпись, печать или логотип, правильного ли они цвета, находятся ли они в нужном месте документа. Можно также проверить, что надписи, которые должны быть сделаны от руки, действительно рукописные. Кроме того, в процессе обработки возможна проверка целостности и неизменности бланка, документа или его части.
В коробочном варианте поставки Smart Document Engine поддерживает распознавание справки по форме 2-НДФЛ, формы бухгалтерского баланса (ОКУД 0710001), отчет о финансовых результатах (ОКУД 0710002), свидетельства ИНН и платежное поручение (ОКУД 0401060).
В обновленных продуктах Smart Engines для удобства интеграции разработчикам стали доступны .NET-обертки для Linux-систем, улучшенные интерфейсы на C++ и Java, а также обеспечена поддержка React и Flutter для мобильных SDK. Вся линейка продуктов оптимизирована для архитектур «Эльбрус», SPARC, MIPS, ARM, x86 и совместима с ОС iOS, Android, МОС «Аврора», «Эльбрус», Linux, Windows, macOS и Solaris. Модульная архитектура обеспечивает минимизацию размера программной библиотеки, так как позволяет конфигурировать SDK под конкретного заказчика и включать в него только необходимую ему функциональность.