Byte/RE ИТ-издание

Технология распознавания иероглифов от Smart Engines

Российская компания Smart Engines представила на MWC 2019 технологию распознавания иероглифов. В этой разработке применены глубокие разреженные дискретные нейронные сети, которые позволяют распознавать свыше 45 тыс. иероглифов на документах со сложным фоном и при различных условиях освещения, в том числе 20941 китайских, 12912 японских и 11172 корейских.

Новая функциональность интегрирована в систему искусственного интеллекта Hieroglyph, которая теперь на уровне платформы поддерживает распознавание 800+ типов удостоверяющих документов на более чем 40 языках. Это ID-карты, паспорта, водительские права, визы и другие документы более 170 стран мира. Распознавание иероглифической письменности позволило расширить потенциальную аудиторию продуктов Smart Engines более чем на 1,5 млрд человек.

Распознавание иероглифов – сложная научно-техническая задача, при ее решении разработчики искусственного интеллекта имеют дело с десятками тысяч символов, многие из которых незначительно отличаются друг от друга. В процессе разработки специалисты Smart Engines смогли преодолеть важный технологический барьер, перейдя от методов классических OCR, рассчитанных на распознавание символов на белом фоне на качественных сканах, к компьютерному зрению, способному распознавать иероглифы даже в удостоверениях личности в видеопотоке и на фотографиях. Как поясняют в компании, к сложному устройству самих иероглифов добавляются визуальные помехи, вызванные наличием фона у документа, и искажения, связанные с разной яркостью освещения и ракурсом съемки. Созданная в Smart Engines архитектура нейронных сетей обеспечивает быстродействие и качество распознавания иероглифов в документах на уровне символов латинского алфавита и кириллицы.

Технология предназначена для использования в процессах регистрации, идентификации и верификации пользователей в мобильных приложениях и интернет-сервисах банковского сектора, страхования, финтеха, шеринговой экономики, транспорта, телекома и т.д. Уже сейчас разработчикам доступны библиотеки распознавания удостоверяющих документов Китая, Гонконга, Японии и Кореи для iOS, Android, Linux, Windows, macOS и Solaris.

Вам также могут понравиться