Новая версия Cognitive Passport
Компания Cognitive Technologies анонсировала версию 3.0 системы Cognitive Passport, обеспечивающей сканирование, идентификацию и распознавание документов, удостоверяющих личность.
Качество распознавания новых российских паспортов формата А6 в новой версии улучшилось на 20%. Это стало возможным благодаря новым технологиям интеллектуального поиска, идентификации и удаления помех в документе. К помехам относятся текстурный фон, линии, голограммы и другие элементы на цветном изображении, которые накладываются на полезную текстовую информацию и препятствуют ее распознаванию традиционными средствами.
До сих пор именно линии и голограммы оставались основным препятствием для решения задачи удаления помех. В версии Cognitive Passport 3.0 этой проблеме было уделено основное внимание. Разработчики реализовали специальный алгоритм детекции и подавления линий в цвете. Задача снятия голограмм решалась с помощью модели построения картины помех по трем объектам. Суть этого алгоритма в том, что в силу топологии голографического фона российского паспорта для восстановления полной картины голографических помех на документе достаточно знать положение трех любых голограмм. Важно, что при добавлении в Cognitive Passport нового математического и алгоритмического аппарата удалось не только сохранить, но и повысить скорость обработки документов на 27%, повысив качество.
Еще одна задача, решенная в новой версии, – возможность распознавания машиночитаемой зоны (МЧЗ), появившейся в российских паспортах нового поколения, как и в аналогичных документах во многих странах мира. Основная цель введения зоны МЧЗ – упрощение процедуры считывания и значительное сокращение времени считывания основных данных. МЧЗ также является дополнительной мерой защиты бланка паспорта от подделок. При этом она выполняет функцию корректировки результатов оптического распознавания персональных данных паспорта и минимизации числа возможных ошибок распознавания. МЧЗ состоит из двух строк длиной по 44 символа каждая. В соответствии с требованиями и стандартами, предъявляемыми к машиночитаемым документам, МЧЗ содержит основную информацию, имеющуюся в этом документе.
МЧЗ также содержит контрольные цифры (контрольные суммы значений определенных полей персональных данных), которые позволяют распознавать ее с высоким качеством. Шрифт и межстрочное и межсимвольное расстояние МЧЗ жестко регламентированы. Однако на практике при выдаче паспортов нередко встречаются производственные ошибки, когда пропечатывается лишь один из элементов МЧЗ, либо часть строчки выходит за границы печати. Новая версия Cognitive Passport успешно справляется с такого рода недостатками. При этом общее качество распознавания паспортов с МЧЗ выросло примерно на 10%.
В новой версии повысилась стабильность работы. А расширение интерфейса Cognitive Passport API с сохранением обратной совместимости поможет разработчикам не переделывать приложения под новую версию.
По традиции пользователи предыдущих версий Cognitive Passport могут сделать upgrade на версию 3.0 бесплатно.