Технология реконструкции 3D-моделей и распознавание объектов
Чтобы обеспечить предприятию требуемый режим безопасности, как правило, необходима идентификация лиц, имеющих право доступа на конкретный объект. При этом для задачи распознавания лиц в потоке разница по времени на порядок (5 или 0,5 с) часто является критической. Как отмечают эксперты, фактически речь идет о разнице между работающей и неработающей системами. При плотном потоке через рубеж контроля может проходить 1–2 человека в секунду. Соответственно, скорость распознавания лиц должна укладываться во временной интервал 0,5 с на человека.
Для решения этой задачи российская компания «Вокорд» разработала технологию реконструкции трехмерных моделей объектов реального мира по сериям синхронных снимков. В основе данной технологии 3D-реконструкции лежит метод поиска сопряженных точек на нескольких синхронно снятых изображениях. Благодаря такому подходу система может работать без специальной (структурированной) подсветки, в том числе на значительном удалении от объекта съемки. В системе используются мегапиксельные видеокамеры Vocord NetCam нового поколения, работающие в синхронном режиме. Отметим, что Vocord NetСam представляет собой серию сетевых камер с разрешением видеосенсора от одного до пяти мегапикселов, с прогрессивной разверткой, интерфейсом Gigabit Ethernet и технологией RemoteDrive. Серия этих устройств включает как обычные модели видеокамер, так и специализированные ИК-камеры для съемки в условиях плохой освещенности и камеры с линейным сенсором.
Именно такие оптико-электронные приборы формируют изображения без сжатия, что позволяет эффективно искать сопряженные точки и существенно повышает точность реконструкции. Специально для работы с цифровыми камерами Vocord NetCam был разработан новый алгоритм компрессии StreamLogic с межкадровым сжатием, основанный на вейвлетном преобразовании (математические функции, позволяющие анализировать различные частотные компоненты данных). Использование StreamLogic позволяет эффективно хранить видеоданные и передавать их по сети.
Следует отметить, что алгоритм поиска сопряженных точек реализован на графических процессорах (GPU) компании NVIDIA, использующих фирменную технологию CUDA (Compute Unified Device Architecture). В этой программно-аппаратной архитектуре можно использовать графический процессор для вычислений общего назначения. Напомним, что GPU, в отличие от CPU, не требует огромной кэш-памяти. Вычислительная мощь массивно-параллельной архитектуры GPU (NVIDIA Quadro 3800 FX) позволяет достичь десятикратного прироста производительности алгоритмов реконструкции в сравнении с реализациями, работающими на центральном процессоре (CPU), например, Intel Core2 Quad Q6600 2,4. Архитектура CUDA поддерживает широкий набор популярных языков программирования и API, включая Microsoft DirectCompute, OpenCL, CUDA C, CUDA Fortran и др. NVIDIA продолжает дальше развивать среду разработки CUDA, увеличивая спектр инструментов и библиотек для исследователей и ученых.
В простейшем случае 3D-реконструкция делается по снимкам с двух камер, однако добавление камер увеличивает глубину охвата объекта реконструкции и повышает точность реконструкции. В частности, с помощью четырех камер можно реконструировать лицо человека «от уха до уха», а с помощью восьми – всю голову (глубина охвата в этом случае равна 360 градусам).
Основные области применения данной технологии:
- профессиональные системы видеонаблюдения;
- системы стереозрения и автоматической реконструкции трехмерных изображений (3D), например, в медицине;
- получение трехмерных изображений микроскопических объектов посредством микроскопа и видеокамер;
- системы биометрической идентификации человека;
- системы некооперативного распознавания символов, в частности, регистрационных знаков автомобилей;
- создание 3D-фильмов с возможностью интерактивной смены точки зрения в процессе просмотра;
- 3D-моделирование реальных помещений и архитектурных сооружений.
Система Vocord FaceControl 3D работает в некооперативном режиме, что делает возможным ее использование не только в системах контроля доступа, но и в системах биометрического видеонаблюдения для обеспечения общественной безопасности в метро, наземном транспорте и в местах массового пребывания людей. В дальнейших планах компании – доведение прототипа системы до промышленного уровня исполнения и поиск новых областей использования.