Byte/RE ИТ-издание

Ускорители Nvidia Tesla для искусственного интеллекта

Компания Nvidia представила новые решения для платформы глубокого обучения на базе архитектуры Pascal – графические ускорители Tesla P4 и P40 и ПО, которое ускоряет и оптимизирует анализ информации для сервисов, использующих искусственный интеллект (AI).

Ускорители Tesla P4 и P40 специально созданы для ускорения операций инференса – применения обученных глубоких нейронных сетей для распознавания речи, изображений и текста в ответ на запрос пользователей или устройств. Основанные на архитектуре Pascal, новые графические процессоры используют специальные инструкции инференса на базе 8-разрядных (INT8) данных, обеспечивая ответную реакцию в 45 раз быстрее по сравнению с CPU и в 4 раза быстрее по сравнению с GPU, представленными меньше года назад.

Ускорители Tesla P4 отличаются экономичностью и предназначены для гипермасштабируемых дата-центров. Благодаря малым размерам и низкому энергопотреблению (от 50 Вт) они подходят для любых серверов. По данным компании, они в 40 раз экономичнее центральных процессоров в задачах использования результатов обучения нейронных сетей при обработке данных: сервер с одним Tesla P4 может заменить 13 серверов на базе CPU, предназначенных для анализа данных, что сокращает общую стоимость владения в 8 раз, включая затраты на сервер и электричество. Tesla P40 также обеспечивает максимальную пропускную способность для задач глубокого обучения.

Решения Tesla P4 и P40 дополнены двумя новыми программными продуктами для ускорения работы AI-сервисов: Nvidia TensorRT и Nvidia DeepStream SDK.

TensorRT – это библиотека для оптимизации моделей глубокого обучения, которая обеспечивает мгновенную ответную реакцию для самых сложных сетей. Она увеличивает пропускную способность и эффективность приложений глубокого обучения путем оптимизации обученных нейронных сетей – обычно в форме 32- или 16-разрядных операций – для операций INT8 пониженной точности.

DeepStream SDK использует возможности сервера на базе решений архитектуры Pascal для одновременного декодирования и анализа до 93 видеопотоков в разрешении HD в реальном времени, в отличие от семи потоков в случае с серверами на базе двух CPU. Это позволяет решить одну из сложнейших задач в области применения AI – восприятие масштабируемого видеоконтента, что важно для таких областей , как самоуправляемые автомобили, интерактивные роботы, фильтрация и размещение рекламы.

Nvidia Tesla P4 и P40 станут доступны по всему миру в ноябре и декабре соответственно в сертифицированных серверах от сборщиков систем и партнеров по каналу.

Вам также могут понравиться