Универсальная платформа NVIDIA для HPC-вычислений и задач ИИ
Компания NVIDIA представила HGX-2 – первую унифицированную вычислительную платформу для высокопроизводительных вычислений и вычислений в области искусственного интеллекта. Ее производительность в задачах искусственного интеллекта достигает 2 PFLOPS.
Облачная серверная платформа с поддержкой произвольных вычислений (multi-precision) позволяет выполнять вычисления высокой точности FP64 и FP32 для научных исследований и моделирования, а также поддерживает FP16 и Int8 для обучения ИИ и инференса. Такая универсальность отвечает требованиям приложений, сочетающих HPC-вычисления и работу с ИИ.
Как отмечают в NVIDIA, мир вычислений изменился, эффект от масштабирования CPU заметно сократился, а спрос на вычисления растет драматическими темпами. Новая платформа NVIDIA на базе GPU с тензорными ядрами предлагает мощные универсальные возможности, позволяющие выполнять как HPC, так и вычисления для ИИ. По данным компании, скорость обучения ИИ-сетей на платформе HGX-2 достигает 15500 изображений в секунду в бенчмарке ResNet-50, что позволяет заменить до 300 серверов на базе CPU.
Платформа поддерживает интерфейс NVIDIA NVSwitch, который позволяет объединить 16 GPU NVIDIA Tesla V100 с тензорными ядрами, превратив их в единый гигантский графический процессор со скоростью вычислений 2 PFLOPS в задачах ИИ. Первой системой на базе платформы HGX-2 стала недавно анонсированная NVIDIA DGX-2.
Четыре производителя серверов – Lenovo, QCT, Supermicro и Wiwynn — объявили о планах выпуска собственных систем на базе NVIDIA HGX-2 в этом году. Кроме того, четыре ведущих мировых ODM-производителя – Foxconn, Inventec, Quanta и Wistron – также готовят к выпуску системы на базе HGX-2, предназначенные для установки в крупнейшие облачные дата-центры.
HGX-2 входит в семейство GPU-ускоренных серверных платформ NVIDIA, предназначенных для широкого спектра вычислений ИИ, HPC и ускоренных вычислений с оптимальной производительностью. Эти платформы выстраивают экосистему серверов для дата-центров, оптимально сочетая GPU, CPU и интерфейсы для задач обучения (HGX-T2), инференса (HGX-I2) и супервычислений (SCX).