Серверы на базе NVIDIA Volta для высоких нагрузок
Компания NVIDIA и ее партнеры – Dell EMC, Hewlett Packard Enterprise, IBM и Supermicro – представили более десятка серверов на базе GPU-ускорителей Tesla V100 с архитектурой NVIDIA Volta. Эти процессоры ориентированы на задачи искусственного интеллекта (ИИ) и другие большие вычислительные нагрузки.
Графические процессоры NVIDIA V100, производительность которых в задачах глубокого обучения превышает 120 терафлопс, созданы специально для глубокого обучения нейросетей и инференса, высокопроизводительных вычислений, ускорения аналитики и других ресурсоемких вычислительных задач. Как известно, графический процессор NVIDIA V100 включает 21 млрд транзисторов, 640 Tensor-ядер, новейшую технологию NVLink и DRAM 900 Гбайт/с HBM2, что обеспечивает 50%-ный прирост производительности по сравнению с GPU предыдущего поколения. Один такой графический процессор Volta обеспечивает производительность, эквивалентную 100 центральным процессорам, что позволяет исследователям и инженерам решать задачи, которые ранее представлялись слишком сложным или невозможным.
Dell EMC, HPE, IBM и Supermicro выводят на рынок широкий спектр мультипроцессорных систем на базе V100. Анонсированы следующие новинки:
• Dell EMC – PowerEdge R740 с поддержкой до трех GPU V100 для PCIe, PowerEdge R740XD с поддержкой до трех GPU V100 для PCIe и PowerEdge C4130 с поддержкой до четырех V100 для PCIe или четырех GPU V100 для NVIDIA NVLink™ в форм-факторе SXM2;
• HPE – HPE Apollo 6500 с поддержкой до восьми GPU V100 для PCIe и HPE ProLiant DL380 с поддержкой до трех GPU V100 для PCIe;
• IBM – серверы нового поколения IBM Power Systems на базе процессора POWER9 с поддержкой нескольких GPU V100 и новейшей технологией NVLink с супербыстрым интерконнектом GPU-to-GPU и уникальным CPU-to-GPU OpenPOWER для максимально быстрой передачи данных;
• Supermicro – линейка продуктов с поддержкой новых GPU Volta включает рабочую станцию 7048GR-TR для высокопроизводительных GPU-вычислений, серверы 4028GR-TXRT, 4028GR-TRT и 4028GR-TR2 для самых требовательных приложений глубокого обучения и серверы 1028GQ-TRT для, например, сложных аналитических задач.
Ведущие китайские производители, включая Inspur, Lenovo и Huawei, также анонсировали системы на базе архитектуры Volta для дата-центров Интернет-компаний.
Процессоры V100 идут в комплекте с оптимизированным под Volta ПО, включая CUDA 9.0 и недавно обновленный SDK для глубокого обучения, в который входят TensorRT 3, DeepStream SDK и cuDNN 7, а также все основные ИИ-фреймворки. Доступны сотни тысяч GPU-ускоренных приложений для различных тяжелых задач, включая обучение нейросетей и инференс, высокопроизводительные вычисления, графику и сложных анализ данных.