Ускоритель HPC AMD Instinct MI100 для научных исследований

--> Дата: Ноя 26, 2020 90

Компания AMD анонсировала новый ускоритель Instinct MI100 – самый быстрый в мире GPU и первый, по заявлению производителя, серверный GPU x86, преодолевший барьер производительности в 10 терафлопс (FP64). Поддерживаемый новыми вычислительными платформами Dell, Gigabyte, HPE и Supermicro, MI100 в сочетании с CPU AMD EPYC и открытой программной платформой ROCm 4.0 призван ускорить новые научные открытия.

Графический процессор AMD Instinct MI100, построенный на новой архитектуре AMD CDNA, обеспечивает новый класс ускоренных систем для HPC и AI в паре с процессорами AMD EPYC 2-го поколения. MI100 показывает пиковую производительность до 11,5 терафлопс в FP64 для HPC и пиковую производительность до 46,1 терафлопс в FP32 Matrix для ИИ и машинного обучения. Благодаря технологии AMD Matrix Core процессор MI100 также обеспечивает почти 7-кратное увеличение теоретической пиковой производительности с плавающей запятой в FP16 для учебных нагрузок по ИИ по сравнению с предыдущим поколением ускорителей AMD.

ПО AMD ROCm, набор инструментов с открытым исходным кодом, состоящий из компиляторов, API и библиотек программирования, используется разработчиками экзафлопсных программ для создания высокопроизводительных приложений. ROCm 4.0 был оптимизирован для обеспечения производительности для систем на базе MI100. Компилятор усовершенствован до открытого исходного кода и унифицирован для поддержки OpenMP 5.0 и HIP. Фреймворки PyTorch и Tensorflow, оптимизированные для ROCm 4.0, теперь могут достигать более высокой производительности с MI100.

Ключевые возможности и особенности ускорителя AMD Instinct MI100:

• Новая архитектура AMD CDNA – созданная для основы графических процессоров AMD в эпоху экзафлопности и являющаяся сердцем ускорителя MI100, эта архитектура обеспечивает ему производительность и энергоэффективность.

• Высокая производительность FP64 и FP32 для рабочих нагрузок в HPC – обеспечивает пиковую производительность 11,5 TFLOPS для FP64 и 23,1 TFLOPS для FP32, позволяя исследователям ускорить открытия в таких отраслях, как науки о жизни, энергетика, финансы и т.д.

• Новая технология матричного ядра для HPC и ИИ – сверхвысокая производительность для всего спектра матричных операций одинарной и смешанной точности, таких как FP32, FP16, bFloat16, Int8 и Int4, сконструированная для ускорения конвергенции HPC и ИИ.

• Технология AMD Infinity Fabric 2-го поколения – Instinct MI100 обеспечивает примерно двукратную пиковую пропускную способность однорангового (P2P) входа/выхода по сравнению с PCIe 4.0 с совокупной пропускной способностью до 340 Гбайт/с на карту с тремя каналами AMD Infinity Fabric. В сервере MI100 GPU можно настроить с двумя полностью подключенными четырьмя кластерами графических процессоров, каждый из которых обеспечивает пропускную способность до 552 Гбайт/с входа/выхода P2P для быстрого обмена данными.

• Сверхбыстрая память HBM2 – объем высокоскоростной памяти HBM2 с тактовой частотой 1,2 ГГц составляет 32 Гбайт, обеспечивается пропускная способность памяти 1,23 Тбайт/с для поддержки больших наборов данных и устранения узких мест при перемещении данных внутри и снаружи памяти.

• Поддержка PCIe Gen 4.0 – эта новейшая технология обеспечивает пиковую теоретическую пропускную способность до 64 Гбайт/с при передаче данных с CPU на GPU.

До конца года ожидается выпуск ускорителей AMD Instinct MI100 в системах от основных OEM и ODM партнеров, в числе которых Dell, Gigabyte, HPE и Supermicro.