Новые ускорители AMD Instinct
Корпорация AMD объявила о выпуске новых ускорителей серии AMD Instinct MI200 – первых ускорителей GPU эксафлопсного класса. Серия включает самый быстрый в мире ускоритель высокопроизводительных вычислений и искусственного интеллекта AMD Instinct MI250X.
Ускорители серии Instinct MI200, созданные на базе архитектуры AMD CDNA 2, обеспечивают высокую производительность приложений для широкого набора рабочих нагрузок HPC. Ускоритель MI250X обеспечивает более высокую (до 4,9 раз) производительность, чем конкурентные ускорители, для приложений HPC двойной точности (FP64). Пиковая теоретическая производительность в операциях половинной точности (FP16) для рабочих нагрузок ИИ превосходит 380 терафлопс, что позволяет применять новые подходы к ускорению проведения исследований, использующих большие данные.
AMD в сотрудничестве с Министерством энергетики США, Национальной лабораторией Ок-Ридж и HPE разработала суперкомпьютер Frontier, пиковая вычислительная мощность которого составит более 1,5 эксафлопс. Благодаря оптимизированным процессорам AMD EPYC третьего поколения и ускорителям AMD Instinct MI250X этот суперкомпьютер расширит границы научных открытий, увеличив производительность ИИ, аналитики и моделирования в масштабе, помогая ученым выполнять больше вычислений, выявлять новые закономерности в данных и разрабатывать инновационные методы анализа данных для ускорения научных открытий.
Ключевые возможности и особенности ускорителей серии AMD Instinct MI200:
• архитектура AMD CDNA 2 – матричные ядра второго поколения ускоряют матричные операции FP64 и FP32, обеспечивая в 4 раза более высокую теоретическую производительность FP64 по сравнению с GPU AMD предыдущего поколения;
• технология упаковки чипов – дизайн GPU с несколькими ядрами и технологией 2,5D Elevated Fanout Bridge (EFB) обеспечивает в 1,8 раза больше ядер и в 2,7 раза большую пропускную способность памяти по сравнению с GPU AMD предыдущего поколения. Он предлагает совокупную пиковую теоретическую пропускную способность памяти в 3,2 Тбайт/с;
• технология AMD Infinity Fabric 3-го поколения – до 8 каналов Infinity Fabric соединяют AMD Instinct MI200 с CPU EPYC 3-го поколения и другими GPU в узле для обеспечения единой когерентности памяти CPU/GPU и максимальной пропускной способности системы. Это позволяет процессорным кодам легче использовать возможности ускорителей.
AMD ROCm – это открытая программная платформа, позволяющая задействовать мощь ускорителей AMD Instinct для научных открытий. Платформа ROCm построена на основе открытого исходного кода, поддерживая среды различных производителей ускорителей и архитектур. С ROCm 5.0 AMD расширяет свою открытую платформу, обеспечивающую работу приложений HPC и AI, с помощью ускорителей AMD Instinct серии MI200, повышая доступность ROCm для разработчиков и обеспечивая ведущую производительность в ключевых рабочих нагрузках.
С помощью AMD Infinity Hub исследователи, специалисты по обработке данных и конечные пользователи могут легко найти, загрузить и установить контейнерные приложения для высокопроизводительных вычислений и ML-фреймворки, которые оптимизированы и поддерживаются ускорителями AMD Instinct и ROCm. В настоящее время хаб предлагает ряд модулей, поддерживающих ускорители Radeon Instinct MI50, AMD Instinct MI100 или AMD Instinct MI200, включая несколько приложений, таких как Chroma, CP2k, LAMMPS, NAMD, OpenMM и другие, а также популярные ML-фреймворки TensorFlow и PyTorch. В хаб постоянно добавляются новые модули.
AMD Instinct MI250X и AMD Instinct MI250 доступны в форм-факторе открытого модуля ускорителя вычислений или OCP Accelerator Module (OAM). AMD Instinct MI210 будет доступен в форм-факторе карты PCIe в OEM-серверах.
В настоящее время ускоритель AMD MI250X доступен в суперкомпьютере HPE Cray EX, а в первом квартале 2022 г. ожидаются дополнительные ускорители AMD Instinct серии MI200 в системах от основных OEM и ODM партнеров на корпоративных рынках. Среди них ASUS, ATOS, Dell Technologies, Gigabyte, Hewlett Packard Enterprise (HPE), Lenovo, Penguin Computing и Supermicro.