Новые решения РСК для HPC
Группа компаний РСК представила в рамках европейской суперкомпьютерной конференции ISC 2021 Digital Event свои новые решения: вычислительные узлы «РСК Торнадо» на основе процессоров Intel Xeon Scalable 3-го поколения и модулей энергонезависимой памяти Intel Optane серии 200, систему хранения RSC Tornado AFS с функцией высокой доступности, решение для создания систем хранения данных RSC Storage on-Demand с поддержкой DAOS, а также специализированное решение RSC Tornado AI для создания систем ИИ и машинного обучения.
Новое решение «РСК Торнадо» предназначено для выполнения широкого спектра ресурсоемких научных и прикладных задач. Обновленная линейка интегрированных программно определяемых и реконфигурируемых решений ориентирована на применение как в составе классических высокопроизводительных систем, так и для эффективного хранения и обработки данных, а также создания систем ИИ, машинного и глубокого обучения (ML/DL).
«РСК Торнадо» на основе узлов с процессорами Intel Xeon Scalable 3-го поколения обеспечивает вычислительную плотность для архитектуры x86 в 967,45 Тфлопс на стойку (+37% по сравнению с предыдущим поколением), распределенную систему хранения на узлах RSC Storage on-Demand емкостью 2,45 Пбайт на шкаф (+36% по сравнению с предыдущим поколением) с пропускной способностью ввода-вывода на уровне 3,67 Тбайт/с (в 2 раза больше по сравнению с предыдущим поколением) и высокий показатель энергоэффективности со 100% жидкостным охлаждением в режиме «горячая вода» всех электронных компонентов. Пользователи получают линейную масштабируемость от малых систем в несколько серверов до тысяч серверов в составе больших кластеров или серверных ферм. Возможна также оптимизация стоимости конечных решений за счет поддержки открытых стандартов и новых серверных продуктов Intel.
Решение «РСК Торнадо» на основе старших моделей процессоров Intel Xeon Scalable 3-го поколения (до 40 ядер, TDP 270 Вт), модулей энергонезависимой памяти Intel Optane серии 200, твердотельных накопителей Intel SSD и высокоскоростной сети со скоростью передачи данных 200 Гбит/с имеет высокие показатели компактности и вычислительной плотности (до 153 узлов в одном стандартном шкафу высотой 42U), а также обеспечивает возможность стабильной работы вычислительных узлов в режиме «горячая вода» при температуре хладоносителя до +65 °С на входе в вычислительные узлы и коммутаторы. Работа в режиме «горячая вода» позволяет круглогодично применять режим фрикулинга (24×365) без чиллеров, используя только сухие градирни, работающие при температуре окружающего воздуха до +50°С. В результате, отмечают в РСК, среднегодовой показатель PUE системы составляет менее 1,04.
Новая интеллектуальная СХД RSC Tornado AFS с поддержкой функции высокой доступности для создания систем хранения с большим объемом данных обеспечивает надежность и доступность данных за счет объединения узлов RSC Tornado AFS в функциональные пары. В случае выхода из строя одного из серверов пары функционирование системы обеспечивается за счет второго сервера. Такой подход позволяет достичь высокой надежности хранения данных объемом до 2 Пбайт в форм-факторе 2U благодаря использованию 64 твердотельных дисков Intel SSD P5316 с интерфейсом NVMe в форм-факторе EDSFF.L («рулер»). Объем хранения данных в одной стойке, состоящей из 42 узлов RSC Tornado AFS, достигает 41,3 Пбайт со скоростью доступа 1 Тбайт/c. В многоуровневых системах хранения это решение предназначено для слоя «теплых» данных.
В узлах хранения также используются процессоры семейства Intel Xeon Scalable, твердотельные диски Intel Optane SSD и модули энергонезависимой памяти Intel Optane DC Persistent Memory. В RSC Tornado AFS реализовано 100% жидкостное охлаждение в режиме «горячая вода» с показателем PUE на уровне 1,04.
Решения RSC Storage on-Demand поддерживают файловые системы NFS, Lustre и DAOS для организации распределенной системы хранения. Новая распределенная объектная СХД с открытым кодом DAOS (Distributed Asynchronous Object Storage) корпорации Intel обеспечивает высокий уровень скорости работы с данными различных типов. Решение ориентировано на применение в области ИИ и ML/DL. Как поясняют в РСК, теперь стало возможным построение не только многоуровневых распределенных систем хранения данных на базе файловой системы Lustre в рамках архитектуры Composable Disaggregated Infrastructure и гибкое управление пулами дисков с интерфейсом NVMe, но и построение СХД на основе DAOS с распределенным внешним пулом дисков NVMe. Такой подход к реализации DAOS позволяет создавать высокопроизводительные СХД с гибким соотношением объема Intel Optane DC Persistent Memory к объему подключаемых к DAOS-серверу дисков NVMe. Это обеспечивает возможность создания гибких конфигураций «по запросу» для решения конкретной задачи пользователя. Кроме того, теперь стало возможно использовать пользовательский интерфейс платформы оркестрации «РСК БазИС» для систем на основе DAOS.
Специализированное решение RSC Tornado AI является развитием архитектуры «РСК Торнадо» и представляет собой узел высотой 1U со 100% жидкостным охлаждением на базе двух процессоров Intel Xeon Scalable 3-го поколения и до четырех ускорителей Nvidia A100. Вычислительная производительность одного шкафа, состоящего из 42-х узлов RSC Tornado AI, достигает 1,895 Пфлопс и 104,83/209,66 POPS (INT8/INT4). Решение RSC Tornado AI оптимизировано для работы с распределенной системой хранения RSC Storage on-Demand.
Компонуемо-распределенная архитектура «РСК Торнадо» позволяет создать эффективное решение под сложную задачу заказчика, состоящую как из частей компьютерного моделирования, так и машинного обучения. Благодаря использованию распределенной системы хранения RSC Storage on-Demand пользователь получает оптимальную конфигурацию, настроенную под тип его задачи и создаваемую за несколько секунд.