Суперкомпьютерное решение A-Class
Компания «Т-Платформы» объявила о создании сверхинтегрированного суперкомпьютерного решения A-Сlass, упрощающего переход к вычислениям мультипетафлопсного диапазона.
А-Класс – система уровня стойки с высокими показателями вычислительной плотности, масштабируемости, энергоэффективности и надежности. Шасси объединяет в единый вычислительный ресурс два головных узла, 256 вычислительных узлов и 60 коммутаторов InfiniBand и Ethernet.
Начальная пиковая производительность суперкомпьютера составляет более 420 терафлопс на одну систему и масштабируется до 54 петафлопс за счет объединения 128 шасси. Первый выпущенный вычислительный модуль содержит четыре специализированные системные платы, оснащенные процессором Intel Xeon E5-2600 v2 и ускорителем NVIDIA Tesla K40.
Конфигурация«1+1» позволяет оптимально реализовать технологию NVIDIA GPU Direct и обеспечить наибольшую эффективность решения вычислительных задач разного класса. Производительность процессоров и ускорителей в системе A-Class сбалансирована с доступной пропускной способностью интерфейсов InfiniBand на уровне 3,3 Гбайт/с на терафлопс.
Сетевая инфраструктура системы состоит из двух сетей Ethernet и двух – InfiniBand. Одна из независимых сетей FDR InfiniBand используется для MPI-трафика, а вторая служит для обмена данными между вычислительными узлами. A-Сlass позволяет реализовать различные топологии коммутации вычислительных узлов, включая современные 3D- и 4D-torus, Flattened butterfly и Hypercube для достижения эффективного взаимодействия десятков тысяч вычислительных узлов суперкомпьютера.
Управляющие, вычислительные и коммутационные модули A-Class охлаждаются горячей водой с входной температурой до 45 град. Цельсия и более 50 град. на выходе из модулей. Электронные платы крепятся непосредственно на специальный радиатор, плотно прилегающий к компонентам плат для отвода выделяемого тепла. Технология прямого охлаждения горячей водой позволяет достичь высокой энергоэффективности, снизить операционный шум в вычислительном зале и внедрить круглогодичный режим «свободного охлаждения» системы. В зимнее время заказчики могут повторно использовать уже нагретую воду для обогрева помещений.
В A-Class реализованы как аппаратные, так и перспективные программные средства повышения отказоустойчивости суперкомпьютера. Два независимых модуля управления с выделенными сетевыми фабриками Ethernet поддерживают горячую замену, обеспечивая функции отказоустойчивого управления и мониторинга системы.
Независимые серверы управления A-Class позволяют отслеживать состояние компонентов системы и управлять нагрузкой и конфигурациями установленного ПО. Независимые входные линии электропитания и избыточные блоки питания горячей замеры также обеспечивают беспрерывность и надежность работы суперкомпьютера.
В настоящее время МГУ имени М.В. Ломоносова проводит всестороннее тестирование системы A-Class, предоставив информацию о производительности 256-узловой конфигурации для размещения данных о новой системе в списке наиболее производительных суперкомпьютеров мира Top500. В июне 2014 г. отдельная система A-Class заняла в этом рейтинге 130-ю позицию.