Платформа Sun Constellation для HPC
Многие годы развитие высокопроизводительных вычислений HPC (High Performance Computing) сдерживалось ограничениями скорости доступных каналов связи и проблемами с производительностью на уровне систем хранения данных. Для устранения этих проблем необходимо было изменить привычную концепцию HPC, включив в нее высокопроизводительные устройства ввода-вывода и сетевые решения. Эту задачу успешно решили в корпорации Sun Microsystems в рамках подхода Open Network Systems с помощью системы Sun Constellation. Благодаря выпуску новых серверов, интегрированных открытых систем хранения данных и высокопроизводительных средств сетевых коммуникаций, HPC-системы получили дополнительную масштабируемость, удобство эксплуатации и экономичность. Предполагается, что подобные системы станут фундаментом для создания компьютеров, способных выполнять разнообразные ресурсоемкие приложения, для которых требуются высокая производительность, увеличенная пропускная способность, огромные объемы памяти и большая скорость операции ввода-вывода.
Дизайн HPC-систем предлагает новый уровень интеграции и высокую масштабируемость, гибкость и плотность размещения вычислительного оборудования благодаря сочетанию двухузловых (dual-node) модульных серверов Sun Blade X6275 на базе четырехъядерного процессора Intel Xeon серии 5500, модуля Sun Blade 6048 InfiniBand (IB) Quad Data Rate (QDR) Network Express Module (NEM), шасси Sun Blade 6048, системы охлаждения Sun Cooling Door, файловой системы Lustre и портфеля решений Sun Open Storage. В масштабируемой и эффективной системе Sun Constellation обеспечивается высокий уровень интеграции и производительности вычислительного и сетевого оборудования, систем хранения данных и ПО. Кроме того, серверные узлы Sun Blade по отдельности можно настроить для работы под управлением ОС Linux, Windows, Solaris или OpenSolaris, причем пользователи могут гибко проводить миграцию узлов с одной ОС на другую по мере необходимости.
Двухузловой сервер Sun Blade X6275 стал первым «лезвием», оснащенным контроллером IB QDR с очень высокой сетевой пропускной способностью, эффективностью энергопотребления и удобством использования. Во всех модульных серверах Sun Blade X6275 есть два полнофункциональных вычислительных узла, каждый из которых оснащен двумя процессорами Intel Xeon серии 5500, оперативной памятью объемом до 96 Гбайт, интегрированными адаптерами QDR IB Host Channel Adapter (HCA) и Gigabit Ethernet, модулями Sun Flash (опция) и экспресс-модулем ввода-вывода PCIe ExpressModule I/O (опция). Возможность изменения конфигурации системы гарантирует, что один и тот же блейд-сервер подойдет для работы приложений с интенсивной вычислительной нагрузкой, с интенсивным использованием памяти, коммуникаций или средств ввода-вывода, поэтому заказчики смогут выполнять практически любую рабочую HPC-нагрузку с помощью всего одной кластерной системы Sun Microsystems.
В шасси Sun Blade 6048 новый модуль Sun Blade X6275 обеспечивает очень высокую плотность оборудования (до 48 физических блейд-серверов на одну стойку) и поддерживает 96 серверных узлов, каждый из которых содержит по два четырехъядерных процессора, что дает в результате 768 процессорных ядер и 9 TFLOPS пиковой производительности в одной серверной стойке высотой 42U. В Sun Microsystems особо отмечают, что показатель «число ядер на стойку» для этого модуля на 71% выше, чем у продукции корпорации IBM (IBM BladeCenter H), и на 50% выше, чем у блейд-систем HP. Пиковая вычислительная мощность (2,25 TFLOPS) и эффективность по результатам теста Linpack (89% на каждую полку с 12 блейд-серверами) позволяют разработчикам надеяться, что реальная вычислительная мощность достигнет 2 TFLOPS. Более того, ожидается, что в приложениях с интенсивным использованием коммуникаций (в которых для выполнения заданий задействовано высокоскоростное межкомпонентное соединение IB), таких как моделирование атмосферных процессов и прогнозирование погоды, расчеты в области физики высоких энергий, ядерной физики, динамики молекул и обработка сейсмических данных, эффективность одной серверной полки шасси Sun Blade 6048 достигнет 92%.
Новые системы Sun Cooling Door, представленные на выставке Supercomputing 2008 как «Проект Glacier», в шесть раз эффективнее охлаждают стойку, чем стандартные системы охлаждения в центрах обработки данных, и повышают эффективную плотность вычислительного оборудования на величину до 70% относительно плотности при внутрирядном (in-row) размещении систем кондиционирования. Системы Sun Cooling Door, рассчитанные на мощность 35 КВт на стойку, размещаются сзади в модернизированной модульной системе Sun Blade 6048. Они показывают высокую эффективность охлаждения и расчетную мощность в классе полностью пассивных конструкций, не требующих для работы дополнительных вентиляторов и электропитания. Подобные системы охлаждения, поставляемые в двух вариантах — Sun Cooling Door 5200 (использует имеющуюся инфраструктуру охлажденной воды) и Sun Cooling Door 5600 (использует экологически безопасный пар хладоагента) — эффективно отводят тепло, занимают минимальную площадь в дата-центре и позволяют отказаться от дорогостоящих проектов переоборудования ЦОД.
Максимальная производительность новых решений достигается за счет интегрированного подхода к архитектуре интерконнектных соединений, в рамках которого удается оптимизировать производительность каждого узла и масштабировать на всю систему сетевые операции приложений и операции ввода-вывода. Благодаря этим решениям заказчики смогут существенно упростить свои менее интегрированные среды: потребность в прокладке кабелей сокращается на 84%, количество коммутаторов — на 97%, а занимаемое в стойке пространство — на 75%. Модуль Sun Blade 6048 QDR IB Switched Network Express Module (NEM) поддерживает интегрированные функции коммутации для сетей QDR IB прямо внутри шасси Sun Blade 6048. Каждый узел модульного сервера Sun Blade X6275 оснащен встроенным HCA-адаптером QDR IB, который непосредственно связан с интегрированными модулями Sun Blade 6048 IB QDR Switched NEM в шасси Sun Blade 6048, а модули Sun Blade 6048 IB QDR Switched NEM напрямую подключены к коммутаторам Sun Datacenter IB (по топологии fat-tree с широкой полосой пропускания) или к другим модулям Sun Blade 6048 IB QDR Switched NEM (в недорогих конфигурациях в форме трехмерного тора). В свою очередь, двухпортовый НСА-адаптер Sun InfiniBand 4x QDR PCIe ExpressModule обеспечивает дополнительные возможности подключения контроллера QDR к серверным блейд-модулям Sun, позволяет создавать «многоканальные» (multi-rail) кластеры и предоставляет каждому серверному узлу множество независимых соединений IB fabric, поддерживающих рабочие нагрузки с самым интенсивным использованием сетевых ресурсов кластера. Другой модуль, Sun Blade 6000 Virtualized Multi Fabric 10GbE NEM, позволяет в 20 раз сократить количество прокладываемых кабелей, что серьезно упрощает развертывание систем Sun Blade 6000, устраняет проблемы несовместимости и снижает затраты на управление.
Система хранения данных Sun Lustre Storage System позволяет в режиме онлайн масштабировать емкость (от 48 Тбайт до нескольких Пбайт) и производительность операций ввода-вывода (от 1 до 100 Гбайт/с и более). Sun Lustre Storage System радикально упрощает развертывание решений на базе файловой системы Lustre за счет предварительно определенных конфигураций сервера метаданных и сервера объектов, позволяя добиться высокой производительности, высокой готовности и экономической эффективности. Кроме того, стандартная конфигурация и поставка обеспечивают быстрое развертывание решения и простоту управления им, а доступные варианты поддержки помогают оптимизировать продолжительность безотказной работы и производительность.
На базе новых систем Sun Constellation System планируется построить несколько крупнейших в мире HPC-систем производительностью более 2 PFLOPS. Среди заказчиков Австралийский национальный университет, Австралийское метеорологическое бюро, Южно-Африканский центр высокопроизводительных вычислений (CHPC), проект Galileo и Университет Цюриха.