Многосокетные серверы: принципы организации и структура ассортиментных линеек
Многопроцессорные серверы стандартной архитектуры (x86) прошли непростой путь в своем развитии. Будучи изначально нацелены на критические нагрузки и поддержку масштабных корпоративных сред, они конкурировали и с RISC-системами, и с растущим сектором кластерных решений, составленных из модулей меньшей мощности. Долгие годы развитие в секторе стандартных SMP-серверов (т. е. архитектуры Symmetric Multiprocessing) на мировом рынке отличалось ровной, местами нисходящей динамикой. Кластеры на базе двухпроцессорных решений брали на себя все большее число типовых задач, началось бурное развитие блейд-решений. А в секторе высоконагруженных решений не спешили отдавать свою долю RISC- и EPIC-систем.
Однако интенсивный переход к серверной виртуализации открыл новые перспективы для сектора многопроцессорных систем (MP), так как поддержка множества виртуальных машин потребовала большего числа дополнительных вычислительных потоков и объемов ОЗУ. С точки зрения потребления сегмент явно ожил.
В то же время в этом сегменте, как и вообще в процессорной области, продолжался интенсивный технологический рост. Начался переход к принципу system-on-chip – включению в процессорный модуль все большего числа системных компонентов. Это критически изменило системную архитектуру комплексов с числом сокетов от четырех и более. И эти изменения были направлены если не на упрощение, то на унификацию, сделав различия в топологии межкомпонентных связей в EP- и MP-системах лишь числовыми. Это сделало сектор многосокетных систем более демократичным, благо, виртуализация создала для этого экономическую основу.
С другой стороны, технологический рост умножал число ядер и объемов кэш-памяти, улучшал их скоростные характеристики; изменилась скорость и связность системы ввода-вывода, расширился функционал обеспечения надежности вычислений. Все это поступательно привело к тому, что старшие MP-системы, по крайней мере на базе Intel, становились все более достойными конкурентами RISC-решениям, что расширило применимость серверов стандартной архитектуры в составе действительно крупных ЦОД, для обработки гигантских баз данных или для научных расчетов. Иначе говоря, спектр направлений в области MP x86 разрастался и вширь, и вглубь.
Ниже мы рассмотрим эти процессы более подробно и увидим, как они проявляются в современной картине ассортимента. Естественно, в связи с вышеописанными процессами линейки MP-серверов изменились довольно сильно. Самый консервативный в прошлом сектор рынка сегодня нисколько не напоминает ту тихую гавань, где из года в год мы видели лишь поступательный переход одних и тех же шасси с одного поколения системной логики на другое. Мы включаем в рассмотрение только SMP-cерверы ведущих зарубежных и отечественных производителей в обычных конструктивах, не включая блейд-модулей.
Новое в архитектуре SMP
Обсуждение современного состояния архитектуры SMP для платформы x86 мы начнем, как ни странно, с AMD, а не с Intel. Именно компания AMD, развивая свою линейку процессоров для ПК, первой отказалась от FSB, интегрировала контроллер памяти в ЦПУ и использовала принцип межкомпонентных соединений точка-точка по шине HyperTransport (HT).
С запуском процессоров с архитектурой Nehalem компания Intel также реализовала соответствующую идеологию – интеграцию компонентов «северного моста» НМС на кристалл процессора и отказ от FSB в пользу QPI как ответ альянсу HyperTransport.
Самое главное, что изменение архитектуры в виде применения кэш-когерентных шин QPI и HT (технология, позволяющая синхронизировать изменения ячеек в общей разделяемой ОЗУ и во внутреннем кэше каждого процессора) позволила гораздо гибче масштабировать многосокетные серверы – от двух до четырех и более сокетов в конфигурации. Опять же компания AMD первой воспользовалась этим свойством, перестроив линейку Opteron следующим образом: существуют две «долгоиграющие» платформы под системы 1P/2P и под 2P/4P, на базе Opteron 4000 и 6000 соответственно. Таким образом, на базе серии 6000 строятся либо продвинутые двухпроцессорные системы, либо относительно бюджетные четырехпроцессорные. Путь Intel в этом отношении оказался более долгим, но в результате она пришла отчасти к тому же. Вернее, у компании параллельно развивается сразу несколько направлений, схожих системотехнически, но различных по позиционированию.
Ключевые перемены в семействе Intel Xeon стартовали, как уже было сказано выше, с запуском процессоров поколения Nehalem-EX – Xeon 7500 и соответствующего НМС, ответственного теперь уже только за систему ввода-вывода – 7500 (Boxboro-EX). Процессоры имели по четыре канала QPI, что позволило связать их с I/O и между собой по схеме каждый-с-каждым. Скорректирована и система взаимодействия с памятью за счет использования специальной технологии Intel 7500 Scalable Memory Buffers. Одним из главных плюсов, на которых компания Intel делала акцент при запуске данного обновления старшей серверной линейки, стала та самая возможность гибкого масштабирования систем от двухсокетовых вариантов до комплексов с 8, 16, а в особо экстремальных случаях – и до 256 сокетов.
Кроме того, Intel добавила в процессор множество функций RAS (Reliability, Availability and Serviceability), ранее встречавшихся только в линейках SPARC, PowerPC или Itanium. В результате старшие комплексы на Xeon дошли до уровня столкновения с UNIX-системами среднего класса собственной разработки вендоров.
На маркетинговом уровне такая масштабируемость была оформлена уже в следующем поколении Xeon, в котором изменилась система наименований. Современный Xeon E7 имеет три версии – 2800, 4800 и 8800 под двух-, четырех- и восьмисокетные конфигурации соответственно. При этом базовые параметры чипов отличаются незначительно. На каждый процессор в системе приходится по 8 модулей памяти, в поколении E7 поддерживаются модули до 32 Гбайт. Сокет и НМС остались прежними – 7500, и большинство моделей поддерживают новые чипы без изменений.
«Восьмиствольные» комплексы на новой базе уже предложили рынку HP (ProLiant DL980) и Sun (Fire 4800). Это важно, так как обе компании являются держателями крупных проприетарных UNIX-платформ – Itanium и SPARC. Есть 8-сокетное решение и у Fujitsu (Primergy RX600) – также поставщика SPARC-серверов.
А вот третий (или первый?) из ведущих поставщиков «больших» систем – IBM, как водится, стремится к оригинальности. Компания по-прежнему поддерживает фирменную SMP-платформу – НМС X5, на который в новом поколении устанавливаются процессоры Xeon E7. Многосокетовые комплексы в данном случае реализуются за счет объединения двух 4P-нодов из серверов System x3850/x3950.
Так или иначе, механизм внедрения стандартной архитектуры в последний из неосвоенных ранее сегментов – критических вычислений – запущен. Вопрос только в том, насколько быстро он пойдет.
Любопытно – и мы это явно видим в секторе блейд-решений, а тем более в нарождающемся секторе интегрированных стеков, – что несмотря на использование открытых компонентов, в результате все равно получается закрытое, скажем, конструкционно или на уровне системы управления, решение. Это уже происходит в секторе 8P, как видно на примере той же фирменной архитектуры IBM X5; HP для DL980 также разработала свой подход – архитектуру PREMA, которая в базисе использует принцип референсного дизайна Intel с применением XNC, но дополнена собственными решениями и подается, естественно, как часть конвергентной инфраструктуры HP. Компании же, в сегменте сверхпроизводительных систем не игравшие, не имеющие своей UNIX-платформы и в связи с этим не обремененные кругом соответствующих заказчиков, как видно, пока на этот рынок не спешат. Так что стандартизация в данном секторе всегда будет достаточно относительной.
Массовые системы 4P
Но вернемся к более массовому сектору. С другого конца ценовой шкалы возник новый кластер – массовые 4P-системы. Старт дала AMD с чипами Opteron 6100 и НМС G34 (SR56xx). На ту же платформу позднее стали устанавливаться и новые процессоры микроархитектуры Bulldozer – Opteron 6200. Весной этого года состоялся выход и ответного предложения от Intel – процессоры Xeon E5-4600. От членов семейства E7-4800 их отличает наличие только двух каналов QPI, усечение функционала RAS, ну и, конечно, предельные количество ядер и объем кэша. И дело тут не только в ценовых моментах. На такой компонентной базе производители могут создавать сверхплотные 4P-решения, увеличивая утилизацию пространства, оптимизируя энергопотребление и пр.
Вообще, конкуренция между 2P и 4P именно в сегменте Rack 2U вполне актуальна. По большому счету, это один сегмент, просто усложняющийся. И нельзя не отметить, что это вообще основной сектор серверного рынка с точки зрения количественных показателей продаж. Это универсальные решения, и здесь есть место внутренней диверсификации. Полагаем, что в дальнейшем можно вообще расценивать сектор E5-2600/4600+Opteron 6000 как отдельный кластер рынка, без подразделения на 2P/4P.
Как видно из таблицы, такая номинация, как настольные серверы 4P, сохранилась только у отечественных сборщиков – в нашем случае у Depo и Kraftway, из линеек зарубежных лидеров рынка они давно исчезли. Действительно, конструктивы Tower в нынешние времена прочно ассоциируются с сектором SMB и удаленными филиалами. Задач для «четырехствольной» системы, казалось бы, здесь немного, большинство вопросов вполне решаемы на современных двухпроцессорниках.
Ассортимент многосокетных серверов
Компания | Модель | Процессор | HMC | Конструктив | Память, Гбайт | PCI | Жесткий диск | Порты |
---|---|---|---|---|---|---|---|---|
HP | ProLiant DL580 G7 | 4xXeon E7-4800/7500 | 7500 | Rack 4U | 64 (2048/1024) | 11xGen2 | 8xSFF | 4x1GbE |
HP | ProLiant DL585 G7 | 4xOpteron 6100/6200 | SR5690 | Rack 4U | 48 (512/1024 ?) | 9xGen2, 2xPCI-X | 8xSFF | 4x1GbE |
HP | ProLiant DL980 G7 | 8xXeon E7-2800/4800/Xeon 7500 | ? | Rack 8U | 128 (4096/2048) | 14xGen2, 2xPCI-X | 8xSFF | 4x1GbE |
IBM | System x3850/x3950 X5 | 4xXeon E7-4800 (x2 модуля) | X5 | Rack 4U (+1U) | 64/96 (2048/3072) | 7xGen2 | 8xSFF/16xUFF | 2x2GbE, 1x10GbFCoE, 1x10GbE |
Dell | PowerEdge R810 | 4xXeon 7500/6500 | 7500 | Rack 2U | 32 (1024) | 8xGen2 | 6xSFF | 4x1GbE |
Dell | PowerEdge R815 | 4xOpteron 6100/6200 | SR5670 | Rack 2U | 32 (1024) | 7xGen2 | 6xSFF | 4x1GbE |
Dell | PowerEdge R820 | 4xXeon E5-4600 | C600 | Rack 2U | 48 (1536) | 7xGen3 | 16xSFF | 4x1GbE/2x1GbE, 2x10GbE |
Dell | PowerEdge R910 | 4xXeon 7500 | 7500 | Rack 4U | 64 (2048) | 10xGen2 | 16xSFF | 4x1GbE/2x1GbE, 2x10GbE |
Fujitsu | Primergy RX500 S7 | 4xXeon E5-4600 | C600 | Rack 4U | 48 (1536) | 11xGen3 | 8xSFF | NA |
Fujitsu | Primergy RX700 S6 | 4xXeon E7-2800/4800/8800 | 7500 | Rack 4U | 64 (2048) | 9xGen2 | 8xSFF | 4x1GbE |
Fujitsu | Primergy RX600 S2 | 8xXeon E7-8800 | 7500 | Rack 8U | 128 (4096) | 16xGen2 | 8xSFF | NA |
Oracle | Sun Fire 4470 M2 | 4xE7-4800 | 7500 | Rack 3U | 64 (2048) | 10xGen2 | 6xSFF | 4x1GbE |
Oracle | Sun Fire 4800 | 8xXeon 7500 | ? | Rack 5U | 128 (4096) | 8xGen2 | 8xSFF | 8×1/10GbE |
Oracle | Sun Fire 4800 M2 | 8xE7-8800 | ? | Rack 5U | 128 (4096) | 8xGen2 | 8xSFF | 8×1/10GbE |
Depo | Storm 4300R4 | 4xXeon E7-4800/7500 | 7500 | Tower | 32 (512) | 4xGen2 | 8-10xLFF/16xSFF | 2x1GbE |
Depo | Storm 4355T2 | 4xOpteron 6200 | SR5690 | Rack 2U | 32 (512) | 4xGen2 | 6xLFF | 2x1GbE |
Kraftway | Express 400 EM14 | 4xOpteron 6100/6200 | SR5690 | Tower | 32 (512) | 4xGen2 | 5xLFF | 2x1GbE |
Kraftway | Express 400 EM15 | 4xXeon E7-4800 | 7500 | Rack 4U | 32 (512) | 8xGen2, 2xGen1 | 8xSFF | 4x1GbE |
Kraftway | Express 400 EM16 | 4xOpteron 6100/6200 | SR5690 | Rack 2U | 32 (512) | 4xGen2 | 6xLFF | 2x1GbE |
Aquarius | AquaServer N70 Q43e | 4xXeon E7-4800 | 7500 | Rack 4U | 64 (1024) | NA | 8xSFF | 4x1GbE |
Aquarius | AquaServer N70 Q50 | 4xOpteron 6200 | SR5690 | Rack 2U | 32 (512) | NA | 6xLFF | 2x1GbE |
Etegro | Hyperion RS530 G3 | 4xXeon E7-4800 | 7500 | Rack 4U | 32 (512) | 8xGen2, 2xGen1 | 8xSFF | 4x1GbE |
Etegro | Hyperion RS560 G4 | 4xOpteron 6200 | SR5690 | Rack 2U | 32 (512) | 4xGen2 | 6xLFF | 2x1GbE |
Etegro | Hyperion RS830 G3 | 8xXeon E7-8800 | 7500 | Rack 6U | 64 (2048) | 9xGen2 | 10xSFF | 2x1GbE |
Что же касается «обычных» линеек 4P, ставших уже классическими, таких как ProLiant DL580/585 и им подобные, перейдя на новую сверхмощную компонентную базу, они сохранили свой базовый облик: конструктивы от 4U, большое количество слотов расширения PCI-e и относительно небольшая емкость внутренней дисковой корзины в сравнении с современными рэковыми конструктивами 2U. Последнее объяснимо. Безусловно, решения на базе Xeon 7500/E7 рассчитаны на среды с использованием внешних СХД, в этом смысле пересекаясь с блейд-системами и прочими решениями модульного типа. Один только этот фактор четко отстраивает данные решения от стандартных серверов на базе E5. И он, как было указано выше, далеко не единственный.
В целом же очевидно – мультипроцессирование x86 значительно расширило свою применимость: от классических универсальных серверов среднего уровня до секторов HPC и вычислительных сред корпоративного класса. И экспансия явно будет продолжаться.
Подробнее о структуре товарного предложения на российском рынке многосокетных серверов см. статью «И вглубь и вширь» в журнале «Бестселлеры IT-рынка», № 3’2012.
Вернуться к началу обзора «Многосокетные серверы: архитектура и товарное предложение»