Тактовая частота давно перестала быть главным мерилом привлекательности современных процессоров. В настоящий момент гораздо большее значение приобрела «гонка за ядрами». Разработка более совершенных микроархитектур, содержащих большее число функциональных исполнительных устройств, с целью повышения количества команд, одновременно исполняемых за один такт, — традиционный альтернативный росту тактовой частоты путь повышения производительности. Теперь фирмы-производители стремятся первыми выпустить микросхемы с наибольшим количеством вычислительных ядер. Лидирует в этом негласном соревновании корпорация AMD, которая уже сейчас может предложить потребителям серверные процессоры Opteron 6100, известные также под кодовым именем Magny-Cours, обладающие двенадцатью вычислительными ядрами. Со времен первых процессоров Opteron, появившихся семь лет назад и совершивших настоящую революцию на серверном сегменте рынка, выход Opteron Magny-Cours стал самой весомой заявкой AMD на успех в серверной нише.
Первые процессоры Opteron (микроархитектура К8) были представлены на рынке 22 апреля 2003 г. Кристаллы базировались на кардинально переработанном, значительно улучшенном и расширенном варианте микроархитектуры предыдущего поколения K7. AMD пошла простым путем и не стала выдвигать принципиально новую архитектуру, а просто взяла за основу ядро х86 и расширила набор инструкций до возможностей адресации 64-битного пространства (архитектура х86-64). Двумя важными технологиями, воплощенными в процессоре Opteron, была прямая поддержка 32-битных х86-приложений (без потери скорости) и 64-битных х86-64-приложений (линейная адресация более 4 Гбайт памяти). Суперскалярные мультиконвейерные процессоры с предсказанием ветвлений и спекулятивным исполнением K8 (Hammer) теоретически были способны исполнять до трех инструкций за один такт. В многопроцессорных системах кристаллы взаимодействовали между собой при помощи архитектуры Direct Connect посредством высокоскоростной шины Hyper-Transport. При этом каждый процессор мог получить доступ к памяти другого процессора прозрачно для программиста. Общую архитектуру серверов на базе Opteron в AMD называют «архитектурой с прямым соединением», поскольку процессоры «напрямую» соединены с оперативной памятью посредством встроенного контроллера памяти. При этом с ростом числа процессоров пропускная способность памяти растет линейно.
В мае 2005 года AMD представила первый двухядерный процессор Opteron. Стоит отметить, что в отличие от конкурентов, эти кристаллы для поддержания когерентности кэш-памяти использовали более совершенный протокол MOESI (Modified Owned Exclusive Shared Invalid), что давало значительные преимущества в масштабировании при работе с памятью.
Opteron Barcelona
Первые официальные упоминания AMD о разработке четырехъядерных процессоров появились в мае 2006 г. в «дорожной карте», опубликованной на срок до 2009 г. Тогда новая микроархитектура значилась под кодовым наименованием K8L, и только в феврале 2007 г. было утверждено окончательное наименование — K10. В процессоре с кодовым названием Barcelona, который продолжил линейку Opteron, компания также сделала ставку на проработанность архитектуры. Основным козырем AMD, в отличие от конкурирующих решений, стало то, что все четыре ядра располагались на одном кристалле. Это позволяло обеспечить существенный прирост в вычислениях, особенно в многопоточных, с которыми и приходится чаще всего иметь дело на серверном рынке. Еще один фактор, на котором сосредоточили свое внимание инженеры AMD — это система энергопитания, которая позволяла на 38% увеличить ее эффективность в сравнении с предыдущими моделями. Для измерения производительности в корпорации даже ввели новую систему метрики, которая должна была точнее отражать реальное энергопотребление в условиях эксплуатации. Новая энергетическая характеристика стала называться ACP (Average CPU Power) и определяла средний уровень энергопотребления новых процессоров при нагрузке. Однако в AMD не перестали при этом указывать и максимальный уровень энергопотребления — TDP. (Thermal Design Power).
Opteron Shanghai
AMD, опережая график, перенесла анонс своих четырехъядерных процессоров Opteron Shanghai с первого квартала 2009 г. на четвертый квартал 2008 г. Именно Shanghai стали первыми в мире однокристальными четырехъядерными процессорами, выполненными с учетом проектных норм 45 нм. Они использовали процессорный разъем Socket F (1207) и работали с регистровой памятью DDR2 800 (МГц). Снижение напряжения и частоты в режиме простоя (технология AMD PowerNow!) позволили значительно снизить потребление энергии — до 35% экономии в режиме простоя. Переход на более жесткие технологические нормы обеспечил более высокую производительность за счет более высоких рабочих частот и меньшего теплового пакета. Также сэкономить энергию была призвана возможность независимой установки напряжения для каждого ядра в отдельности. Отметим, что технология AMD CoolCore служит тем же целям: при отсутствии нагрузки она просто отключает неиспользуемую логику процессора и контроллер памяти. Заметим, что переключение в исходное состояние происходит очень быстро — в течение одного такта. Увеличенный втрое объем кэш-памяти третьего уровня (до 6 Мбайт) и повышение числа выполняемых за один такт инструкций также позволял добиться прироста производительности. Обновленная шина HyperTransport 3.0 была способна обеспечить высокоскоростной обмен данными (17,6 Гбайт/c).
Особо малопотребляющие (40 Вт) процессоры Opteron, получившие индекс EE, выделили в собственный класс решений для серверов высокой плотности. Как известно, подобные процессоры обычно позиционируются для решений, ориентированных на «облачные вычисления».
Opteron Istanbul
Как и было обещано, первые шестиядерные процессоры Opteron Istanbul корпорация начала поставлять на несколько месяцев раньше запланированного (в 2009 г.). Данные устройства призваны были заменить модели Shanghai, повысив при этом производительность и энергоэффективность серверов. Так, производительность на 1 Вт использованной энергии повысилась на 34% по сравнению с устройствами предыдущего поколения. Поскольку Istanbul разработали в расчете на процессорный разъем Socket F (1207), микросхемы, после обновления BIOS, оптимально подходили для модернизации существующих систем. Все кристаллы изготавливались по технологическим нормам 45 нм, содержали разделяемую 6 Мбайт кэш-память третьего уровня и по 512 Кбайт кэша на каждое из ядер, а также оснащались контроллером двухканальной памяти стандарта DDR2 1066 (МГц). Изделия обеспечивали поддержку HyperTransport 3.0, а также технологий AMD-V (AMD Virtualization), AMD-P (AMD Power Management) и HT Assist. Напомним, последняя технология способствует значительному снижению лишнего трафика в поисках кратчайшего пути для передачи данных по HyperTransport.
В ноябре прошлого года система Cray XT5 на базе шестиядерных процессоров AMD Opteron была признана самым мощным в мире суперкомпьютером, согласно данным организации TOP500, опубликовавшей свой список самых производительных в мире систем (список обновляется два раза в год). Эта система (также известная как Jaguar), работающая в лаборатории Oak Ridge National Laboratory (ORNL), была модернизирована с четырех- до шестиядерных процессоров AMD Opteron и теоретически обладала пиковым быстродействием 2,3 Пфлоп/с, демонстрируя быстродействие 1,75 Пфлоп/с в тестах Linpack.
Opteron Magny-Cours
Со времен первых процессоров Opteron, совершивших настоящую революцию на серверном сегменте рынка, выход Opteron Magny-Cours стал самой весомой заявкой AMD на успех в серверной нише. В конце марта 2010 г. корпорация анонсировала новую серверную платформу Maranello (новый процессорный разъем G34) и соответствующие 12- и 8-ядерные процессоры Opteron 6000 серии (61хх, Magny-Cours). Новые серверные микросхемы AMD состоят из двух кристаллов: двух шестиядерных в случае 12-ядерных процессоров и двух четырехъядерных — для 8-ядерных. Тем самым, AMD отказалась от размещения всех ядер на одном кристалле в пользу микросборки из двух отдельных кристаллов. Чтобы удержать тепловыделение в приемлемых рамках, корпорации пришлось ограничить тактовую частоту 12-ядерных моделей значением 2,3 ГГц, а 8-ядерных — 2,4 ГГц. В новую линейку вошли пять 12-ядерных процессоров. Они отличаются по частоте (от 1,7 до 2,3 ГГц), но изготавливаются с соблюдением одних и тех же проектных норм (45 нм), имеют интегрированный контроллер памяти DDR3 1333 (МГц), 12 Мбайт кэш-памяти третьего уровня и по 512 Кбайт кэша второго уровня на каждое ядро. TDP кристаллов составляет от 65 до 105 Вт, соответственно. Последняя цифра по ACP соответствует производительной модели с индексом SE. Для установки корпусов на системные платы требуется новый разъем Socket G34. Пять 8-ядерных процессоров, работающих на частоте от 1,8 до 2,4 ГГц, также оснащены 12 Мбайт кэш-памяти третьего уровня. TDP для этих кристаллов составляет 80 Вт в случае обычных моделей и 65 Вт для их модификаций с индексом НЕ (энергоэффективные).
Усовершенствованный встроенный контроллер памяти поддерживает четыре канала памяти DDR3, причем общая пропускная способность подсистемы памяти увеличивается в 2,5 раза. В новинке на 33% больше каналов памяти на один процессор, чем у конкурирующих двухпроцессорных решений (4 против 3). Также среди преимуществ, на 50% больше подключаемых модулей памяти DIMM по сравнению с предыдущими поколениями (до 12 модулей DIMM на каждый процессор), общее увеличение емкости доступной памяти и улучшение работы с системами виртуализации, баз данных и высокопроизводительных вычислений.
Кроме того, AMD отказалась от сторонних наборов микросхем (Nvidia и Broadcom), в пользу собственного чипсета RS5690, который обещает совместимость с будущими процессорами корпорации. Архитектура Direct Connect 2.0 обеспечивает прямые соединения каждого из процессоров с тремя другими в четырехпроцессорных конфигурациях (ранее допускались соединения с двумя процессорами из трех). Новые процессоры Opteron используют шину третьего поколения HyperTransport, которая обеспечивает скорость соединения между процессором и системой, а также между процессорами в конфигурациях с несколькими разъемами на уровне 6,4 ГТ/с. В чипсет также встроена поддержка PCI Express 2.0.
Кодовые названия процессоров Magny-Cours, Montreal, Lisbon, Valencia, Sao-Paolo и другие связаны с местами трасс для соревнований «Формулы-1». Так, Opteron Barcelona ассоциируется с местом проведения испанского Гран-при на треке Circut de Catalunya, а будущий 12-ядерный Interlagos связан с автодромом Jose Carlos Pace в Бразилии. Серверные платформы также имеют свою расшифровку, которая связана с компанией Ferrari. Так, платформа Opteron 6000 — Maranello — место штаб квартиры этой компании, а платформа Socket C32 San Marino — автодром Enzo e Dino Ferrari.
Судя по опубликованной информации, доля рынка четырехпроцессорных серверов сокращается, а двухпроцессорных — устойчиво растет. AMD отменила своеобразный налог на многопроцессорность: ранее микросхемы для четырехпроцессорных конфигураций могли работать только в своих платах. Теперь такие кристаллы могут работать и в двухпроцессорных конфигурациях за счет того, что обеспечена совместимость по чипсетам и разъемам. Таким образом, новая платформа соответствует требованиям заказчиков современных серверов, гарантируя именно ту производительность, которая требуется для решения конкретных задач, энергетическую эффективность и общую экономию, обеспечивая при этом больше процессорных ядер и памяти за меньшие деньги.
Энергоэффективность Opteron Magny-Cours призваны обеспечить такие технологии, как AMD CoolCore, PowerNow! и CoolSpeed. В процессоры введена функция управления состоянием процессора C1E (Enhanced C1 state), определенная спецификацией (Advanced Configuration and Power Interface) и позволяющая сохранять энергию в периоды ожидания. Кроме того, следует отметить службу Advanced Platform Management Link (APML), осуществляющую дистанционный мониторинг электропитания и охлаждения платформ с поддержкой APML.
О поддержке новой платформы AMD заявили такие производители серверов, как Acer, Cray, Dell, HP и SGI. Кроме того, постоянными партнерами корпорации остаются Asus, MSI, Supermicro и Tyan. В число тех, кто намерен использовать преимущества Opteron серии 6000, входят также компании Appro, Atipa Technologies, Colfax, Directron, Microway, Nortech, Penguin, Servers Direct, Silicon Mechanics и ZT Systems.
AMD Opteron следующего поколения
В следующем году базовые платформы корпорации еще не изменятся, но изготовление процессоров перейдет на новые, более жесткие, проектные нормы 32 нм, а также новую (возможно, многопотоковую) микроархитектуру Bulldozer. Линейка кристаллов Opteron 6000 пополнится 12- и 16-ядерными процессорами Interlagos, а Opteron 4000 — 6- и 8-ядерными Valencia. В 2012 г. появится серверная платформа следующего поколения, но о ней пока нет никаких подробностей.
Линейка серверов ETegro Hyperion 4-го поколения на процессорах AMD Opteron™ 6100
Ольга Царева, директор по маркетингу компании «ЕТегро Текнолоджис»
На официальном представлении новейших процессоров AMD в России отечественный производитель ETegro Technologies представил новую линейку серверов ETegro Hyperion четвертого поколения (G4) в составе пьедестальной модели ETegro Hyperion ES360 G4 и мощного 4-процессорного сервера ETegro Hyperion RS560 G4 для установки в серверную стойку. Данные серверы выпускаются на базе 8- и 12-ядерных процессоров AMD Opteron™ 6100 c сокетом G34 и чипсете AMD 5690.
Читать далее