Процессоры для настольных систем
Олег Денисов, Константин Яковлев
Событие, активно обсуждавшееся в ИТ-кругах с момента окончания московского форума IDF 2004, свершилось. 18 апреля 2005 г. корпорация Intel разослала официальное сообщение о начале поставок настольных ПК и рабочих станций на базе двухъядерных платформ.
Параллельно с анонсом платформы были представлены серийные образцы продукции на ее основе, адресованные пользователям. Среди партнеров Intel, первыми освоивших выпуск ПК, спроектированных на новых платформах, крупнейшие поставщики компьютерной техники — компании Alienware, Dell и Velocity Micro. Таким образом, в канун 40-й годовщины закона Мура предположение, высказанное Гордоном Муром в 1965 г. и скорректированное десятью годами позже, стараниями Intel вновь находит подтверждение в лице двухъядерных процессоров нового поколения Intel Pentium Extreme Edition 840.
Первый двухъядерный процессор нового поколения Intel Pentium Extreme Edition 840. |
На момент написания статьи мы не располагали полной информацией о процессоре,
однако сведения, приведенные в пресс-релизе, позволяют сделать предположения,
правомерность или ошибочность которых определится в ближайшее время. Судя по
характеристикам нового процессора, производство которого ведется с соблюдением
90-нм проектных норм, оба ядра, расположенных на одном кристалле, унаследовали
идеологию архитектуры Prescott. Косвенно это подтверждает значение тактовой
частоты — 3,2 ГГц — процессора, работающего совместно с 800-МГц системной шиной,
число транзисторов и площадь кристалла (около 230 млн и 206 мм2 соответственно).
Корпус кристалла имеет упаковку FC-LGA5, а сам процессор предназначен для установки
в разъем Socket LGA 775. Что касается дополнительных функций, таких, как Extended
Memory 64 Technology, Execute Disable Bit, потоковые SIMD-инструкции третьего
поколения и, конечно же, Hyper-Threading, они у двухъядерного Pentium EE 840
представлены в полном объеме.
По традиции специально для новой платформы был разработан НМС Intel 955X Express, выполненный по классической схеме на базе связки двух мостов. Отличительная особенность северного моста (микросхема 82955X MCH) — усовершенствованный контроллер памяти, для которого Intel полностью переработала конвейер, предложив новую схему взаимодействия между MCH и модулями ОЗУ — Memory Pipeline Technology (Intel MPT). Благодаря ее скорость обмена данными между компонентами удалось повысить до 10,7 Гбайт/с против 8,5 Гбайт/с, характерной для наборов 925-й серии. Возрос и максимальный объем доступной НМС системной памяти — у Intel 955X Express он составляет 8 Гбайт на два канала ОЗУ, кроме того, набор получил возможность работать с модулями памяти DDR2-667/533 SDRAM. В распространенной Intel информации отмечается, что гибкая схема MPT не накладывает более жестких ограничений на идентичный объем и тайминги одновременно устанавливаемых модулей ОЗУ, будь то двухканальный или одноканальный режим работы системной памяти (технология Intel Flex Memory Technology).
Микросхема южного моста 82801GR ICH7R не претерпела сколько-нибудь существенных изменений. Ее основное отличие от ICH6R касается интерфейса AHCI (Advanced Host Controller Interface), обслуживающего Serial ATA-накопители следующего поколения, оснащенные функцией NCQ (Native Command Queuing). Пропускная способность интерфейса увеличилась вдвое по сравнению с НМС 925/915-й серий и составляет 3 Гбайт/с на каждый из четырех доступных системе каналов. Шина между мостами осталась прежней, а в дополнение к предложенной схеме факультативно южный мост ICH7R может быть оборудован встроенным гигабитным сетевым контроллером Intel PRO 100/1000 LAN и блоком, выполняющим функции управления и мониторинга всей системы (Intel Active Management Technology).
Помимо уже доступного для потребителей процессора Pentium Extreme Edition 840, в текущем квартале Intel планирует объявить линейку процессоров Pentium D, которой, по замыслу компании, предстоит стать массовой платформой для настольных ПК на базе двухъядерных решений в течение последующих двух лет. По прогнозам аналитиков, к концу 2006 г. свыше 70% рынка настольных систем будут оснащены процессорами многоядерной архитектуры. Уже сегодня в работе находится более полутора десятков проектов, так или иначе связанных с многоядерной тематикой (включая сегмент мобильных платформ и серверов).
На момент подготовки публикации это была вся или почти вся информация, которой
мы располагали, о двухъядерной платформе. Строго говоря, в рамках предлагаемого
обзора мы планировали рассказать о перспективах внедрения многоядерных решений
и о проектах, которые ведутся в этом направлении компаниями Intel, AMD и IBM.
Однако корпорация Intel скорректировала наши планы, объявив о начале поставок
кристаллов на базе двухъядерной архитектуры. Для настольных систем это событие
— еще одна знаменательная веха в истории ПК, получивших возможность обрабатывать
данные в несколько потоков одновременно. Так, система, оснащенная процессором
Pentium Extreme Edition 840, способна обрабатывать до четырех потоков (с учетом
включенной функции Hyper-Threading). Стоит ли говорить, какие перспективы открываются
перед графическими и мультимедийными станциями, игровыми машинами и ПК, занимающимися
научными вычислениями, если их основу будет составлять многоядерная платформа?!
Изучению потенциала таких машин мы планируем посвятить отдельный материал в
одном из ближайших номеров, а пока предлагаем оценить возможности процессоров
для настольных систем из числа тех, что присутствуют в розничной продаже здесь
и сейчас (их характеристики приведены в таблице). Подробные результаты тестирования
можно найти здесь.
Методика тестированияТестирование центральных процессоров для настольных ПК проходило в несколько Тестовые пакеты PCMark04, 3DMark03 и 3DMark05 (сборки 1.3.0, 3.6.0 и Заключительная группа тестов была представлена задачами, с которыми процессоры Каждый из процессоров после установки в стенд описанной ниже конфигурации С помощью системы нелинейных дифференциальных уравнений воспроизводился На примере задач из состава пакета SPEC Viewperf 8.0.1 платформам предлагалось Еще одна группа тестов, представленная демо-роликами Aquamark3 и X2-The Кроме того, в рамках испытаний было проведено тестирование процессоров Испытания процессоров проводились под управлением нескольких ОС. Для Для изучения производительности процессоров под управлением 64-разрядных Исследуя возможности процессоров в качестве базового компонента для построения С помощью стенда на НМС NVIDIA nForce4 SLI исследовалась производительность Для оценки быстродействия процессоров, работающих совместно с памятью Энергообеспечение стендов было возложено на 550-Вт ATX-блоки питания |
ОС и компиляторыРасширенное тестирование процессоров для настольных систем предоставило
Компиляторы работали под управлением следующих ОС:
Кроме того, на этапе подготовки и отладки сценария тестов применялось Охарактеризуем кратко каждый из компиляторов. Первым 64-разрядным компилятором Компилятор gcc — стандарт де-факто для ОС Linux. Это некоммерческий продукт, Компилятор EKOPath компании PathScale (http://www.pathscale.com) Компиляторы корпорации Intel (http://www.intel.ru), Изучение возможностей компиляторов в ходе тестирования процессоров показало |
Intel Pentium 4 Extreme Edition
Семейство процессоров Pentium 4 Extreme Edition (далее EE) разрабатывалось специально для рынка высокопроизводительных игровых ПК и мощных мультимедийных станций. В нашем тестировании приняли участие две старшие модели с тактовыми частотами 3,46 и 3,73 ГГц. Необходимо отметить, что 3,73-ГГц Pentium 4 EE принадлежит к новому поколению процессоров Intel, анонс которых состоялся в конце I квартала этого года. В отличие от предшественников, ядро Irwindale нового процессора проектировалось с соблюдением 90-нм проектных норм, при этом круг возлагаемых на него задач по сравнению с ядром Prescott существенно расширен.
Процессор получил в свое распоряжение более скоростную системную шину (ее тактовая частота увеличена до 1066 ГГц), технологию Intel EM64T, позволяющую процессору работать с 64-разрядными приложениями, и функцию Execute Disable Bit (XD-bit), предназначенную для блокирования на аппаратном уровне исполняемого кода, вызванного последствиями вирусной атаки. Кроме того, по сравнению с ядром Gallatin, на котором выполнен 3,43-ГГц Pentium 4 EE (также принявший участие в нашем тестировании), структура кэш-памяти у Irwindale модифицирована. Кэш данных L1 увеличен с 8 до 16 Кбайт, а общий объем кэш-памяти 1-го уровня (кэш данных и кэш инструкций) составляет теперь 28 Кбайт против 20 Кбайт у Gallatin. В новом ядре значительно увеличен объем кэш-памяти L2 (с 512 Кбайт до 2 Мбайт), а 2-Мбайт кэш-память L3, характерная для Gallatin, полностью отсутствует. Совместно с инструкциями SSE3, отныне доступными процессорам семейства Pentium 4 EE, такое перераспределение кэш-памяти в Irwindale сыграло на руку приложениям, интенсивно использующим вычисления с плавающей точкой, о чем наглядно свидетельствуют результаты выполнения тестовых пакетов, прошедших SSE-оптимизацию.
Эффективность такого подхода подтверждают и результаты испытаний процессоров на тестах SPEC CPU2000, большинство задач которых откомпилировано с учетом доступных процессорам расширенных наборов инструкций. По сравнению с типичными x86-наборами команд проведенная нами оптимизация кода заметно повысила скорость выполнения операций. В этом смысле достаточно показательны результаты Pentium 4 EE по итогам задачи на решение системы нелинейных дифференциальных уравнений двумя разными способами (x86-вариант и оптимизированная задача, которую мы включили в пакет тестов SPEC CPU2000). Превосходство Intel Pentium 4 EE над его прямым конкурентом — процессором AMD Athlon 64 FX достаточно очевидно. Стоит, правда, отметить, что далеко не всегда разработчики утруждают себя поиском новых решений, способных сократить время выполнения процессором отдельных операций, обычно предпочитая оставить все как есть. Переработка приложений зачастую требует дополнительных инвестиций, предполагает значительные трудозатраты и наличие высококвалифицированных специалистов. На наш взгляд, именно поэтому выход новых версий ПО, способных задействовать потенциал процессора "на все сто", может быть отложен на год-полтора или даже больше.
Подводя краткие итоги нашего знакомства с двумя новыми процессорами семейства Pentium 4 EE, прежде всего отметим устойчивость системы во всех без исключения тестах и результаты, показанные этими моделями. В контексте вышесказанного добавим, что исследование поведения процессоров Intel (как, впрочем, и продуктов AMD) совместно с 64-разрядной ОС компании Microsoft (мы использовали так называемый Release Candidate-вариант финальной версии, выпуск которой запланирован на 2006 г.) не является первоочередной задачей данного обзора. В этой связи к показателям изделий обеих компаний следует относиться с известной долей снисходительности.
При сравнении быстродействия процессоров в различного рода задачах обращают на себя внимание очень близкие результаты, продемонстрированные топ-моделями Intel и AMD. За прошедший год процессорам Athlon 64 FX удалось значительно выровнять ситуацию, сократив отставание, а в ряде случаев и опередив конкурента при выполнении синтетических 3D-тестов пакета PCMark04, позволяющего выявить интегральную производительность системы и ее составляющих, оптимизированных под инструкции MMX/SSE/SSE2. В этом платформе AMD содействовали прогрессивная шина PCI Express и режим двухканальной работы модулей ОЗУ. Тем не менее мы отдали предпочтение продукту Intel, отметив знаком отличия "Выбор редакции "BYTE/Россия" процессор Pentium 4 Extreme Edition 3,73 ГГц, потенциал ядра и скоростной шины которого по мере появления на рынке памяти DDR2 следующего поколения должен раскрыться достаточно скоро. К ожидаемым переменам новый 64-разрядный продукт корпорации готов уже сейчас.
Intel Pentium 4
Анонс обновленной линейки процессоров Intel Pentium 4 600-й серии состоялся одновременно с первым официальным представлением на публике 3,73-ГГц процессора, относящегося к семейству Extreme Edition. Такое совпадение не случайно, поскольку указанные процессоры имеют одно и то же ядро — в обоих случаях "пламенным мотором" выступает Irwindale. Различие же касается частоты системной шины, которая у Pentium 4 6xx составляет 800 МГц против 1066 МГц у Pentium 4 EE. Напомним, что, начиная с III квартала 2004 г., компания Intel ввела в обращение так называемый процессорный номер, который присваивается каждой модели опосредованно, учитывая ее основные характеристики. В частности, четыре новые модели серии 6xx получили индексы 630, 640, 650 и 660, при этом частоты их лежат в диапазоне от 3,0 до 3,6 ГГц с шагом 200 Мгц соответственно.
Если сравнивать новую линейку процессоров с предшественниками на ядре Prescott, сразу обращает на себя внимание ряд встроенных в ядро дополнительных функций, которые позволяют позиционировать процессоры для перспективных, ранее недоступных изделиям Intel этой ценовой категории, сегментов рынка. Так, технология Enhanced Memory 64 Technology (EM64T) открывает процессору доступ к 64-разрядным расширениям архитектуры x86, а Intel SpeedStep, позаимствованная у мобильных систем, предназначена для эффективного управления энергопотреблением. Все модели семейства Pentium 4 6xx оснащаются функцией Execute Disable Bit, призванной на аппаратном уровне совместно с ОС поставить заслон перед вирусами, запрещая выполнение подозрительных команд, действующих в обход общепринятых правил.
Касаясь технологических аспектов производства новых процессоров, отметим, что ядро Irwindale принципиально отличается от своего предшественника не только по числу транзисторов и площади кристалла (используемый материал и технологические нормы производства у них одни и те же). Применительно к существующим 90-нм проектным нормам, с соблюдением которых выпускаются модели Pentium 4 500-й серии (ядро Prescott), так называемый напряженный кремний (strained silicon; здесь уместнее говорить о "растянутой" кремниевой решетке групповой 300-мм заготовки) более не обеспечивает требуемого выхода годных кристаллов, способных работать на частотах выше 3,8 ГГц. Потолок, которого достигли процессоры этой серии, заставил инженеров Intel параллельно заниматься разработкой ядра-клона. Именно ему предстоит на какое-то время закрыть потребности процессоров широкого профиля, вплотную приблизив частоту моделей этой ниши к заветной планке барьера в 4 ГГц.
Однако вернемся к реальным возможностям процессоров 600-й серии, уже доступных пользователям. Насущная потребность в скорейшем разрешении проблемы резко возросшего энергопотребления процессоров и неразрывно связанного с ним тепловыделения, а значит, и эффективного отвода тепла, предопределили появление технологии ПК Intel SpeedStep, теперь уже в новом варианте — для десктопов. Реализация технологии для настольных ПК предполагает наличие у ядра трех механизмов управления питанием процессоров — C1E, TM2 и EIST (совместно с ОС Microsoft Windows XP с подключенным обновлением Service Pack 2). Всеми перечисленными функциями ядро Irwindale обладает в полном объеме. Представители компании отмечают, что, регулируя тактовую частоту и напряжение питания за счет указанных механизмов, в грамотно спроектированной системе удается снизить энергопотребление без значительного снижения производительности. С этой целью на различных режимах работы изменяется как множитель тактовой частоты системной шины, так и напряжение питания ядра. Согласно официальным документам, применительно к процессорам Pentium 4 6xx это достигается тремя способами: C1E (состояние расширенной блокировки) активируется по команде Halt (прекратить активность); EIST (расширенная технология Intel SpeedStep) включается по требованию ОС в зависимости от нагрузки на процессор; TM2 (температурный мониторинг) работает по запросу процессора в зависимости от температурной нагрузки. Для понимания базовых принципов этих механизмов следует иметь в виду, что вариативность тактовой частоты позволяет сократить динамическое энергопотребление, а более низкое напряжение питания дает возможность уменьшить ток утечки и потери мощности. Новые процессоры могут изменять оба параметра в любое время сообразно выполняемым задачам, причем номинал напряжения питания ядра контролируется встроенным стабилизатором. Вполне логичной представляется и сама схема процесса, когда перед изменением напряжения сначала изменяется тактовая частота. Это позволяет контролировать процессы, не подвергая кристалл риску выхода из строя.
Ядру Irwindale доступны два вида функции C1E. При каждом запуске команды Halt (доступна только средствами ОС) процессор входит в неактивное состояние (в терминах Intel — состояние C1), которое принято за установленный стандарт состояния низкого энергопотребления. По данным Intel, в этом случае до 90% тактовых импульсов останавливаются и только 10% продолжают движение на полной скорости. Перевод системы в состояние C1 возможен на любой частоте вплоть до миллисекунд, при этом пребывание системы в этом состоянии сильно зависит от текущих процессов (активных и фоновых приложений). Процесс неактивности завершается в результате прерывания (команды от таймера, подсистем ввода-вывода и т. п.). Отличие второй функции C1E (расширенное состояние неактивности) от C1 заключается в том, что множитель тактовой частоты шины уменьшается до минимального значения, при этом параллельно понижается и напряжение питания ядра. В результате этих действий энергопотребление процессора становится еще более низким, чем в состоянии C1.
Еще одна особенность процессоров Pentium 4 6xx, оснащенных технологией Intel SpeedStep, — температурный мониторинг (TM). Ядру Irwindale доступны два режима — TM1 и TM2, характерных для функции мониторинга. Как только температура ядра достигает пороговой температуры, режим TM1 автоматически включает механизм уменьшения рассеиваемой процессором мощности за счет модуляции тактовой частоты. Благодаря TM1 рассеиваемую мощность удается снизить приблизительно на 50%. Необходимо добавить, что процессоры, оснащенные этой функцией, имеют встроенный датчик температуры, калибруемый на заводе-изготовителе.
В отличие от TM1 режим TM2 позволяет изменять тактовую частоту и напряжение питания ядра процессора. По данным Intel, применение этой схемы позволяет эффективно охлаждать процессор (согласно статистике приведенных компанией измерений — до 40%) без серьезного ущерба для производительности системы. Заметим, что из двух режимов TM2 доступен только семейству Pentium 4 6xx, в то время как TM1 присутствует и у этой серии, и у Pentium 4 EE (ядро Irwindale).
Последний из трех представленных в новом ядре механизмов, EIST, работает совместно с ОС и взаимодействует с ней через интерфейс ACPI. При незначительных нагрузках на процессор выбирается более низкая тактовая частота. Соответственно в тот момент, когда нагрузка возрастает, увеличивается и тактовая частота. Процессоры, оснащенные EIST, распознают и могут применять несколько комбинаций двух параметров (напряжение и тактовая частота), причем для выполнения возложенных на SpeedStep функций используются одни и те же элементы схемотехники, что и в функциях C1E и TM2. Резюмируя, отметим, что встроенный в ядро Irwindale комплекс мер, направленных на снижение энергопотребления, фактически открывает перед процессором на его основе перспективы применения в системах форм-фактора BTX, массовое производство которых уже не за горами.
Если говорить о скорости вычислений, оптимизированных под SSE-инструкции, по данным Intel, прирост производительности в системе с 3,6-ГГц Pentium 4 660 по сравнению с Pentium 4 560 с тем же значением тактовой частоты может составлять в среднем от 7 до 10%. Именно эти модели мы и устанавливали в стенды, оценивая возможности процессоров с ядрами Irwindale и Prescott. Необходимо сказать, что в настоящее время Intel предлагает пять моделей процессоров 500-й серии в двух модификациях, выполненных с соблюдением 90-нм проектных норм. Индекс J в обозначении (после процессорного номера) говорит о том, что данному процессору доступна функция Execute Disable Bit. В настоящий момент старшая модель этой серии — Pentium 4 570J 3,8 ГГц, оснащенная, как и все процессоры данного семейства, 1-Мбайт кэш-памятью L2 и работающая на частоте системной шины 800 МГц.
На примере тестовых испытаний мы смогли убедиться в том, что 2-Мбайт кэш-память L2 совместно с функцией Hyper-Threading обеспечивают модели Pentium 4 660 более высокую по сравнению с конкурентами производительность и быстрый отклик системы в задачах, связанных с интенсивными вычислениями. Процессор одинаково уверенно ведет себя, выполняя целочисленные операции, задачи преобразования цифрового контента и приложения, в которых широко используются операции с плавающей точкой. Подводя итоги выступления процессоров Intel в этом классе, отметим хорошую устойчивость и сбалансированность платформ, а также готовность модельного ряда Pentium 4 6xx к совместной работе с 64-разрядными ОС. Суммируя все сказанное, в категории процессоров для ПК широкого профиля мы отметили продукт Intel Pentium 4 660 знаком отличия "Выбор редакции".
Intel Celeron D
В продуктовом портфеле Intel модельный ряд процессоров Celeron выглядит наиболее представительным. Сегодня компания предлагает семь моделей, объединенных торговой маркой Celeron D (исполнение Socket 478 и Socket LGA 775). Около года понадобилось Intel, чтобы полностью перевести производство этих процессоров на технологию с соблюдением 90-нм проектных норм. Благодаря новому ядру Prescott удалось повысить до 533 МГц частоту процессорной шины и существенно увеличить объем кэш-памяти L1 и L2. По числу транзисторов в ядре Celeron D сравнялся с моделями Pentium 4 500-й серии, получив при этом дополнение к расширенному набору SSE-команд потоковые SIMD-расширения третьего поколения. Среди прочих характеристик отметим упреждающее исполнение команд, возможность анализа потока данных, 28-Кбайт кэш-память L1 (включая 16-Кбайт кэш данных) без блокировок. Ядро процессора использует для вычислений две независимые кэш-памяти первого уровня, одна из которых используется для команд, а другая — для данных. Повышение производительности достигается за счет быстрого доступа к данным, присутствующим в кэше. Примечательно, что модели в исполнении для Socket LGA 775 оснащаются функцией Execute Disable Bit. В то же время модельный ряд процессоров Celeron поставляется с отключенной функцией Hyper-Threading.
Согласно принятым обозначениям, вся линейка 300-й серии полностью принадлежит семейству Celeron D, при этом тактовые частоты моделей укладываются в диапазон 2,26-3,06 ГГц. В тестах мы оценивали потенциал Celeron D, взяв за основу одну из старших моделей — 2,93-ГГц Celeron D 340. Имея возможность сравнить результаты тестирования с показателями 2,8-ГГц процессора Celeron 4 (исполнение Socket 478, система на базе НМС Intel 865P, 1 Гбайт ОЗУ DDR266 SDRAM), отметим возросшее быстродействие нового поколения Celeron во всех без исключения операциях. По нашим наблюдениям, разница в показателях составила от 25 до 50% при том, что розничная цена на продукт осталась практически неизменной.
Безусловно, процессору сложно мериться силами с моделями семейства Pentium 4 по части быстродействия при выполнении типовых офисных приложений и задач, связанных с преобразованием мультимедийного контента. Строго говоря, таких задач перед ним никто и не ставил. Прямым оппонентом Celeron D сегодня следует считать семейство AMD Sempron, с которым мы и сравнивали показатели модели Celeron D 340. С другой стороны, ПК начального уровня (на них и рассчитан в первую очередь продукт Intel), оснащенные старшими моделями Celeron D, вполне способны составить самую серьезную конкуренцию прошлогодним системам на базе 3-ГГц Pentium 4, о чем красноречиво свидетельствуют результаты фирменных тестов журнала PC Magazine. По нашему мнению, Celeron по-прежнему можно считать оптимальным выбором для построения машин бюджетной серии, при этом соотношение цена/производительность, которую обеспечивает этот процессор, окажется едва ли не лучшей среди всех показателей для настольных систем, оснащенных куда более мощными процессорами.
Как и следовало ожидать, преимущество Celeron перед Sempron проявилось прежде всего в тех приложениях, где доминировала новая архитектура Socket LGA 775 — PCI Express. Скоростная память и быстрый графический интерфейс позволили изделию Intel обойти конкурента в тестах Futuremark, играх и в ряде приложений, занятых обработкой цифрового контента. В остальных случаях наблюдался относительный паритет. Оснастив ПК процессором Celeron D 340, пользователь вправе рассчитывать на вполне комфортные условия для работы с офисными пакетами, Интернетом и отдельными мультимедийными задачами. При разрешениях до 1280×1024 не станут разочарованием и современные игры, надо лишь подобрать подходящий графический ускоритель.
AMD Athlon 64 FX
Компания AMD изначально позиционировала процессоры семейства Athlon 64 FX для рынка высокопроизводительных рабочих станций широкого профиля и мощных игровых компьютеров, которым предстоит иметь дело с передовыми технологиями обработки трехмерной графики и звука на ПК. В настоящее время модельный ряд этих 64-разрядных процессоров представлен двумя продуктами, среди которых наибольший интерес для нас представляет Athlon 64 FX-55. Ядро ClawHammer процессора, работающего на тактовой частоте 2,6 ГГц, выпускается с соблюдением 0,13-мкм проектных норм по технологии SOI (silicon-on-insulator). По сравнению с процессорами Athlon 64 FX первого поколения (ядро SledgeHammer) в новом процессоре переработан встроенный контроллер памяти, а в рамках архитектуры увеличена пропускная способность транспортной магистрали AMD HyperTransport и частота процессорной шины. Теперь скорость обмена данными по ней может достигать 8 Гбайт/с, в то время как пропускная способность канала памяти в полнодуплексном режиме осталась на прежнем уровне — 6,4 Гбайт/с. В отличие от первых FX-процессоров, рассчитанных на совместную работу с регистровыми модулями ОЗУ SO-DIMM, ядро ClawHammer получило возможность работать со стандартными модулями DDR400/333 SDRAM и задействовать двухканальный режим работы ОЗУ. Перевод семейства Athlon 64/64 FX на единый унифицированный разъем Socket 939 естественным образом коснулся и модели FX-55.
Именно этот процессор принял участие в нашем тестировании в составе платформы на наборе системной логики nForce4 SLI компании NVIDIA. Тандем двух компонентов, каждый из которых по-своему уникален, предопределил высокое быстродействие платформы. В большинстве случаев ей удавалось обойти соперника в лице испытательного стенда на базе 3,73-ГГц Intel Pentium 4 Extreme Edition и системной платы на НМС Intel 925XE Express. Исключение составили те случаи, когда тестируемые приложения прошли оптимизацию кода, предполагающую ускоренное выполнение инструкций потоковых SIMD-расширений. Сказанное в полной мере относится к тестовому пакету SPEC CPU2000 и некоторым приложениям, предназначенным для обработки мультимедийного контента.
Устойчивость — пожалуй, единственное, чего недоставало платформе на базе продукта AMD. Переоценить этот критерий для рабочих станций, которые часами, а иногда и сутками "перемалывают" поставленные задачи, невозможно. На наш взгляд, ответственность за нестабильную работу системы должны поровну разделить и процессор, и набор микросхем. Если отладить взаимодействие, им вполне по силам будут гораздо более серьезные задачи, чем игровые приложения, где платформа выступала вне конкуренции. Потенциал для этого у Athlon 64 FX-55, безусловно, есть. Истинным поклонникам продукции AMD, "замахнувшимся" на топовую модель компании, остается только ждать отлаженных драйверов и присматривать подходящий блок питания (по нашим данным, его мощность должна составлять не менее 420 Вт). Предполагаем, что средства на приобретение далеко не дешевого комплекта у них уже имеются.
AMD Athlon 64
За прошедший год, если взять за точку отсчета наше прошлое тестирование процессоров для настольных систем (см. "BYTE/Россия", No 5'2004, с. 56), среди процессоров компании AMD наибольшие изменения коснулись семейства Athlon 64. Модели среднего ценового диапазона, они с успехом могут стать основой для построения скоростных мультимедийных машин широкого профиля, предметом вожделения иных поклонников компьютерных игр, начальным импульсом для музыкантов, собственными силами создающих домашнюю студию звукозаписи, или дизайнеров, осваивающих новые графические и анимационные горизонты. В каждом из предложенных вариантов применение процессоров с торговой маркой Athlon 64 будет вполне обоснованно и с точки зрения производительности, и в плане цены.
В настоящий момент на рынке присутствуют девять продуктов этой серии, причем только пять из них предназначены для установки в процессорный разъем Socket 939. Потенциал старших моделей, имеющих процессорный рейтинг 3800+ и 4000+, мы изучили в рамках проведенного тестирования. Несмотря на то что тактовая частота процессоров одинакова, они являются типичными представителями разных поколений Athlon 64. Модель 4000+ производится с соблюдением 0,13-мкм проектных норм (ядро ClawHammer) по SOI-технологии, в то время как 3800+ уже "освоил" 90-нм проектные нормы (ядро Venice). Различаются процессоры и по объему кэш-памяти L2: у Athlon 64 3800+ она вдвое меньше и равна 512 Кбайт, что не мешает AMD связывать особые надежды с ядром, которое использует этот процессор. Все дело в том, что именно Venice использует технологию DSL (Dual Stress Liner), в разработке которой, помимо AMD, самое непосредственное участие принимала компания IBM. Не вдаваясь в подробности DSL-технологии, отметим, что она создавалась для тех же целей, что и "напряженный"", или "растянутый", кремний, широко применяемый в производстве Intel Pentium 4 (ядра Prescott и Irwindale). Согласно доступной официальной информации, основное отличие технологии, предложенной AMD и IBM, касается ее реализации в схемах PMOS-NMOS-транзисторов (p- и n-каналы соответственно) и применения в качестве основы нитрида кремния вместо материала на базе кремний-германиевого соединения. По оценкам специалистов, за счет DSL-технологии скорость срабатывания транзисторов может быть увеличена приблизительно на 25% по сравнению с традиционными способами производства подложек. Кроме того, практика показывает, что применение методов DSL не влияет на себестоимость конечного продукта и не приводит к снижению процента выхода годных изделий. Комбинация двух технологий — SOI и DSL, по мнению инженеров обеих компаний, позволит поднять планку тактовых частот будущих процессоров до уровня 3 ГГц.
Одной из основных проблем, с которой столкнулись первые 64-разрядные процессоры AMD, была ограниченная совместимость процессора с отдельными модулями ОЗУ. В частности, работоспособность системы с одновременно установленными четырьмя односторонними модулями PC3200 SDRAM оставляла желать лучшего. Установка двухсторонних модулей приводила к тому, что система отказывалась работать в режиме DDR400, сбрасывая частоту подсистемы памяти до значения 333 МГц. Переработанный контроллер памяти ядра Venice, судя по нашим результатам, лишен указанных недостатков. Кроме указанных изменений, процессор получил возможность работать с набором SSE3-инструкций. В результате модели Athlon 64 3800+ доступен полный комплект потоковых SIMD-расширений, предложенных компаниями Intel и AMD.
Завершая краткое знакомство с новым ядром, необходимо отметить, что различные партии Venice, скорее всего, будут иметь некоторый разброс характеристик, касающихся напряжений питания. В различных документах приводятся значения от 1,35 до 1,4 В, и при этом заявляется, что типовая рассеиваемая мощность кристалла останется на прежнем уровне. Все остальные характеристики ядер (включая реализованную в них функцию Qool'n'Quiet), на базе которых продолжают выпускаться Athlon 64, идентичны.
В наших тестах оба процессора продемонстрировали достаточно высокую производительность, в большинстве случаев на равных конкурируя с оппонентами из стана Intel. В этой связи хотелось бы отметить более высокий запас прочности ядра Venice и неплохую совместимость предоставленных для тестирования моделей с платформами на базе НМС от четырех поставщиков системной логики для архитектуры AMD K8. Востребованность продуктов на основе ядра Venice не вызывает сомнений. Для полного успеха ему необходимо совсем немного — взвешенная ценовая политика и грамотные маркетинговые шаги. Все остальное уже имеется…
AMD Sempron
Официальный анонс процессорного семейства Sempron компании Advanced Micro Devices состоялся в конце июля прошлого года. На тот момент AMD представила сразу семь процессоров для настольных ПК с тактовыми частотами от 1,5 до 2 ГГц (процессорный рейтинг младшей модели — 2200+, старшей — 3000+) в исполнении Socket A. Для выпуска Sempron были задействованы мощности собственного производства Fab30 в Дрездене, освоившего технологию производства кристаллов с соблюдением 0,13-мкм проектных норм. Все анонсированные модели были оснащены 256 Кбайт кэш-памяти L2, расширенным набором инструкций 3DNow! Professional и SSE и использовали для взаимодействия с ОЗУ архитектуру Socket A (максимальная частота процессорной шины 333 МГц). Исключение в линейке составляла старшая модель AMD Sempron 3000+ (ядро Barton) с вдвое большей кэш-памятью 2-го уровня. Напомним, что максимальная пропускная способность шины для этих процессоров не превышала 2,7 Гбайт/c, в то время как значение этого показателя у конкурента, Intel Celeron D, было равно 4,3 Гбайт/с.
Однако главное оружие AMD на рынке недорогих систем выглядит иначе. Параллельно с Sempron в исполнении Socket A компания представила еще один продукт, использующий основные достоинства архитектуры AMD K8. Процессор, получивший наименование Sempron 3100+, мы и рассмотрим в качестве основного соперника продуктов Intel той же ценовой категории. Ядро Paris этой модели работает на частоте 1,8 ГГц, характерный для семейства Sempron объем кэш-памяти L2 оставлен без изменений, а вот объем кэш-памяти L1 значительно превышает этот же показатель у конкурента. Основные изменения коснулись процессорной шины и характера взаимодействия процессора с системной памятью. Контроллер памяти интегрирован в ядро, что позволило более чем в два раза увеличить пропускную способность системной шины. Кроме того, процессор получил подкрепление в лице SSE2-инструкций и фирменной функции AMD Qool'n'Quiet и наделен аппаратной защитой от вирусов (совместно с ОС). Типовая рассеиваемая мощность модели Sempron 3100+ по сравнению с остальными процессорами семейства осталась неизменной. По сути ядро Paris представляет собой облегченную версию ядра NewCastle, которому недоступна технология AMD64. Иными словами, Sempron 3100+ — типичный представитель 32-разрядных процессоров нового поколения в исполнении AMD.
В официальных документах AMD фигурирует эффективный суммарный объем кэш-памяти 1-го и 2-го уровней, который составляет у процессора Sempron 384 Кбайт. В качестве примера рядом приводится тот же показатель у Celeron, оказавшийся несколько ниже. Насколько серьезен этот аргумент в споре двух извечных соперников, нам и предстояло выяснить в ходе тестирования. Конфигурация стендов подбиралась таким образом, чтобы соблюдался относительный паритет. Это касается в первую очередь видеоподсистемы, дискового массива и объема установленного ОЗУ. Системной памяти DDR2-533 SDRAM, установленной в стенд на базе Celeron D, противостояла более скоростная шина платформы Socket 754-Sempron.
Анализ полученных результатов после завершения программы испытаний в большинстве случаев выявил отставание Sempron от соперника. Тем не менее продукту AMD удалось опередить своего конкурента, выполняя сценарий тестов журнала PC Magazine и задачу на сжатие данных архиватором WinRAR. Кроме того, он быстрее Celeron D закончил процедуру формирования DVD-контента средствами ПО компании Ulead Systems и оказался проворнее соперника по итогам преобразования видеопотока в файл формата MPEG-2 средствами пакета MainConcept.
Утверждение о том, что процессор AMD уступает по производительности схожим по характеристикам моделям Celeron D компании Intel, было бы по меньшей мере заблуждением. Потенциал процессоров приблизительно равен, так что все зависит от того, для каких целей приобретается конкретный ПК. Для бюджетных корпоративных ПК начального уровня процессор AMD Sempron 3100+, очевидно, будет неплохим выбором. Что касается недорогих домашних машин, оснащенных встроенной графикой, которым с высокой степенью вероятности в будущем предстоит модернизация, связанная с переходом на внешний 3D-ускоритель (шина PCI Express x16), мы рекомендуем Celeron D и платформу Socket LGA 775.
Выбор редакции
Подведение итогов тестирования моделей, ориентированных на рынок высокопроизводительных мультимедийных и графических рабочих станций, выявило преимущество 3,73-ГГц процессора Pentium 4 Extreme Edition. Этот процессор продемонстрировал высокие скорости обработки цифрового контента, был хорош в игровых приложениях, на научных и инженерных задачах. Возросшая по сравнению с предшественниками частота системной шины, на которой работает этот процессор, измененная структура кэш-памяти, расширенный набор SSE-инструкций в виде дополнения SSE3 и совместная работа с памятью DDR2 SDRAM позволили продукту Intel обойти своего прямого конкурента — Athlon 64 FX-55 из стана AMD при выполнении большинства специализированных тестов фундаментального пакета SPEC CPU2000. Отрыв процессора от конкурентов становился особенно заметным в тех случаях, когда используемый нами инструментарий разработчика ПО (компиляторы, отладчики и т. п.) позволял оптимизировать код, подключая к выполнению тестовой задачи расширенные наборы команд. Учитывая сопоставимые рыночные цены продуктов Intel и AMD в любой из исследованных ниш, в группе процессоров сверхвысокой производительности мы отдали предпочтение именно 3,73-ГГц Pentium 4 EE, отметив его знаком отличия "Выбор редакции "BYTE/Россия".
В жестком споре процессоров среднего ценового диапазона лидерство захватил Intel Pentium 4 660, который, как и его старшего собрата, мы отметили знаком "Выбор редакции". Преимущество этого процессора над основным конкурентом, процессором Athlon 64 4000+, бесспорным назвать сложно. Тем не менее, несмотря на то что в ряде случаев оба процессора демонстрировали очень близкие результаты, мы отдали предпочтение продукту Intel. Далеко не последнюю роль в этом сыграла исключительная устойчивость платформы, собранной на его основе, потенциал инструкций расширенного набора команд, доступных процессору, и его фактическая готовность к работе в составе BTX-платформ. Выигрыш от оптимизации приложений под SSE-инструкции, на наш взгляд, достаточно очевиден. В рамках проведенного тестирования сказанное в первую очередь относится к научным и инженерным задачам, а также к приложениям, обрабатывающим мультимедийный контент. Полагаем, что спрос на 3,6-ГГц модель, оснащенную технологией EM64T, по мере приближения срока официального анонса новой 64-разрядной ОС компании Microsoft будет только возрастать.
По итогам тестирования двух моделей процессоров, предназначенных для рынка
бюджетных ПК, отмечать какой-либо продукт мы не стали. Возможности изделий компаний
Intel и AMD при выполнении приложений, не связанных с SSE-инструкциями, приблизительно
одинаковы. Близки процессоры и по цене. Различия по большей части касаются вариантов
взаимодействия платформ с ключевыми компонентами, составляющими основу их архитектуры
(транспортная магистраль, ОЗУ, видеоподсистема). В этом смысле на этапе перехода
обеих платформ на шину PCI Express ПК на базе процессоров семейства AMD Sempron
позволяют, например, повременить с приобретением графического ускорителя нового
поколения, довольствуясь возможностями AGP-шины.
Тестовый пакет SPEC CPU2000SPEC CPU2000 представляет собой тестовый пакет от некоммерческой организации Результаты тестов SPEC CPU2000 (т.н. индекс SPEC Base Ratio) зависят В состав пакета SPEC CPU2000 1.2 (поставляется на одном компакт-диске)
Для инсталляции ПО требуется установленная на компьютере ОС Windows XP/NT Структура тестов CINT2000В набор тестов CINT2000 входит 12 тестовых программ, из которых 11 написаны 164.gzip. Язык программирования — ANSI C. Тест на скорость сжатия/распаковки 175.vpr. Язык программирования — ANSI C. Тест на скорость решения 176.gcc. Язык программирования — C с GNU-расширениями. Тест на 181.mcf. Язык программирования — ANSI C. Тест на скорость решения 186.crafty. Язык программирования — ANSI C. Тест на скорость решения 197.parser. Язык программирования — ANSI C. Тест на скорость работы 252.eon. Язык программирования — C++. Тест на скорость работы 253.perlbmk. Язык программирования — ANSI C. Тест на скорость В ходе теста выполняется 4 Perl-скрипта. Первый конвертирует случайным 254.gap. Язык программирования — ANSI C. Тест на скорость решения 255.vortex. Язык программирования — C. Тест на скорость работы В процессе выполнения тестовая программа генерирует и манипулирует тремя 256.bzip2. Язык программирования — ANSI C. Тест на скорость сжатия/распаковки 300.twolf. Язык программирования — C. Тест на скорость расчета Структура тестов CFP2000В набор тестов CFP2000 входит 14 тестовых программ, из которых шесть 168.wupwise. Язык программирования — Fortran-77. Тест на скорость 171.swim. Язык программирования — Fortran-77. Тест на скорость 172.mgrid. Язык программирования — Fortran-77. Тест на скорость 173.applu. Язык программирования — Fortran-77. Тест на скорость 177.mesa. Язык программирования — ANSI C. Тест на скорость генерации 178.galgel. Язык программирования — Fortran-90. Тест на скорость Тестовая программа выполняется в три этапа. На первом с помощью итерационного 179.art. Язык программирования — ANSI C. Тест на скорость распознавания 183.equake. Язык программирования — ANSI C. Программа, использованная Во время выполнения теста моделируется прохождение подземного толчка 187.facerec. Язык программирования — Fortran-90. Тест на скорость 188.ammp. Язык программирования — C. Тест на скорость решения 189.lucas. Язык программирования — Fortran-90. Тест на скорость 191.fma3d. Язык программирования — Fortran-90. Тест на скорость 200.sixtrack. Язык программирования — Fortran-77. Тест на скорость 301.apsi. Язык программирования — Fortran-77. Тест на скорость Подготовка к тестированиюСуществует несколько способов выполнения тестов из наборов CFP2000 и В Base-режиме при генерации исполняемого кода всех тестовых программ, Два режима выполнения тестов были введены в SPEC CPU2000 в соответствии Метрика определяет количество одновременно выполняемых копий тестовых
GEOMEAN (RTIME i/MEDIAN (TTIME ij, j=1,M) * 100, i = 1,N), где GEOMEAN — среднее геометрическое, MEDIAN — медиана, RTIME/TTIME — Метрика Speed Metrics предназначена для измерения производительности Если выбирается метрика Throughput Metrics, то для каждой тестовой программы GEOMEAN (K i * RC i * 3600/MEDIAN (TTIME ij, j=1,M), i = 1,N), где GEOMEAN — среднее геометрическое, MEDIAN — медиана, K — количество Метрика Throughput Metrics служит для измерения производительности многопроцессорных Таким образом, выбирая набор тестов, режим и метрику, с помощью SPEC При подготовке обзора мы выполняли тесты из пакета SPEC CPU2000 в режимах Решение системы нелинейных дифференциальных уравненийСмысл этого теста заключался в измерении времени выполнения реальной В ходе испытаний мы проверили каким образом скорость решения этой задачи, |
Благодарности
Продукция для обзора была предоставлена московскими представительствами компаний
Advanced Micro Devices (http://www.amd.com),
ASUSTeK Computer (http://www.asuscom.ru),
ATI Technologies (http://www.ati.com), Intel
(http://www.intel.ru) и Microsoft (http://www.microsoft.ru),
а также компаниями Albatron Technology (http://www.albatron.ru),
AOpen (http://www.aopen.ru) и Silicon Integrated
Systems (http://www.sis.com).
Авторы статьи выражают особую признательность компаниям Ultra Computers (http://www.ultracomp.ru),
"Русский Стиль" (http://www.rus.ru) и Corsair
Memory (http://www.corsair.com) за предоставленное
для проведения тестирования оборудование.