AMD Phenom II X6 с числом ядер от одного до шести: тесты масштабируемости. AMD Phenom II X6 с числом ядер от одного до шести: тесты масштабируемости Игровые тесты: Crysis и Enemy Territory: Quake Wars

Итак, что же представляет собой Phenom II X6? Индекс X6 прямо указывает на наличие шести вычислительных ядер. Новый флагман AMD изготовлен с соблюдением норм 45-нм техпроцесса (естественно, применяется технология «кремний на изоляторе» и иммерсионная литография). Объем кэша первого уровня (L1) составляет 128 Кбайт для каждого ядра (64 Кбайта данных + 64 Кбайта команд), объем кэша второго уровня (L2) – 512 Кбайт на ядро, объем общего кэша третьего уровня (L3) - 6 Мбайт. Взглянем на фото кристалла процессора:

Знакомая картина: перед нами все тот же Deneb с парой «приклеенных» ядер. Объем общего кэша третьего уровня остался неизменным, суммарные объемы кэшей L1 и L2 подросли в полтора раза по понятным причинам. Таким образом, процессор представляет собой «подросший» Phenom II X4. К слову, специалисты Intel при создании своего «шестиядерника» Core i7 980 Xtreme пошли похожим путем, архитектура четрехъядерных процессоров i7 9xx была расширена на два ядра. Единственное отличие – i7 980 выпускается по 32-нм техпроцессу. То есть Intel продолжает придерживаться своей стратегии «Tic-Toc», в четные года вводя более тонкие техпроцессы, а в нечетные осваивая новые архитектуры. AMD пока не выводит на рынок 32-нм процессоры.

Для тестирования пишущая братия получила процессоры Phenom II 1090T (флагман новой линейки) и Phenom II 1055T (модель среднего уровня), TDP обеих модификаций лежит в пределах 125 Вт. Частота процессора 1090T составляет 3,2-3,6 ГГц, частота 1055T 2,8-3,3 ГГц. К нам на тестирование попал флагманский процессор, рассмотреть его вы можете на фотографиях ниже.

Индекс T в названии процессора указывает на применение технологии Turbo Core. «Странное» значение рабочей частоты, на которое уже наверняка обратили внимание читатели, вызвано именно применением этой технологии.

Говоря кратко, суть такова: если приложение задействует менее чем 4 процессорных ядра (1, 2 или 3) их частоты автоматически повышаются, в то время как частоты остальных (неиспользуемых) ядер – напротив, снижаются. Система разгоняет нужные ядра и замедляет неиспользуемые при помощи изменения множителя. Помимо множителя, Turbo Core умеет повышать напряжение питания загруженных ядер, что обеспечивает стабильность на повышенных частотах. При использовании технологии TurboCore система автоматически держит процессор в рамках теплового пакета (в данном случае 125 Вт).

Проиллюстрируем работу этой технологии на простом примере. Сначала откроем AMD OverDrive и активируем функцию TurboCore (окошко справа от основного), щелкните по картинке для увеличения:

Как можно видеть на скриншоте выше, стандартный множитель нашего процессора равен 16 (слева). При использовании Turbo Сore он может быть увеличен до 18 (справа). При этом напряжение CPU VID на разгоняемых ядрах будет поднято до 1,45 В.

Теперь откроем вкладку CPU Status в AMD Overdrive и проконтролируем множитель, частоту и напряжения CPU VID каждого ядра. Также на скриншоте ниже показано окно Fritz Chess Benchmark – удобного многопоточного теста, с помощью которого будет нагружаться процессор.

Как мы можем видеть, нагрузка в данный момент практически отсутствует, соответственно процессор работает на пониженных частотах, множители всех ядер снижены. CPU VID везде составляет 1,35 В.

Запустим тест в 6-поточном режиме. Все ядра загружены на 100%, множитель в этом случае составляет 16, напряжение CPU VID по-прежнему равняется 1,35 В. В данном случае Turbo Core не работает, так как загружено более чем 3 ядра. В настройках Fritz Chess Benchmark снизим количество исполняемых потоков до двух и перезапустим тест:

Что и требовалось доказать. На приведенном скриншоте ядро, обозначенное как CPU 0, работает на сниженной частоте, в то время как ядра CPU 1,3 и 5 разогнаны в разной мере.

Таким образом, технология Turbo Core добавляет процессору универсальности. В многопоточных приложениях высокую производительность Phenom II x6 обеспечат шесть вычислительных ядер, а в "однопоточных" – увеличенная частота. И все это, заметьте, в рамках одного и того же теплового пакета. Конечно, в связи с применение функции динамического разгона возникают и новые вопросы. Например, не будет ли уменьшаться производительность процессора в однопоточных задачах в связи с тем, что нагрузка не привязана жестко к конкретному ядру а "путешествует" по разным ядрам, среди которых могут оказаться и те, производительность которых в этот момент снижена. Также было бы интересно изучить как Turbo Core сочетается с функциями энергосбережения. Настолько подробное тестирование не входило в программу нашего ознакомительного материала, поэтому на сей раз Turbo Core была деактивирована, как и энергосберегающие технологии процессоров Intel и AMD во избежание влияния на производительность системы.

Также нелишним будет упомянуть, что процессор Phenom II X6 стал базой новой топовой платформы AMD, получившей название Leo. В полном виде платформа выглядит так: Phenom II X6 + материнская плата на основе чипсета AMD 890FX/890GX/870 c южным мостом SB850 + видеокарта Radeon HD 5870. Что и говорить, система выходит достаточно мощная, и вдобавок поддерживающая различные перспективные технологии. Материнские платы поддерживают стандарты USB 3.0 и SATA 3.0, видеокарта обеспечивает вывод изображения на несколько мониторов (ATI Eyefinity), новые процессоры должны принести значительный прирост производительности в многопоточных приложениях. В общем, у AMD действительно есть все, чтобы порадовать пользователя.

Обратите внимание, официально ни один процессор AMD не работает с памятью DDR3-1600, в спецификациях четко прописан максимум: «двухканальная память DDR3-1333 МГц». Указывая такую частоту памяти на своих слайдах, AMD напоминает нам о технологии BEMP (Black Edition Memory Profiles) – аналоге всем известных XMP от Intel и EPP от nVidia.

Тестовый стенд и методика тестирования

Тестовый стенд AMD:
  • Материнская плата: ASUS M4A89GTD PRO/USB3 (BIOS 1207);
  • Процессоры: AMD Phenom II X6 1090T, AMD Phenom II X4 965;
  • Система охлаждения процессора: ICE HAMMER IH-4500;
  • Оперативная память: Corsair TR3X6G1600C7 (DDR3-1600, 7-7-7-20-41-2T, 2x2 Гбайта, двухканальный режим);
  • Корпус: открытый стенд.
Тестовый стенд Intel:
  • Материнская плата: Gigabyte X58A-UD7 (BIOS F3 от 29.01.2010);
  • Процессор: Intel Core i7 920;
  • Система охлаждения процессора: Cooler Master Hyper N620;
  • Оперативная память: Corsair TR3X6G1600C7 (DDR3-1600, 7-7-7-20-41-2T, 3x2 Гбайта, трехканальный режим);
  • Видеокарта: ATI Radeon HD 5870 (ASUS EAH5870 reference)
  • Жесткий диск: Western Digital WD1001FALS (1000 Гбайт);
  • Блок питания: Cooler Master Real Power M1000 (1 кВт);
  • Корпус: открытый стенд.

Программное обеспечение: Windows Seven Ultimate x64, ATI Catalyst Driver 10.3, AMD OverDrive 3.2.1_450, CPU-Z 1.54.

Для тестирования процессоров применялись следующие приложения:

  • 3DMark06 Professional Edition 1.1 – стандартные настройки. Учитывались результаты: Overall Score, CPU Score.
  • PCMark Vantage 1.0.2 x64 – стандартные настройки, учитывались результаты, полученные в тестированиях PCMark Suite и Memories Suite.
  • SiSoft Sandra Professional 2010 – общая производительность процессора (арифметический тест), Dhrystone ALU (арифметический тест), общая скорость криптографии.
  • Cinebench 11.5 x64 – рендеринг сцены, учитывался общий рейтинг процессора.
  • Fritz Chess Benchmark – количество операций в секунду (kilo Nods). Процессор AMD Phenom II X6 1090T выполнял алгоритм в 6 потоков. Процессоры AMD Phenom II X4 965 и Intel Core i7 920 выполняли алгоритм в 4 потока. Процессор Intel Core i7 920 с активированной функцией Hyper Threading выполнял алгоритм в 8 потоков.
  • SuperPi Mod 1.5 – учитывалось время, необходимое для вычисления 1 миллиона знаков числа Пи после запятой (Super Pi 1M)
  • 7Zip 9.13 Beta – учитывался рейтинг встроенного теста производительности (упаковка/распаковка) а также время, необходимое для упаковки/распаковки папки с разнородными файлами, общим объемом 617 МБайт. Для архивации использовался алгоритм LZMA2. Процессор AMD Phenom II X6 1090T выполнял алгоритм в 6 потоков. Процессоры AMD Phenom II X4 965 и Intel Core i7 920 выполняли алгоритм в 4 потока. Процессор Intel Core i7 920 с активированной функцией Hyper Threading выполнял алгоритм в 8 потоков.
  • WinRar x64 3.91 – учитывалось время упаковки/распаковки папки с разнородными файлами общим объемом 617 МБайт. В настройках программы был активирован режим многопоточности (multithreading).
  • TmpgEnc 4.0 Express – преобразование видеоролика в формате *.mkv 1920х1080 (Full HD) в формат MPEG4 AVC 480x320 1024 Kbps. Таким образом моделировался один из вариантов прикладной задачи кодировки видео для iPhone.
  • 3DStudio MAX 2010 – рендеринг сцены. Для тестирования использовалась стандартная сцена Trees из Tutorial-файлов программы. Ввиду простоты сцены рендеринг выполнялся с максимально возможными настройками качества.
  • Adobe Photoshop CS5 – тестирование заключалось в замере времени наложения фильтра Radial Blur на изображение в формате JPEG с разрешением 183,5 MP.
  • Crysis Warhead – Framebuffer Benchmark Tool 0.29, Ambush, Dx10, установки – пресет Enthusiast, AA – 4x. Учитывались минимальный, средний и максимальный FPS.
  • Far Cry 2 – встроенный бенчмарк, Ranch Small, Dx10, установки – Ultra High, AA – 4x. Учитывались минимальный, средний и максимальный FPS.
  • Resident Evil 5 – официальный бенчмарк (бенчмарк-версия игры), Dx10, установки – High, AA4x. Учитывался средний FPS.
  • World in Conflict – встроенный бенчмарк, Dx10, пресет – Very High, AA4x. Учитывались минимальный, средний и максимальный FPS.

Конкуренция — двигатель прогресса. Если бы не конкуренция, мы бы не стали свидетелями такого стремительного совершенствования компьютерной техники. В одном из трудов американских авторов П. Хоровица и У. Хилла «Искусство схемотехники» было сказано: «Если бы Боинг 747 прогрессировал с такой же скоростью, с какой прогрессирует твердотельная электроника, то он умещался бы в спичечном коробке и облетал бы без дозаправки земной шар 40 раз!» Ну, толку от такого маленького Боинга для обывателя не так уж и много, а вот рост производительности компьютеров идет пользователям только на пользу! Благодаря постоянной борьбе за кошелек покупателя оба процессорных гиганта вынуждены все время работать над усовершенствованием своих продуктов. Это означает, что каждый новый процессор быстрее, холоднее и, зачастую, дешевле предшественника.

Каким же образом производители увеличивают производительность центральных процессоров? Ответ прост: необходимо, чтобы процессор выполнял как можно больше вычислений за единицу времени. Для этого нужно повышать тактовую частоту процессора или увеличивать количество выполняемых инструкций за такт. И, если рост тактовых частот ограничивается физическими свойствами полупроводников, то параллельное исполнение кода может существенно ускорить работу центрального процессора. В серверных решениях и профессиональных рабочих станциях многопроцессорные конфигурации используются еще с конца прошлого века. Но весной 2005 года AMD и Intel практически одновременно представили свои первые двухъядерные продукты: Athlon 64 X2 и Pentium D. Дальнейшим развитием этих событий стал выпуск четырехъядерных CPU. А совсем недавно оба процессорных гиганта представили настольные шестиядерные процессоры. И если Intel свой Core i7 980X позиционирует как решение для очень состоятельных энтузиастов, то AMD нацелила свои шестиядерные процессоры на массовый рынок! Сегодня мы подробно рассмотрим новейший AMD Phenom II X6 и сравним его производительность с конкурирующим решением Intel.

Phenom II X6: дизайн ядра, спецификации и фирменные технологии

Процессоры Phenom II X6 были представлены публике 27 апреля 2010 г. вместе с новейшим набором системной логики AMD 890FX. Такой системный подход AMD к анонсу продуктов вызывает уважение. Дело в том, что каким бы мощным не был процессор, для раскрытия его потенциала нужна соответствующая аппаратная платформа и программная поддержка. И с тем и с другим у AMD все в порядке. Платформа Socket AM3 предлагает широкие возможности расширения и функциональности, а фирменное ПО AMD Overdrive позволяет производить тонкую конфигурацию и мониторинг аппаратного обеспечения прямо из среды операционной системы MS Windows. А если добавить к этому всему великолепные DX11-совместимые графические адаптеры семейства «Evergreen», то мы получаем полный набор компонентов для построения мощного игрового компьютера. Вот как выглядит персональный компьютер класса High-end в 2010г. по версии AMD:


Итак, перед нами очень и очень серьёзная конфигурация, которой по плечу любая задача, будь то современная игра, или кодирование видео для домашнего архива. С новейшим чипсетом AMD 890FX и материнской платой на его основе мы познакомили вас в одной из предыдущих статей. Обзору архитектуры и тестированию ATI Radeon HD5870 также был посвящен отдельный материал. Теперь настало время познакомить вас с «сердцем» новой платформы — AMD Phenom II X6.

На сегодняшний день в продуктовой линейке AMD Phenom II X6 официально присутствуют только две модели: 1055T и 1090Т. Модель 1055T имеет модификацию с пониженным энергопотреблением. Характеристики процессоров семейства Phenom II X6 представлены в таблице:

Наименование AMD Phenom II X6 AMD Phenom II X6 AMD Phenom II X6
Модель 1090T BE 1055T 1055T
Номер для заказа HDT90ZFBGRBOX HDT55TFBGRBOX HDT55TWFGRBOX
Ядро Thuban Thuban Thuban
Степпинг E0 E0 E0
Техпроцесс, нм 45nm SOI 45nm SOI 45nm SOI
Разъем AM3 AM3 AM3
Частота, МГц 3200-3600 2800-3300 2800-3300
Множитель 16-18 14-16,5 14-16,5
HyperTransport, МГц 4000 4000 4000
Кэш L1, КБ 6x128 6x128 6x128
Кэш L2, КБ 6x512 6x512 6x512
Кэш L3, КБ 6144 6144 6144
Напряжение питания, В 1,125-1,40 1,125-1,40 1,075-1,375
TDP. Вт 125 125 95
Предельная температура, °C 62 62 71
Набор инструкций ISC, IA32, x86-64, NXbit, MMX, 3DNow!, SSE, SSE2, SSE3, SSE4a ISC, IA32, x86-64, NXbit, MMX, 3DNow!, SSE, SSE2, SSE3, SSE4a

В основе новых процессоров AMD лежит хорошо знакомая архитектура K10.5, со всеми её преимуществами и недостатками. Обновленное ядро Thuban конструктивно представляет собой старый добрый Deneb с увеличенным до шести количеством ядер:


Увеличение последних повлекло за собой закономерный рост числа транзисторов с 758 млн. (Deneb) до 904 млн. (Thuban), а площадь ядра возросла с 285 кв. мм до 346 кв. мм соответственно. Следует заметить, что объем разделяемого L3-кеша остался без изменений и по прежнему составляет 6 МБ. Процессор производится по улучшенному 45-нм литографическом техпроцессу, что позволило AMD ограничить тепловыделение Phenom II X6 на уровне 125 Вт. Конечно, себестоимость производства Thuban несколько выше, чем у Deneb, а процент выхода годных пластин меньше, что связанно с большей сложностью ядра. Так что любители лотереи могут рассчитывать на скорое появление процессоров AMD, в основе которых лежит новейшее ядро с отключенными функциональными блоками. Кто знает, может быть, мы еще увидим пятиядерные процессоры?! Phenom II X6 получили официальную поддержку оперативной памяти DDR3 1600 МГц, тогда как все прежние процессоры в исполнении Socket АМ3 поддерживают DDR3 с максимальной частотой 1333 МГц. При этом контроллер памяти сохранил обратную совместимость с ОЗУ стандарта DDR2, так что обладатели системных плат Socket АМ2+ запросто смогут установить новейший шестиядерный процессор, предварительно обновив BIOS.

С выходом на рынок Phenom II X6 компания AMD представила широкой общественности технологию Turbo Core. Суть ее работы заключается в динамическом управлении частотой вычислительных ядер. При интенсивной загрузке одного-трех ядер их частоты увеличиваются на 400-500 МГц. При этом частота неактивных ядер снижается до 800 МГц. В моменты срабатывания Turbo Core напряжение на процессоре повышается до 1,475 В, но тепловыделение все равно остается в рамках TDP, равном 125. При четырех-шести вычислительных потоках все ядра работают на частоте 2800 МГц. Управление частотой ядер и напряжением целиком и полностью возложено на BIOS совместимых материнских плат. Вот как работает технология Turbo Core на процессоре AMD Phenom II X6 1055T:


Таким образом, Turbo Core позволяет получить некоторый прирост при выполнении задач, которые не имеют ярко выраженной многопоточной оптимизации. К таким задачам относятся игры и большинство программ обработки звука или изображений. Влияние данной технологии на производительность мы рассмотрим несколько позже, а пока познакомимся поближе с нашим Phenom II X6 1055T.

В комплекте с 1055Т, которые предназначены для розничной продажи, поставляется неплохой кулер на тепловых трубках AV-Z7UH40Q001. Такой же системой охлаждения комплектуются и другие модели процессоров AMD с тепловым пакетом 125 Вт. Кулер оснащен вентилятором диаметра 70 мм, который в моменты высокой нагрузки разгоняется до 5000 об/мин, издавая при этом неприятный шум.


Как и все современные процессоры AMD Phenom II X6 1055T накрыт теплораспределяющей крышкой. Внешне, за исключением маркировки, CPU не отличим от своих собратьев с меньшим количеством ядер.


Процессор выпущен на восьмой неделе 2010 года. Диагностическая утилита CPU-Z 1.54 уже обучена распознавать Phenom II X6 и выдает следующую информацию:


У нашего экземпляра оказался довольно высокий VID, равный 1,425 В, но в моменты простоя работает технология Cool&Quite, которая понижает частоту ядер до 800 МГц и напряжение до 1,225 В. Как мы уже говорили ранее, процессоры на ядре Thuban получили официальную поддержку DDR3 1600 МГц:


Разгонный потенциал первых Phenom II на ядре Deneb степпинга С2 лежал в районе 3700 МГц, причем для покорения таких частот не требовались сложные и дорогостоящие системы охлаждения. Перевод ядра Deneb на новую ревизию С3 поднял планку разгона до 4000 МГц при использовании качественного воздушного кулера. Разгонный потенциал процессоров Phenom II X6 пока что слабо изучен, но в интернете есть сведения об успешном разгоне Phenom II X6 1055T до 4000 МГц и выше. Однако, также есть сведения о повышенном требовании новых процессоров AMD к мощности VRM материнских плат. Для экспериментов по разгону была выбрана плата MSI 890FXA-GD70 на чипсете AMD 890FX, с подробным обзором которой мы ознакомим вас в ближайшее время. Эта системная плата имеет продвинутые возможности разгона и оснащена мощной подсистемой питания CPU, построенной по схеме «4+1», где четыре фазы питают вычислительные ядра, а одна фаза отвечает за формирование напряжения для контроллера ОЗУ и кеш-памяти третьего уровня.

Наш процессор отказался работать при повышении базовой частоты выше 270 МГц. Даже на 272 МГц система отказывалась стартовать, несмотря на отключение CnQ и Turbo Core, понижение множителя HT, частот NB и памяти. Такое странное поведение данного процессора было замечено еще во время тестирования системной платы Gigabyte GA-890FXA-UD7 . Первоначальный разгон составил 3780 МГц (14х270 МГц) при напряжениях Vcore 1,48 В и Vnb 1,225 B. Система абсолютно стабильно работала в LinX и Prime95, но странным образом вылетала из CPU-теста 3DMark Vantage! Пришлось снизить базовую частоту на 5 МГц. В итоге разгон составил 3710 МГц, а частоты шины HyperTransport и NB составили 2385 МГц. Понижение тактовой частоты позволило уменьшить напряжение на ядре процессора до 1,46 В.


CPU-Z неверно отображает напряжение процессора при разгоне Phenom II X6 11055T на системной плате MSI 890FXA-GD70. Вместо текущего значения напряжения выводится значение CPU VID. Программа CPUID Hardware Monitor 1.16 вполне корректно считывает и выводит Vcore. Обращаем ваше внимание на непривычно низкие температуры, которые регистрируют подсокетный датчик и встроенный в CPU термодиод. При разгоне температура под нагрузкой не превысила 51 °С.

Увы, нам не удалось получить «заветные 4 ГГц», но с другой стороны частота стабильной работы всех шести ядер была увеличена на 900 МГц, притом совершенно бесплатно! Не забывайте, что разгон − это лотерея и частотный потенциал процессоров сильно разнится от экземпляра к экземпляру. Скорее всего, нам просто не повезло с конкретным процессором…

Мода на многоядерность прочно вошла в нашу жизнь, и теперь не то чтобы двухъядерным, уже и четырехъядерным процессором в домашнем компьютере кого-то удивить сложно. Но прогресс не стоит на месте, и буквально вслед за компанией Intel, неделю назад представившей свой шестиядерный процессор для настольных компьютеров, компания AMD выпустила свой шестиядерник, который мы сегодня и рассмотрим.

⇡ Процессор AMD Phenom II X6 1090T

Внешне процессор AMD Phenom II X6 1090T ничем не отличается от своих собратьев для платформы Socket AM3, кроме как маркировкой. А внутри он выглядит следующим образом: На фото кристалла четко различимы шесть вычислительных ядер с выделенной кэш-памятью у каждого, а также общий разделяемый кэш, занимающий нижнюю четверть площади кристалла. Давайте посмотрим, что скажет утилита CPU-Z о характеристиках процессора AMD Phenom II X6 1090T и тестовой системы.

AMD Phenom II X6 1090T выполнен по техпроцессу 45 нм, содержит шесть вычислительных ядер, по 128 Кб и 512 Кб кэш-памяти первого и второго уровня на каждое ядро, соотвественно. Также имеется общая для всех ядер кэш-память третьего уровня объемом 6 Мб, как и у четырехъядерных предшественников.

Для знакомства с возможностями AMD Phenom II X6 1090T мы использовали материнскую плату MSI 890GXM-G65, основанную на наборе системной логики AMD 890GX.

Эта материнская плата обладает весьма продвинутыми возможностями и, хотя у AMD Phenom II X6 1090T заявлена поддержка памяти стандарта DDR3-1333, самостоятельно установила память в режим работы DDR3-1600 с таймингами 9-9-9-24-1T, что полностью соответствует характеристикам использованных модулей памяти. К сожалению, более высоких множителей частоты памяти в BIOS не оказалось, и дальнейшее повышение частоты оперативки возможно только при увеличении базовой частоты.

⇡ Разгон

Как и при тестировании четырехъядерных процессоров Phenom II, мы попробовали увеличить частоту кэш-памяти третьего уровня - ее стабильное значение составило 2600 МГц. Отметим, что не обошлось без некоторых странностей. Дело в том, что частота работы "северного моста", встроенного в процессор, не должна превышать частоту шины HT Link, максимум которой ограничен значением 2600 МГц. Тем не менее, если в BIOS установить частоту NB в значение, скажем, 2800 МГц, то все будет работать. По крайней мере, Windows загружалась и можно было пройти некоторые тесты. Впрочем, такой режим оказался нестабильным, несмотря на повышение соответствующих напряжений. А при одинаковых частотах HT и NB, равных 2600 МГц, процессор был совершенно стабилен, поэтому результаты тестирования при таких настройках будут приведены на итоговых диаграммах производительности.

На этом эксперименты с разгоном не закончились. Мы попробовали разогнать процессор и по частоте ядер. При частоте 4,2 ГГц можно было загрузить Windows 7, но запуск любого приложения, нагружающего процессор, приводил к падению системы в синий экран. При частоте 4,1 ГГц наблюдалась та же картина, а вот частота 4,0 ГГц оказалась стабильной, на ней и были проведены все тесты при разгоне.

⇡ AMD Turbo Core

Как известно, процессоры Intel с архитектурой Nehalem могут динамически изменять частоту ядер выше номинальной, в зависимости от загрузки. И называется эта технология - Intel Turbo Boost. Шестиядерные процессоры AMD теперь также обладают похожей технологией, а называется она AMD Turbo Core. При всей схожести идей, лежащих в их основе, некоторые различия все же имеются. В технологии Intel Turbo Boost рабочая частота активных ядер зависит количества простаивающих. Чем больше ядер простаивает в данный момент, тем выше частота остальных, загруженных работой. Если же все ядра загружены, то процессор работает на номинальной частоте. При использовании технологии AMD Turbo Core с шестиядерными процессорами дела обстоят похожим образом, однако повышенная частота всего одна, и для ее активации необходимо, чтобы по крайней мере три ядра не были загружены работой. Рассмотрим случай с процессором AMD Phenom II X6 1090T. Ниже приведены фрагменты скриншотов утилиты AMD OverDrive, которая наглядно демонстрирует состояние ядер процессора, и позволяет управлять режимами их работы, включая разгон и изменение настроек AMD Turbo Core. Для просмотра полного скриншота нажмите на фрагменте. Если загружено только одно ядро процессора, то его частота повышается до 3,6 ГГц, а напряжение на ядре с 1,3 В до 1,475 В. Частота остальных ядер при этом варьируется в довольно широких пределах - от 800 Мгц до номинальной, но напряжение на неиспользуемых ядрах остается штатным - 1,3 В. Если "нагрузить" еще два ядра, то они будут работать в точно таком же режиме, как показано на этом фрагменте, а остальные три ненагруженных - при штатном напряжении и пониженной частоте. Если у процессора AMD Phenom II X6 1090T нагружены четыре ядра или более, то их частота будет равна номинальной - 3,2 ГГц, как и напряжение - 1,3 В. Остальные ненагруженные ядра могут работать на пониженной частоте. Стоит отметить, что когда мы попытались отключить технологии энергосбережения в BIOS материнской платы, чтобы зафиксировать частоту ядер процессора на постоянном уровне, нам это не удалось. Возможно, это как то связано с особенностями конкретной материнской платы, но есть подозрение, что это процессор AMD Phenom II X6 1090T настолько "умный" и потому сам следит за своим энергопотреблением. Кстати, значение напряжения на ядрах процессора при активации AMD Turbo Core можно регулировать с помощью все той же утилиты AMD OverDrive. И, как выяснилось при разгоне нашего экземпляра процессора, напряжение Vcore, равное 1,475 В, несколько завышено. Процессор абсолютно стабильно работал под полной нагрузкой на частоте 4 ГГц при напряжении равном 1,425 В. Что интересно, повышение напряжения Vcore никак не сказывалось на увеличении потолка разгона. Впрочем, возможно, более продвинутые и "заточенные" под разгон материнские платы на основе чипсета AMD 890FX смогут раскрыть весь потенциал новинки более полно.

⇡ Условия тестирования

Для сравнения с AMD Phenom II X6 1090T мы решили взять процессор AMD Phenom II X4 955, поскольку его штатная частота также равна 3,2 Ггц, а все остальные параметры, за исключением числа ядер, одниковы. Это позволит, с одной стороны, увидеть прирост производительности от увеличения количества ядер в многопоточных приложениях, а с другой - оценить прирост от использования технологии AMD Turbo Core на тех приложениях, которые не используют больше трех вычислительных потоков. Также мы взяли уже рассмотренный нами шестиядерный процессор Intel Core i7 980X 3.33 GHz . Отметим, что этот процессор использовался в номинальном режиме с комплектом трехканальной памяти, работающей в режиме DDR3-1333 и таймингами 9-9-9-24-1T, а технология Intel Turbo Boost была активирована (максимальная частота ядра в этом режиме равна 3,47 ГГц). По умолчанию, технология Intel Hyper Threading активирована, то есть Intel Core i7 980X использует 12 вычислительных потоков, но дополнительно были проведены тесты и при отключении Hyper Threading. Таким образом, можно будет оценить прирост от использования Hyper Threading в том или ином тесте. Ну и еще один представитель Intel - процессор Core i7 870. Этот процессор также тестировался в номинальном режиме с оперативной памятью, работающей в в режиме DDR3-1333 и таймингами 9-9-9-24-1T. Технология Turbo Boost была активирована, заметим, что при этом частота активных ядер процессора равна 3,6 ГГц, как и у AMD Phenom II X6 1090T при активации AMD Turbo Core. Помимо штатных частот, Intel Core i7 870 был протестирован и при разгоне до частоты 4,0 Ггц, что опять же совпадает со значением, до которого разогнался шестиядерник AMD. В этом режиме технология Turbo Boost была выключена, а оперативная память работал в режиме DDR3-1800. Более подробный список остального использовавшегося при тестировании оборудования приведен ниже:

Тестовое оборудование

Процессоры AMD Phenom II X6 1090T 3.2 ГГц
AMD Phenom II X4 955 3.2 ГГц
Intel Core i7 870 2.93 ГГц
Intel Core i7 980X 3.33 ГГц
Система охлаждения CPU Zalman CNPS 10x Extreme @ 1600 об/мин
Материнские платы MSI 890GXM-G65, Socket AM3
Asus Maximus III Extreme, Socket LGA1156
ASUS Rampage II Extreme, Socket LGA 1366
Оперативная память 3x 1GB Apacer DDR-3 2000 MHz (9-9-9-24-2T) @ 1333 MHz (9-9-9-24-1T)
2x 2GB Super Talent DDR3-2000 @ 1600 (9-9-9-24-1T)
Видеокарта AMD Radeon HD 5870 1 Гб, Catalyst 3.10
Жесткий диск Samsung SpinPoint 750 GB
Блок питания Lian Li PS-A750GB, 750 Вт
Операционная система Windows 7 Home Premium x64

⇡ Температурные режимы

Поскольку мы использовали одну и ту же платформу, интересно было посмотреть на температурный режим новинки в сравнении с представителем четырехъядерной серии процессоров Phenom II. Как уже говорилось, использовался кулер Zalman CNPS 10x Extreme. Этот кулер имеет как плавную ручную регулировку скорости вращения вентилятора, так и фиксированными ступенями. Мы выбрали среднюю ступень, при которой вентилятор вращался со скоростью 1600 об/мин. Все доступные технологии энергосбережения процессоров были активированы.

Как видите, без нагрузки, в режиме рабочего стола Windows, температура процессора AMD Phenom II X6 1090T весьма низка и значительно ниже таковой у его младшего собрата. Однако здесь следует заметить, что при включении мониторинг BIOS материнской платы показывал температуру процессора около 45 градусов Цельсия, то есть на 22 градуса выше, чем утилита AMD Overdrive, показания которой приведены на диаграмме. Мы все же склонны верить данным утилиты AMD Overdrive, поскольку при и тестировании под нагрузкой теплосъемник кулера и тепловые трубки у его основания были лишь теплыми, а не горячими, что при температуре процессора около 70 градусов Цельсия не представляется возможным.

При прогоне нескольких циклов бенчамрка игры Far Cry 2 температура AMD Phenom II X6 1090T подросла совсем незначительно, и лишь при разгоне чуть превысила планку 40 градусов Цельсия. В то же время, процессор Phenom II X4 955 прогрелся уже до 50 градусов.

Стресс-тестирование утилитой OCCT в режиме Linpack 64-bit также показало весьма занятные результаты. На номинальных частотах температура Phenom II X6 1090T составила около 45 градусов Цельсия, и только повышение напряжения на ядре и разгон до частоты 4,0 ГГц смогло прогреть новинку до 56,2 градусов. А старичок Phenom II X4 955 даже в штатном режиме уже достиг планки 60 градусов. Заметим, что указываемая AMD максимальная температура ядра процессоров Phenom II равна 62 градуса Цельсия.

⇡ Общее энергопотребление системы

С температурами все ясно - новинка получилась весьма "прохладной" и неприхотливой. Теперь давайте посмотрим на энергопотребление системы в целом. Приведенные ниже цифры соответствуют показаниям ваттметра, которые снимались до блока питания. То есть, если вы хотите прикинуть реальную потребляемую системой мощность, следует умножить эти цифры примерно на 0,8-0,85 (КПД блока питания). Итак, приступим.

В режиме рабочего стола Windows платформа AMD потребляет не более 100 Вт, причем система на базе AMD Phenom II X6 1090T оказывается чуточку экономичнее по этому показателю. Занятно, но система на базе Intel Core i7 870, работающим на меньшей частоте, потребляет несколько больше, а при разгоне так и вовсе выбивается в "лидеры". Энергопотребление системы на основе шестиядерного процессора Intel Core i7 980X оказывается примерно на 40% выше, чем у представителей AMD.

C увеличением нагрузки на систему относительная разница в результатах уменьшается. Тем не менее, система на основе Intel Core i7 980X потребляет электроэнергии несколько больше, а в "лидерах" по-прежнему разогнанный Intel Core i7 870.

Стресс-тест OCCT Linpack 64-bit совершенно меняет картину. Самой экономичной теперь оказывается система на базе Intel Core i7 870 в номинальном режиме, затем идут представители AMD, также работающие в штатном режиме. Заметьте - здесь энергопотребление системы на основе шестиядерного процессора Phenom II X6 1090T впервые оказывается выше, чем у платформы с Phenom II X4 955, у которого четыре ядра. Чуть больше потребляет система с шестиядерным Intel Core i7 980X, ну а в лидерах оказываются платформы с процессорами, разогнанными до частоты 4,0 ГГц. Такой значительный скачок в энергопотреблении объясняется не столько повышенной частотой процессоров, сколько увеличением их напряжения питания. И, наконец, последний в этой серии тест, нагружающий как процессор, так и видеокарту - два наиболее "прожорливых" компонента современного игрового компьютера. "Прогрев" процессора осуществлялся с помощью стресс-теста из пакета Everest Ultimate. Конечно, это не такой "тяжелый" тест, как OCCT Linpack, но и он создает весьма ощутимую нагрузку на CPU. Поскольку при полной загрузке ядер процессора тест Furmark заметно снижал "обороты" и видеокарта работала не в полную силу, в Диспетчере задач Windows бенчмарку задавалось соответствие таким образом, чтобы один вычислительный поток оставался свободным. В этом случае Furmark сразу начинал работать в полную силу и энергопотребление видеокарты резко возрастало.

В номинальном режиме платформы на основе AMD Phenom II X6 1090T и Intel Core i7 870 демонстрируют практически одинаковое энергопотребление на уровне около 350 Вт. Система с шестиядерным Intel Core i7 980X потребляет уже чуть выше 380 Вт, а системы с разогнанными процессорами перешагнули планку 400 Вт. Как уже говорилось, с учетом КПД блока питания реальное энергопотребление компьютера будет несколько ниже. Глядя на приведенные цифры, возникает мысль, что даже обычного блока питания мощностью 450 Вт будет вполне достаточно для питания достаточно мощного компьютера с шестиядерным процессором и одной топовой видеокартой. В общем-то, это так, только стоит учесть, что блок питания должен быть качественным и обеспечивать нормальные выходные параметры при нагрузках, близких к максимальной. Что касается разгона, то здесь лучше подстраховаться и использовать блок питания с значительным запасом по мощности, поскольку любое повышение напряжения на CPU или GPU значительно увеличивает энергопотребление этих компонентов.


  • Приложения. Общее сравнение производительности процессоров
  • Введение

    После выхода на рынок процессора Phenom II X6 1090T BE у компании AMD появился шанс вернуть себе давно утраченные позиции в высшем ценовом сегменте процессоров. К этому предрасполагают шесть процессорных ядер, высокая тактовая частота 3200 МГц и технология Turbo Core, аналог интеловского Turbo Boost.

    В данном обзоре этот процессор будет всесторонне протестирован в хорошо зарекомендовавшем себя пакете "процессорозависимых" игр. По результатам станет ясно реальное позиционирование Phenom II X6 1090T BE на рынке игровых системных блоков.

    Противниками героя обзора стали старшие процессоры Intel Core i7 920 и Core i5 760, представитель отлично зарекомендовавшей себя серии Core i3 - Core i3 560, и младший собрат Phenom II X4 965 BE.

    Тестовая конфигурация

    Тесты проводились на следующих стендах:

    Стенд №1:

    • Материнская плата: ASRock P55 Extreme, BIOS v2.70
    • Оперативная память:

    Стенд №2:

    • Материнская плата: GigaByte GA-EX58-UD5, BIOS F12
    • Оперативная память: 3 x 2048 Мбайт DDR3 Corsair (Spec: 1600 МГц / 8-8-8-20-1t / 1.65 В)

    Стенд №3:

    • Материнская плата: GigaByte GA-890FXA-UD7, BIOS F4
    • Оперативная память: 2 x 2048 Мбайт DDR3 Corsair (Spec: 1600 МГц / 8-8-8-20-1t / 1.65 В)

    Процессоры:

    • Core i7 920 - 2660 @ 4300 МГц
    • Core i5 760 - 2800 @ 4000 МГц
    • Core i3 560 - 3330 @ 4400 МГц
    • Phenom II X6 1090Т BE - 3200 @ 4100 МГц
    • Phenom II X4 965 BE - 3400 @ 4000 МГц

    Остальные компоненты:

    • Видеокарта: GeForce GTX 480 1536 Мбайт - 700/1400/3696 МГц (Palit)
    • Система охлаждения CPU: Cooler Master V8 (~1100 об/мин)
    • Дисковая подсистема: SATA-II 500 Гбайт, WD 5000KS, 7200 об/мин, 16 Мбайт
    • Блок питания: Corsair TX 950 Ватт (штатный вентилятор: 140-мм на вдув)
    • Корпус: открытый тестовый стенд
    • Монитор: 23" Acer V233H (Wide LCD, 1920x1080 / 60 Гц)

    Программное обеспечение:

    • Операционная система: Windows 7 build 7600 RTM x64
    • Драйверы видеокарты: GeForce 260.89 WHQL

    Инструментарий и методика тестирования

    Для более наглядного сравнения процессоров все игры, используемые в качестве тестовых приложений, запускались в разрешениях 1280х1024 и 1920х1080.

    В следующих играх использовались средства измерения быстродействия (бенчмарки):

    • ARMA 2 (Бенчмарк №1)
    • Colin McRae DIRT 2 (Битва Battersea - Лондон)
    • Formula 1 2010 (Бенчмарк)
    • Grand Theft Auto 4 EFLC (Потерянные и Проклятые)
    • Lost Planet Colonies (Зона 1)
    • Mafia 2 (Бенчмарк)
    • R.U.S.E. (Бенчмарк)
    • World in Conflict: Soviet Assault (Побережье)

    В данных играх производительность измерялась с помощью утилит FRAPS v3.2.1 build 11425 и AutoHotkey v1.0.48.05:

    Во всех играх замерялись минимальные и средние значения FPS.

    В тестах, в которых отсутствовала возможность замера минимального FPS , это значение измерялось утилитой FRAPS.

    VSync при проведении тестов был отключен.

    Чтобы избежать ошибок и минимизировать погрешности измерений, все тесты производились по три - пять раз. При вычислении среднего FPS за итоговый результат бралось среднеарифметическое значение результатов всех прогонов (трех не "холостых"). В качестве минимального FPS выбиралось минимальное значение показателя по результатам трех прогонов.

    Технические характеристики процессоров Intel

    Технические характеристики процессоров AMD

    Разгон процессоров

    Процессоры разгонялись следующим образом. Стабильность разгона проверялась утилитой ОССТ 3.1.0 "Perestroika" путем получасового прогона процессора на максимальной матрице с принудительной 100% нагрузкой. Соглашусь с тем, что разгон тестируемых процессоров не является абсолютно стабильным, но для любой современной игры он подходит на все сто.

    Core i7 920

    Штатный режим. Тактовая частота 2660 МГц, базовая частота 133 МГц (133х20), частота DDR3 - 1600 МГц (133х12), напряжение питания 1.18 В, напряжение питания DDR3 - 1.65 В, Turbo Boost - включен.

    3400 МГц - базовая частота 170 МГц (170х20), частота DDR3 - 1700 МГц (170х10), напряжение питания 1.18 В, напряжение питания DDR3 - 1.65 В, Turbo Boost - включен.

    Процессор удалось разогнать до частоты 4300 МГц. Для этого базовая частота была поднята до 205 МГц (205х21), частота DDR3 - 1640 МГц (205х8), напряжение питания - до 1.35 В, напряжение питания DDR3 - 1.65 В, Turbo Boost - включен.

    Core i5 760

    Штатный режим. Тактовая частота 2800 МГц, базовая частота 133 МГц (133х21), частота DDR3 - 1333 МГц (133х10), напряжение питания 1.11 В, напряжение питания DDR3 - 1.65 В, Turbo Boost - включен.

    3400 МГц - базовая частота 162 МГц (162х21), частота DDR3 - 1620 МГц (162х10), напряжение питания 1.25 В, напряжение питания DDR3 - 1.65 В, Turbo Boost - включен.

    Процессор удалось разогнать до частоты 4000 МГц. Для этого базовая частота была поднята до 191 МГц (191х21), частота DDR3 - 1528 МГц (191х8), напряжение питания - до 1.38 В, напряжение питания DDR3 - 1.65 В, Turbo Boost - выключен.

    Core i3 560

    Штатный режим. Тактовая частота 3330 МГц, базовая частота 133 МГц (133х25), частота DDR3 - 1333 МГц (133х10), напряжение питания 1.15 В, напряжение питания DDR3 - 1.65 В.

    3400 МГц - базовая частота 136 МГц (136х25), частота DDR3 - 1360 МГц (136х10), напряжение питания 1.15 В, напряжение питания DDR3 - 1.65 В.

    Процессор удалось разогнать до частоты 4400 МГц. Для этого базовая частота была поднята до 176 МГц (176х25), частота DDR3 - 1760 МГц (176х10), напряжение питания - до 1.35 В, напряжение питания DDR3 - 1.65 В.

    Phenom II X6 1090Т BE

    Штатный режим. Тактовая частота 3200 МГц, частота системной шины 200 МГц (200х16), частота контроллера памяти 2000 МГц (200х10), частота DDR3 - 1600 МГц (200х8), напряжение питания ядра 1.3 В, напряжение питания DDR3 - 1.65 В, Turbo Core - включен.

    3400 МГц - частота шины 213 МГц (213х16), частота контроллера памяти 2130 МГц (213х10), частота DDR3 - 1704 МГц (213х8), напряжение питания ядра 1.38 В, напряжение питания DDR3 - 1.65 В, Turbo Core - включен.

    Процессор удалось разогнать до частоты 4100 МГц. Для этого частота шины была поднята до 256 МГц (256х16), контроллера памяти до 2560 МГц (256х10), напряжение питания ядра - до 1.5 В, напряжение питания DDR3 - 1.65 В, напряжение северного моста - на 0.1 В. Частота DDR3 составила 1705 МГц (256х6.66). Turbo Core - выключен.

    Phenom II X4 965 BE

    Штатный режим. Тактовая частота 3400 МГц, частота системной шины 200 МГц (200х17), частота контроллера памяти 2000 МГц (200х10), частота DDR3 - 1333 МГц (200х6.66), напряжение питания ядра 1.38 В, напряжение питания DDR3 - 1.65 В.

    Процессор удалось разогнать до частоты 4000 МГц. Для этого частота шины была поднята до 235 МГц (235х17), контроллера памяти до 2585 МГц (235х11), напряжение питания ядра - до 1.55 В, напряжение питания DDR3 - 1.65 В, напряжение северного моста - на 0.1 В. Частота DDR3 составила 1565 МГц (235х6.66).

    Перейдем непосредственно к тестам.

    Результаты тестов: сравнение производительности

    Arcania - Gothic 4 (Фишир)

    • Версия 1.1
    • DirectX 9
      • качество текстур - высоко
      • качество SSAO - высоко
      • качество света - высоко
      • качество теней - ультра
      • динамические тени - мир и геометрия
      • тени - мир и геометрия
      • качество персонажей - высоко
      • качество мира - высоко
      • качество частиц - высоко
      • экспозиция - вкл.
      • блики - вкл.
      • детализация лиц - вкл.
      • постобработка - вкл.

    1280 х 1024



    1920 х 1080

    Включите JavaScript, чтобы видеть графики
    минимальный и средний FPS

    Phenom II X6 1090T BE достойно стартовал в RPG Arcania - Gothic 4 - во всех режимах работы и обоих разрешениях он ни в чем не уступил в борьбе за первое место Core i7 920 и Core i5 760.

    ARMA 2 (Бенчмарк №1)

    • Версия 1.05.62017
    • DirectX 9
      • полноэкранное сглаживание (AA) 4
      • анизотропная фильтрация (AF) 16
      • дистанция обзора - максимальная
      • качество текстур - очень высокое
      • размер теней - 4096
      • качество ландшафта - очень высокое
      • качество объектов - очень высокое
      • качество теней - очень высокое
      • постобработка - очень высокая

    1280 х 1024

    Включите JavaScript, чтобы видеть графики

    1920 х 1080

    Включите JavaScript, чтобы видеть графики
    минимальный и средний FPS

    В шутере ARMA 2 в номинальном режиме работы Phenom II X6 1090T BE разделил лидирующую позицию с Phenom II X4 965 BE и четырехъядерными процессорами Intel, однако после разгона вперед вышли Core i7 920 и Core i5 760. В междоусобице с младшим сородичем лишние два ядра принесли новичку минимальное преимущество.

    Уменьшение числа ядра Thuban

    Не все процессоры автоматически можно назвать самыми лучшими только из-за того, что они оснащены максимально возможным количеством вычислительных блоков. Мы решили оценить производительность, энергопотребление и эффективность нового процессора Phenom II X6, протестировав его во всех возможных режимах ядер: с 6, 5, 4, 3, 2 и всего с одним вычислительным ядром CPU.

    Результаты наших тестов будут менее интересны тем пользователям, кто уже купил новые шестиядерные процессоры AMD, поскольку вряд ли они пойдут на отключение ядер процессора – всё же мы полагаем, что шесть ядер приобретаются по какой-то весомой причине. Однако результаты тестов довольно хорошо показывают, насколько хорошо производительность и эффективность Thuban масштабируется в зависимости от количества ядер – от нескольких ядер до полных шести вычислительных блоков. В конце концов, шесть ядер явно работают быстрее в многопоточных окружениях, но дают ли они при этом наилучшую эффективность энергопотребления? Да и переход с четырёх на шесть ядер может оказаться не таким ощутимым, как с двух на четыре.

    Оценка различий между четырьмя и шестью ядрами имеет смысл и с другой перспективы. Как вы уже могли видеть в нашей статье "Разблокирование AMD Phenom II X4 960T: превращаем четыре ядра в шесть ", существует возможность разблокировать процессоры AMD, чтобы получить дополнительные вычислительные ядра. Конечно, будут разблокированные процессоры стабильно работать или нет – уже другой вопрос, поскольку шестиядерный CPU часто превращают в четырёхъядерный из-за дефектов в отключённых ядрах. Поэтому не забывайте провести расширенное тестирование стабильной работы, прежде чем использовать такую систему в играх и приложениях.

    Реализация Turbo Core и материнские платы


    В нашем обзоре процессора AMD Phenom II X6 и платформы 890FX приведены все детали о последнем флагмане AMD, так что мы рекомендуем ознакомиться со статьёй, если вы ещё этого не сделали. Кроме того, чуть выше мы уже упоминали статью, посвящённую разблокированию ядер четырёхъядерного Zosma , чтобы превратить его в шестиядерный Thuban.

    Наш процессор должен быть хорошо вам знаком: AMD предлагает две версии, а именно Phenom II X6 1090T на 3,2 ГГц и 1055T на 2,8ГГц. Оба базируются на шестиядерном дизайне Thuban, который оснащён 512 кбайт кэша L2 на каждое ядро и общим кэшем L3 объёмом 6 Мбайт. Кросс-коммутатор обеспечивает доступ к двухканальному контроллеру памяти DDR3 и каналу HyperTransport, соединяющему CPU и чипсет.

    Все новые четырёхъ- и шестиядерные процессоры (Zosma и Thuban) поддерживают функцию AMD Turbo Core, которая динамически разгоняет процессор выше уровня номинальной тактовой частоты. Уровень разгона зависит от нагрузки на CPU, при этом неиспользуемые ядра автоматически не замедляются. Но данная функция всё равно весьма полезна, поскольку она даёт прирост на несколько сотен мегагерц в ситуациях с пиковой нагрузкой на несколько ядер, при условии, что не превышается тепловой пакет.

    Реализация Turbo Core

    Выключение отдельных ядер означает, что у нас появляется больший резерв по тепловому пакету, чтобы функция Turbo Core срабатывала чаще. И в приложениях, которые не оптимизированы под многопоточность, мы потенциально должны заметить какие-либо преимущества. В таких случаях функция Turbo Core будет включаться и ускорять одно или два ядра до максимальной частоты. К сожалению, мы не получили подтверждения такового прироста в тестах.

    Материнские платы

    Хотя технически все материнские платы Socket AM3 способны запускать процессоры с меньшим числом ядер, мы хотели использовать решение на новейшем чипсете 890FX. На наших страницах уже был опубликован обзор нескольких материнских плат на чипсете 890GX с интегрированной графикой, а совсем недавно вышел сравнительный обзор разных моделей на 890FX . Мы решили использовать материнскую плату Asus Crosshair IV Formula, которая входит в тестовый набор, разосланный AMD по редакциям для тестов процессора Phenom II X6. Но нам ещё предстоит увидеть, какое количество материнских плат Socket AM3 оснащены необходимыми функциями BIOS для отключения отдельных вычислительных ядер. Если судить по материнским платам Intel Socket LGA 1366, то там существует крайне мало комбинаций плата/BIOS, которые позволяют выставлять произвольное количество активных ядер CPU.



    Нажмите на картинку для увеличения.

    Мы использовали материнскую плату Asus 890FX Crosshair IV Formula, которая позволяет произвольно выставлять количество активных ядер CPU.

    Тестовая конфигурация

    Аппаратное обеспечение
    Материнская плата (Socket AMD3) Asus Crosshair IV Formula (Rev. 1.0), чипсет: AMD 890FX, BIOS: 0701 (04/02/2010)
    CPU AMD I AMD Phenom II X6 1090T (45 нм, 3,2 ГГц, 6x 512 кбайт кэша L2 и 6 Мбайт кэша L3, TDP 125 Вт, Rev. C3)
    Память DDR3 2x 2 Гбайт DDR3-1333 (OCZ3G2000LV4GK 8-8-8-24)
    Видеокарта Sapphire Radeon HD 5850, GPU: Cypress (725 МГц), видеопамять: 1024 Мбайт GDDR5 (2000 МГц), потоковые процессоры: 1440
    Жёсткий диск Western Digital VelociRaptor, 600 Гбайт, 10 000 об/мин
    Блок питания PC Power & Cooling, Silencer 750EPS12V 750 Вт
    Системное ПО и драйверы
    Операционная система Windows Ultimate x64, обновлена 2010-03-03

    Тесты и настройки

    Кодирование аудио
    iTunes Version: 9.0.3.15
    Audio CD ("Terminator II" SE), 53 min.
    Convert to AAC audio format
    Lame MP3 Version 3.98.3
    Audio CD "Terminator II SE", 53 min
    convert wav to mp3 audio format
    Command: -b 160 --nores (160 kbps)
    Кодирование видео
    Handbrake CLI Version: 0.94
    Video: Big Buck Bunny (720x480, 23.972 frames) 5 Minutes
    Audio: Dolby Digital, 48000 Hz, 6-Kanal, English
    to
    Video: AVC1 Audio1: AC3 Audio2: AAC (High Profile)
    Mainconcept Reference v2 Version: 2.0.0.1555
    MPEG2 to H.264
    MainConcept H.264/AVC Codec
    28 sec HDTV 1920x1080 (MPEG2)
    Audio:
    MPEG2 (44.1 kHz, 2 Channel, 16 Bit, 224 kbps)
    Codec: H.264 Pro
    Mode: PAL 50i (25 FPS)
    Profile: H.264 BD HDMV
    7-Zip Version 9.1 beta
    LZMA2
    Syntax "a -t7z -r -m0=LZMA2 -mx=5"
    Benchmark: 2010-THG-Workload
    Winrar Version 3.92
    RAR
    Syntax "winrar a -r -m3"
    Benchmark: 2010-THG-Workload
    Winzip 14 Version 14.0 Pro (8652)
    WinZIP Commandline Version 3
    ZIPX
    Syntax "-a -ez -p -r"
    Benchmark: 2010-THG-Workload
    Autodesk 3d Studio Max 2010 Version: 10 x64
    Rendering Space Flyby Mentalray (SPECapc_3dsmax9)
    Frame: 248
    Resolution: 1440 x 1080
    Cinebench 11.5 Version 11.5 Build CB25720DEMO
    CPU Test single and multi threaded
    Adobe Photoshop CS 4 (64-Bit) Version: 11
    Filtering a 16 MB TIF (15000x7266)
    Filters:
    Radial Blur (Amount: 10; Method: zoom; Quality: good)
    Shape Blur (Radius: 46 px; custom shape: Trademark sysmbol)
    Median (Radius: 1px)
    Polar Coordinates (Rectangular to Polar)
    Adobe Acrobat 9 Professional Version: 9.0.0 (Extended)
    == Printing Preferenced Menu ==
    Default Settings: Standard
    == Adobe PDF Security - Edit Menu ==
    Encrypt all documents (128 bit RC4)
    Open Password: 123
    Permissions Password: 321
    Microsoft Powerpoint 2007 Version: 2007 SP2
    PPT to PDF
    Powerpoint Document (115 Pages)
    Adobe PDF-Printer
    Fritz Fritz Chess Benchmark Version 4.3.2
    3DMark Vantage Version: 1.02 Patch 1901
    Options: Performance
    Graphics Test 1
    Graphics Test 2
    CPU Test 1
    CPU Test 2
    PCMark Vantage Version: 1.0.2.0 Patch 1901
    PCMark Benchmark
    Memories Benchmark
    SiSoftware Sandra 2010 Version: 2010.1.16.10
    Processor Arithmetic, Cryptography, Memory Bandwith

    Результаты тестов


    Все тесты АЛУ Sandra 2010 Pro показывают, что добавление каждого ядра увеличивает общую производительность пропорционально производительности одного ядра за некоторым исключениями. Два ядра дают более чем 2X прирост производительности.




    Тест шифрования SHA256 вновь демонстрирует, что два ядра работают исключительно хорошо. Возможно, это связано с реализацией Turbo Core.

    Тест пропускной способности памяти показывает, что четырёх ядер достаточно, чтобы максимально нагрузить контроллер памяти DDR3.


    Тест GPU упирается в производительность видеокарты Radeon HD5850, которую мы использовали.

    Общий результат отражает оба теста – графическая производительность заметно увеличивается, когда используется два или большее количество ядер.


    Тест PCMark Vantage не выполнился полностью, когда мы ограничили Phenom II X6 одним ядром. По общему результату видно, что чем больше ядер, тем выше производительность, но прирост не всегда большой. Помните, что PCMark – это синтетический тест, который может и не соответствовать работе повседневных приложений, но он позволяет оценить производительность системы в целом.



    7-Zip не очень хорошо работает на нечётном количестве ядер. Три или пять активных ядер не дают ощутимого прироста по сравнению с двумя или четырьмя ядрами, соответственно. Впрочем, данный архиватор выигрывает от увеличения количества активных ядер.


    Многопоточный тест Cinebench масштабируется очень хорошо, в отличие от однопоточного.

    Adobe Acrobat мог бы работать намного быстрее, если бы программа была оптимизирована под несколько вычислительных ядер. Более значительный прирост можно получить, если запустить два ядра на высоких тактовых частотах.

    Ситуация в Photoshop иная, программа приятно выигрывает от каждого ядра, хотя важно подчеркнуть, что преимущества по производительности зависят от накладываемых фильтров. Некоторые фильтры оптимизированы под многопоточность, другие – нет.

    Архиватор WinRAR оптимизирован под многопоточность, но производительность ограничивается на уровне четырёх ядер. Переход на шесть ядер даёт незначительный прирост производительности.

    Утилита WinZip, которая многими воспринимается как наиболее популярный архиватор, даёт весьма досадные результаты. Мы не видим ощутимой разницы от перехода с одного ядра на шесть. Вполне понятно, что данная утилита является однопоточной.


    Как видим, даже одна из новых версий iTunes не даёт серьёзного преимущества от увеличения числа ядер. Впрочем, на кодирование аудио уходит совсем немного времени, так что особых проблем это не вызывает.

    То же самое касается и Lame: утилита не очень хорошо масштабируется в зависимости от числа вычислительных ядер.

    Mainconcept выигрывает от всех доступных вычислительных ядер, хотя чем больше используется ядер, тем меньше становится прирост производительности.

    В Handbrake мы тоже можем наблюдать хорошую масштабируемость.

    Энергопотребление системы в режиме бездействия изменяется довольно слабо при отключении отдельных ядер. Примерно 15-20 Вт требуются видеокарте, да и энергопотребление у CPU при переходе в режим бездействия не так и велико.

    При пиковой нагрузке ситуация меняется. Каждое дополнительное ядро увеличивает суммарное энергопотребление. Впрочем, можно видеть, что чем больше ядер, тем меньше энергопотребления добавляет каждое новое ядро. Таким образом, увеличение числа ядер положительно сказывается с точки зрения пикового энергопотребления, что должно соответствующим образом повлиять на эффективность, которая выражается в производительности на ватт.


    Шесть ядер оказываются самым производительным решением при выполнении нашего тестового прогона.

    Ситуация начинает становиться интереснее: среднее энергопотребление у пяти ядер оказалось ниже, чем у четырёх ядер при выполнении нашей тестовой нагрузки.

    Суммарная затраченная энергия тоже хорошо масштабируется, при этом вполне очевидно, что конфигурации с большим количеством ядер требуют меньше энергии для выполнения нашей тестовой нагрузки.

    В итоге мы видим, что чем больше активных ядер, тем лучше производительность в расчёте на ватт (эффективность).




    Заключение

    Наше тестирование показало, что до сих пор многие рабочие нагрузки не могут использовать больше двух ядер. Программы, такие как WinZip, так и не были оптимизированы под многопоточность, что весьма досадно. Даже самый дешёвый двуядерный процессор мог бы дать значительно более высокую производительность, если бы программа была должным образом оптимизирована. То же самое касается кодировщика Lame MP3, а также Apple iTunes и Adobe Acrobat 9 – последний необходим для создания документов PDF. Поскольку компании Apple и Adobe довольно крупные и работают на рынке очень давно, то разочарование оказывается ещё более досадным.

    Но давайте вернёмся к нашему анализу масштабируемости. Выключение вычислительных ядер не снизит энергопотребление в режиме бездействия. AMD прекрасно поработала над оптимизацией энергопотребления 45-нм процессора Thuban, поскольку система потребляла те же 81-83 Вт при использовании одного или шести ядер. Но результаты при пиковой нагрузке оказались более интересными – энергопотребление, добавляемое каждым новым ядром, оказывалась меньше при увеличении их количества. В итоге пиковое энергопотребление у четырёх, пяти и шести ядер оказалось очень близко. А производительность в многопоточных приложениях заметно увеличивалась.

    По этой причине процессор AMD Phenom II X6 не только даёт прекрасную производительность благодаря шести вычислительным ядрам, но и обеспечивает увеличение эффективности энергопотребления при переходе с одного ядра на большее количество ядер, вплоть до шести. Вполне очевидно, что включение максимально возможного числа ядер максимизирует производительность на ватт или эффективность. Другими словами, если вас интересует вопрос экономии энергии, то вывод будет следующим: энергопотребление в режиме бездействия не меняется, а при увеличении числа ядер эффективность энергопотребления и производительность растут, так что никакого смысла в принудительном отключении ядер нет.

    Похожие публикации