|
Intel Pentium 4
3. Чипсет и системная шина Будучи выпущенным в 1995 году, процессор Intel
Pentium Pro стал первым CPU с архитектурой P6. С тех пор прошло уже достаточно
много времени, сменилосьнесколько поколений процессоров, однако, по сути
архитектура не менялась. Семейства Pentium II, Pentium III и Celeron имеют все
то же строение ядра,отличаясь по сути только размером и организацией кеша
второго уровня и наличием набора команд SSE, появившегося в Pentium III.
Естественно, рано или поздноархитектура P6 должна была устареть. И дело тут
вовсе не в невозможности дальнейшего наращивания тактовых частот и даже не в
обострившейся в последнеевремя конкуренцией с AMD. Конечно, нельзя отрицать тот
факт, что достигнув частоты в 1 ГГц Intel столкнулся с проблемами в дальнейшем
наращивании частотысвоих процессоров: Pentium III 1.13 ГГц даже пришлось
отзывать в связи с его нестабильностью. Однако, эту проблему легко можно решить
переходом на 0.13 мкмпроцесс – тем более, что его повсеместное внедрение не за
горами. Настоящая причина необходимости новой архитектуры кроется глубже.
К сожалению, дальнейшее наращивание частотысуществующих процессоров приводит все
к меньшему росту их производительности. Проблема в том, что латентности, то есть
задержки, возникающие при обращении ктем или иным узлам процессора, по нынешним
меркам в P6 уже слишком велики. Именно это явилось основной причиной, по которой
Intel затеял разработкуPentium 4, которая выполнена с чистого листа. Таким
образом, анонсированный сегодня Pentium 4 - совершенно новый процессор, ничего
общего не имеющий сосвоими предшественниками. В его основе лежит архитектура,
названная Intel NetBurst architecture. Этим названием Intel хотел подчеркнуть,
что основнаяцель нового процессора – ускорить выполнение задач потоковой
обработки данных, напрямую связанных с бурно развивающимся Internet. Первым делом, попробуем разобраться с
особенностями новой архитектуры. Архитектура NetBurst имеет в своей
основенесколько инноваций, в комплексе и позволяющих добиться конечной цели –
гарантировать запас быстродействия и будущую наращиваемость для
процессоровсемейства Pentium 4. В число основных технологий входят: Hyper
Pipelined Technology. КонвейерPentium 4 имеет беспрецедентно большую глубину –
20 стадий. Advanced Dynamic Execution.
Улучшенноепредсказание переходов и исполнение команд с изменением порядка их
следования (out of order execution). Trace Cache.Для кэширования
декодированных инструкций в Pentium 4 используется специальный кэш. Rapid
Execute Engine. ALUпроцессора Pentium 4 работает на вдвое большей, чем сам
процессор, частоте. SSE2.Расширенный набор
инструкций для обработки потоковых данных. 400 MHz System Bus.
Новаясистемная шина. Названием Hyper Pipelined Technology конвейер
Pentium 4 обязан своей длине – 20 стадий. Для сравнения – длина конвейераPentium
III составляет 10 стадий. Чего же достиг Intel, так удлинив конвейер? Благодаря
декомпозиции выполнения каждой команды на более мелкие этапы, каждыйиз этих
этапов теперь может выполняться быстрее, что позволяет беспрепятственно
увеличивать частоту процессора. Так, если при используемом
сегоднятехнологическом процессе 0.18 мкм предельная частота для Pentium III
составляет 1 ГГц (ну или, по более оптимистичным оценкам, 1.13 ГГц), Pentium 4
сможетдостигнуть частоты 2 ГГц. Однако, у чрезмерно длинного конвейера
есть и свои недостатки. Первый недостаток очевиден – каждая команда теперь,
проходя большеечисло стадий, выполняется дольше. Поэтому, чтобы младшие модели
Pentium 4 превосходили по производительности старшие модели Pentium III, частоты
Pentium4 начинаются с 1.4 ГГц. Если бы Intel выпустил бы Pentium 4 1 ГГц, то
этот процессор несомненно бы проиграл в производительности гигагерцовому
PentiumIII. Второй недостаток длинного
конвейера вскрывается при ошибках в предсказании переходов.Как и любой
современный процессор, Pentium 4 может выполнять инструкции не только
последовательно, но и параллельно, соответственно не всегда в томпорядке, как
они следуют в программе и не всегда доподлинно зная направления условных
переходов. Для того, чтобы выбирать в таких случаях ветви программыдля
дальнейшего выполнения, процессор прогнозирует результаты выполнения условных
переходов на основании накопленной статистики. Однако, иногда блокпредсказания
переходов все же ошибается, и в этом случае приходится полностью очищать
конвейер, сводя на нет всю предварительно проделанную процессоромработу по
выполнению не той ветви в программе. Естественно, при более длинном конвейере,
его очистка обходится дороже в том смысле, что на новое заполнениеконвейера
уходит больше процессорных тактов, а следовательно и времени. Целью ряда ухищрений в архитектуре Pentium 4,
под общим названием Advanced Dynamic Execution, как раз и является
минимизацияпростоя процессора при неправильном предсказании переходов и
увеличение вероятности правильных предсказаний. Для этого Intel улучшил блок
выборкиинструкций для внеочередного выполнения и повысил правильность
предсказания переходов. Правда, для этого алгоритмы предсказания переходов были
доработаныминимально, основным же средством для достижения цели было выбрано
увеличение размеров буферов, с которыми работают соответствующие блоки
процессора. Так, для выборки следующей
инструкции для исполнения используется теперь окно величинойв 126 команд против
42 команд у процессора Pentium III. Буфер же, в котором сохраняются адреса
выполненных переходов и на основании которого процессорпредсказывает будущие
переходы, теперь увеличен до 4 Кбайт, в то время как у Pentium III его размер
составлял всего 512 байт. Результатом этого, а также
благодаря небольшой доработке алгоритма, вероятность правильногопредсказания
переходов была улучшена по сравнению с Pentium III на 33%. Это – очень хороший
показатель, поскольку теперь Pentium 4 предсказывает переходыправильно в 90-95%
случаев. Вместо обычного L1 кеша, который в Pentium
III был разделен на область инструкций и область данных в Pentium 4 применен
новыйподход. Инструкции в L1 кэше не сохраняются, он предназначен теперь только
для данных. Для кэширования инструкций теперь используется Trace Cache, однако
посравнению с обычным L1-кешем он имеет много преимуществ, направленных опять же
на минимизацию простоев процессора при выполнении неправильных
предсказанийпереходов. Первое, и основное – в
Trace Cache сохраняются уже декодированные инструкции. Это значит,что в нем
хранятся не классические x86 инструкции, а так называемые микрокоманды, более
простые операции которыми непосредственно оперирует процессорноеядро. Сохранение
в Trace Cache микроопераций позволяет избежать повторного декодирования x86
инструкций при повторном выполнении того же участка программыили при
неправильном предсказании переходов. Второе преимущество Trace Cache
заключается в том, что микрооперации в нем сохраняются именно в том порядке, в
каком онивыполняются. Правда, правильный порядок определяется опять же на
основании предсказания переходов, однако вероятность того, что переходы
предсказываютсянеправильно, достаточно мала для того, чтобы отказаться от
очевидного выигрыша, получаемого путем отказа от повторных декодирований и
предсказаний переходов. Intel не раскрывает размеров своего Trace Cache в
килобайтах, однако, известно что в нем может быть сохранено до 12000
микроопераций. Наиболее простая часть
современного процессора – это ALU (арифметико-логическое устройство). Благодаря
этому факту, Intel счелвозможным увеличить его тактовую частоту внутри Pentium 4
вдвое по отношению к самому процессору. Таким образом, например, в 1.4 ГГц
Pentium 4 ALU работает начастоте 2.8 ГГц. В ALU исполняются простые
целочисленные инструкции, поэтому, производительность нового процессора при
операциях с целыми числамидолжна быть очень высокой. Однако, на
производительности Pentium 4 при операциях с вещественными числами, MMX или SSE
двукратное ускорение ALU никакне сказывается. Таким образом, латентность
ALU существенно снижается. В частности, на выполнениеодной инструкции типа add
Pentium 4 1.4 ГГц тратил всего 0.35нс, в то время как выполнение этой команды у
Pentium III 1 ГГц занимает 1 нс. Реализовав в своем
процессоре Athlon новый конвейерный FPU, AMD очень сильно обогнала интеловский
Pentium III впроизводительности при операциях с вещественными числами. Однако,
Intel в своем Pentium 4 не стал сосредотачиваться на совершенствовании своего
FPU, а простоувеличил возможности блока SSE. В результате, в Pentium 4 имеет
место расширенный набор команд SSE2, в котором к имеющемуся набору из 70
инструкцийбыло добавлено еще 144. Такое решение – результат NetBurst идеологии,
основной целью которой является увеличение скорости работы с потоками
данных. Инструкции SSE позволяли
оперировать с восемью 128-битными регистрами XMM0..XMM7, вкоторых хранились по
четыре вещественных числа одинарной точности. При этом все SSE операции
проводились одновременно над четверками чисел, в результате чегоспециально
оптимизированные программы, в которых производилось большое количество
однотипных вычислений (а к ним, помимо обработки потоков данных вкакой-то мере
относятся и 3D-игры), получали существенный прирост в
производительности. SSE2 же оперирует с теми же самыми регистрами и
обратно совместим с SSE процессора Pentium III. А столь впечатляющее
расширениенабора команд вызвано тем, что теперь операции со 128-битными
регистрами могут выполняться не только как с четверками вещественных чисел
двойной точности, нои как с парами вещественных чисел двойной точности, с
шестнадцатью однобайтовыми целыми, с восемью короткими двухбайтовыми целыми, с
четырьмячетырехбайтовыми целыми, с двумя восьмибайтовыми целыми или с 16
байтовыми целыми. То есть, теперь SSE2 представляя собой симбиоз MMX и SSE и
позволяетработать с любыми типами данных, влезающими в 128-битные
регистры. Таким образом, SSE2
гораздо более гибок, позволяя добиваться впечатляющего прироста в
производительности. Однако, использованиенового набора команд требует
специальной оптимизации программ, поэтому ждать его внедрения сразу после выхода
нового процессора не стоит. Со временем же,SSE2 имеет достаточно большие
перспективы. Поэтому, даже AMD собирается реализовать SSE2 в своем новом
семействе процессоров Hammer. Старые же программы, не использующие SSE2, а
полагающиеся на обычный арифметический сопроцессор, никакого прироста в
производительности прииспользовании Pentium 4 не получат. Более того, несмотря
на то, что что Intel говорит о том, что блок FPU в Pentium 4 был слегка
усовершенствован, время,необходимое на выполнение обычных операций с
вещественными числами возросло по сравнению с Pentium III в среднем на 2
такта. Что касается кеша первого уровня в Pentium 4,
то поскольку теперь команды хранятся в Trace Cache, он предназначен только
дляхранения данных. Однако, его размер в Pentium 4, основанном на ядре
Willamette составляет всего 8 Кбайт. Это выглядит достаточно небольшой цифрой
даже на фоне16-килобайтной области данных в L1 кэше Pentium III. Однако, Intel
был вынужден сократить объем кеша первого уровня в Pentium 4, так как ядро этого
процессораи без того получалось слишком большим. Тем не менее, архитектура этого
процессора может поддерживать L1-кеш и большего размера, поэтому, скорее
всего,при переходе на технологический процесс 0.13 мкм и новое ядро Northwood,
этот кэш будет увеличен. Однако, для увеличения производительности, Intel
применил для доступа к L1-кешу новый алгоритм, чем уменьшил в Pentium
4латентность этого кеша до двух процессорных тактов вместо трех тактов в Pentium
III. Таким образом, учитывая большую тактовую частоту Pentium 4, время
реакцииего L1 кеша составляет всего 1.4нс для 1.4 ГГц модели против 3нс у L1
кеша Pentium III 1 ГГц. Также как и в
Pentium III, L1 кэш Pentium 4 является write through и ассоциативным с
4областями ассоциативности. При этом длина одной строки L1 кеша равна 64
байтам. Процессор Pentium 4
обладает Advanced Transfer Cache второго уровня объемом 256 Кбайт. Также, как и
в Pentium III, L2-кеш имеет широкую 256-битную шину,благодаря которой процессоры
от Intel имеют более высокую пропускную способность кеша, чем их конкуренты от
AMD, использующие 64-битную шину кеша.Однако, в отличие от Athlon, в Pentium 4
(впрочем, также как и в Pentium III) L2 кэш не является эксклюзивным, то есть он
дублирует данные, находящиеся в L1кэше. Так как Pentium 4 рассчитан на
обработку потоковых данных, скорость работы L2-кеша для него является одним из
ключевых моментов.Поэтому, Intel увеличил пропускную способность кеша второго
уровня в Pentium 4 в два раза. Это усовершенствование было сделано благодаря
передаче данных изL2-кеша на каждый процессорный такт, в то время, как данные из
L2-кеша Pentium III передаются только на каждый второй такт. Таким образом,
пропускнаяспособность L2-кеша Pentium 4, работающего, например, с частотой 1.4
ГГц имеет теперь внушительную величину 44.8 Гбайт/с. Для сравнения –
пропускнаяспособность Advanced Transfer Cache у Pentium III 1 ГГц составляет 16
Гбайт/с. Также как и в
Pentium III, L2 кэш имеет восемь областей ассоциативности и строки длиной
128байт. Однако, в отличие от Pentium III, каждая строка может быть изъята не
целиком, а по 64-байтовым половинкам. Говоря о системе
кэширования в Pentium 4, нельзя обойти стороной и тот факт, чтоархитектура
NetBurst поддерживает и кэш третьего уровня размером до 4 Мбайт. Однако, в
Pentium 4 пока эта возможность использоваться не будет. Оназарезервирована для
будущего применения в серверных процессорах. Итак,
после краткого знакомства с основными деталями NetBurst архитектуры, основного
оружия Pentium 4 взглянем на егоформальную спецификацию: Чип,производимый
по технологии 0.18 мкм с использованием алюминиевых соединений. Переход на
медные соединения Intel планирует произвести одновременно свнедрением технологии
0.13 мкм. ЯдроWillamette, основанное
на архитектуре NetBurst. Содержит 42 млн. транзисторов и имеет площадь 217
кв.мм. Это более чем в два раза больше, чем площадь ядраAthlon или Pentium
III. Работает вспециальных
материнских платах с 423-контактным процессорным разъемом Socket 423. Используетвысокопроизводительную 400 МГц Quad Pumped системную шину Кеш
данныхпервого уровня 8 Кбайт. Trace Cache для декодированных инструкций
рассчитан на 12000 микроопераций ИнтегрированныйAdvanced
Transfer Cache второго уровня размером 256 Кбайт. Работает на полной частоте
ядра и имеет 256-битную шину Выпускаютсяверсии с
частотами 1.4 и 1.5 ГГц. Позднее ожидается версия с частотой 1.3 ГГц. Процессор
Intel Pentium 4 будет выпускаться в FC-PGA упаковке, однако само ядро
будетзакрыто heat spreader – специальной металлической крышкой, защищающей его
от повреждения. Устанавливаться Pentium 4 будет в гнездо Socket 423, имеющее
423контакта и отличающееся по размеру от обычных Socket 370 и Socket
A. Из-за большого ядра, тепловыделение новых кристаллов будет достаточно
высоким. В частности, Pentium 4 1.4 ГГц, работающийна напряжении 1.7 В и
потребляющий примерно 32 A, будет рассеивать порядка 52 Вт тепла (1.5 ГГц
Pentium 4 рассеивает 55 Вт тепла). Поэтому, кулеры дляPentium 4 должны иметь
достаточно большие размеры и площадь поверхности. Стоимость процессора при
поставках партиями 1000 шт. составляет, соответственно, $819 и $644 для моделей
с тактовымичастотами 1.5 ГГц и 1.4 ГГц. Pentium 4 1.3 ГГц, который появится 29
января 2001 года, будет стоить $409. Intel планирует достаточно агрессивно
снижать цены наPentium 4, с тем, чтобы этот процессор мог применяться в
настольных компьютерах среднего уровня: 10
декабря 819 Pentium 4 1.3 Гц 3. Чипсет и системная шина Поскольку Pentium
4 имеет совершенно новую архитектуру, то ему потребовался и новый чипсет. Так
как Intel нацеливает свойновый процессор на приложения, работающий с потоками
данных, то основной задачей такого чипсета должно являться обеспечение высоких
пропускныхспособностей основных шин: шины памяти и системной шины, соединяющей
процессор с северным мостом чипсета. В первую очередь необходимо
сказать о том, что Pentium 4 использует совершенно новуюQuad Pumped процессорную
шину, работающую с частотой 400 МГц. Пропускная способность такой шины в три
раза больше, чем пропускная способность шиныпроцессора Pentium III, и составляет
3.2 Гбайт/с. Благодаря такой высокой пропускной способности, минимизируются
простои быстрого процессора Pentium 4 вожидании следующей порции данных.
Физически, реализуется новая системная шина путем умножения в контроллерах
процессорной шины чипсета и процессора тактовойчастоты, которая для Pentium 4
составляет 100 МГц, на 4. То есть, на частоте 400 МГц работает только участок
между процессором и чипсетом. Наряду с такой
высокопроизводительной шиной, чтобы система была сбалансирована,подсистема
памяти для Pentium 4 должна обеспечивать не меньшую, чем 3.2 Гбайт/с, пропускную
способность. Поэтому, при создании набора системной логикидля нового процессора
Intel принял решение адаптировать чипсет i840, который поддерживает два канала
Direct RDRAM. Как известно, пропускная способностьPC800 RDRAM составляет 1.6
Гбайт/с, то есть, при использовании двух каналов Rambus, пропускная способность
памяти оказывается как раз на уровне 3.2Гбайт/с. О недостатках RDRAM сказано
уже достаточно много, главный из них – это высокаяцена этой памяти, однако с
технологической точки зрения двухканальная RDRAM смотрится в системах с Pentium
4 вполне оправдано. К сожалению, DDR SDRAM сблизкой пропускной способностью
будет выпущена только к концу следующего года. Однако, RDRAM хороша только в
задачах потоковой обработки данных. В случае жерешения задач, требующих
непоследовательный доступ к данным, латентность RDRAM оказывается слишком
высокой и вполне может быть оправдано применение не толькоDDR SDRAM, но и даже
обычной SDRAM памяти. Однако, чипсетов с поддержкой SDRAM пока нет, и в лучшем
случае они появятся только к середине следующего года. В качестве южного
моста в этом наборе логики используется уже знакомая нам по чипсету i815E
микросхема ICH2, а в качествесеверного моста – новый MCH Intel 82850, в числе
ключевых особенностей которого следует отметить поддержку двух каналов Rambus,
каждый из которых можетфункционировать с парой модулей RIMM, поддержку 400-
мегагерцовой системной шины и AGP 4x. Ввиду дороговизны самого чипсета i850, который стоит $75, а также
ввиду того, чтоплаты под Pentium 4 должны иметь шестислойную PCB, производить их
достаточно сложно и дорого. Поэтому, только ограниченное число производителей
системныхплат высказало желание ввязаться в производство плат под Socket 423. В
ближайшее время платы под Pentium 4 будут выпускаться только
восемьюпроизводителями. Спецификации некоторых таких плат уже
известны: Форм-фактор
i850
Gigabyte GA-8TX AGP Pro
ATX Как можно видеть
из таблицы, все платы под Pentium 4 похожи друг на друга: все имеют по четыре
слота для RIMM и по пятьслотов PCI. Большинство плат будет оборудоваться слотом
AGP Pro, позволяющим использовать профессиональные графические карты с
повышеннымэнергопотреблением. Помимо новых
системных плат и новых кулеров, как это парадоксально не звучит, новый процессор
будет требовать и новыйкорпус, совместимый со спецификацией ATX 2.03. И вызвано
это двумя причинами. Во-первых, ввиду
того что кулеры для Pentium 4 имеют большие радиаторы, масса которыхможет
достигать 450 г, крепить к процессорному сокету их больше нельзя. Теперь для
удерживания кулера будет использоваться специальный ретеншн-механизм,крепящийся
при помощи четырех болтов непосредственно к корпусу. Соответственно, корпус
должен иметь дополнительные крепежные отверстия. Дополнительный плюс, который дает использование
ретеншн-механизма для кулера, это уменьшение электромагнитноговлияния
процессора, работающего на сверхвысоких частотах, на другие компоненты системной
платы. Вторым новым требованием
спецификации ATX 2.03 является наличие у блока питаниядополнительного
четырехжильного кабеля питания, подключаемого к системной плате,
с Дополнительное питание необходимо для процессора Pentium 4,
отличающегося чрезмерно большим энергопотреблением. Pentium III Intel Pentium 4 1.4 Гц ASUS CUSL2 (i815) 256 Мбайт
PC800 RDRAM Жесткий
диск Производительность Pentium 4 сравнивалась с самыми быстрыми на
сегодня процессорами других семейств: Intel Pentium III 1ГГц и AMD Athlon 1.2
ГГц. Тестирование проводилось под управлением операционной системы
Microsoft Windows2000 SP1 сустановленным DirectX 8. анализ
производительности этого процессора будет состоять из двух частей. В первой
дляизмерения быстродействия мы воспользуемся синтетическими тестами, а во второй
протестируем процессоры, принимающие участие в тестировании,
реальнымиприложениями. Этот тест
показывает производительность целочисленной части процессора и скорость работы с
данными.Казалось бы, поскольку ALU Pentium 4 работает на удвоенной частоте
процессора, то по результатам этого теста впереди должен быть Pentium 4. Однако
этого непроисходит. Разгадка медлительности Pentium 4 в данном тесте кроется в
недостаточно большом L1 кэше, в который не помещаются все необходимые для
егоработы данные. Athlon же, с областью данных в L1-кеше размером 64 Кбайта, а
это в 8 раз больше, чем кеш данных Pentium 4, значительно превосходит всех
своихсоперников. Этот бенчмарк
показывает чистую скорость работы арифметического сопроцессора
благодаря томучто все данные, необходимые для его работы умещаются в L1 кэше
процессора. Результаты еще раз подтверждают, что блок FPU у Athlon очень
хороший. Крометого, ясно видно, что из-за возросшей латентности FPU в Pentium 4,
его показатели в этом тесте выглядят даже хуже, чем у Pentium
III. Этот
бенчмарк, входящий в состав 3DMark2000 демонстрирует теоретическую скорость
работы процессора пообработке типовых игровых 3D-сцен при активном использовании
наборов SIMD-команд SSE и 3DNow!. К сожалению, тестов, позволяющих оценить
выигрыш, получаемый отиспользования новых SSE2 инструкций Pentium 4 пока нет,
поэтому сегодня мы довольствуемся только использованием базового набора
инструкций SSE. Тем неменее, даже в этом случае Pentium 4 оказывается на высоте,
обходя ближайшего конкурента, процессор AMD Athlon 1.2 ГГц на 12%. Таким
образом, логичноожидать, что в играх, особенно поддерживающих SSE, Pentium 4
будет показывать достойные результаты. Так как процессор Pentium 4
работает на совершенно отличной платформе, использующей двухканальную
RDRAM,посмотрим на то, какую скорость операций с памятью может обеспечить эта
система в сравнении с соответствующими результатами, полученными на остальной
пареплатформ: По графикам
совершенно очевидно, что действительно скорость работы L1 и L2 кэшей в Pentium 4
по сравнению с Pentium III возросла.Однако, AMD Athlon обладает гораздо большим
по размеру L1 кэшем, что в ряде случаев обуславливает его превосходство.
Естественно, также на графике ясновидно, что пропускная способность
двухканальной RDRAM гораздо выше, чем используемой в системах на Athlon и
Pentium III PC133 SDRAM. Также, результаты этого тестапозволяют оценить, что L2
кеш процессора Athlon действительно работает медленнее чем L2 кеш даже Pentium
III, из-за более узкой шины. И достаточнолюбопытным является тот факт, что
влияние L1-кеша совершенно не сказывается в системе с Pentium 4 при записи в
память. Этот тест основывается на измерении скорости системы в нескольких
приложениях для создания контента.Как можно видеть, производительность системы с
Pentium 4 тут однозначно выше, чем скорость системы на Pentium III 1 ГГц и
приближается к производительностисистемы с Athlon 1.2 ГГц. Получается, AMD была
права не став выпускать процессоры с более высокой, чем 1.2 ГГц частотой. Athlon
1.2 ГГц можетконкурировать с Pentium 4 вполне успешно. Еще один тест,
использующий для измерения производительности офисные приложения. Однако,
тутупор делается на приложения более широкого профиля, чем в предыдущем тесте, в
результате чего показатели Athlon здесь выше. Однако, архитектуры Pentium
III,Athlon и Pentium 4 отличаются слишком сильно, поэтому, соотношения
производительностей этих процессоров может изменяться от приложения кприложению.
Поэтому, посмотрим на скорости испытуемых процессоров в конкретных
приложениях. Нетрудно заметить,
что тут однозначного лидера выделить тяжело. Однако, в семи из
двенадцатиприложений лидирует AMD Athlon 1.2 ГГц, в то время как Pentium 4
показывает большую скорость только в трех задачах: системе распознавания речи
DragonNaturally Speaking Preferred 4.0, графическом редакторе Adobe Photoshop
5.5 и в утилите для кодирования видеопотока Microsoft Windows Media Encoder 4.0.
Такимобразом, вся полезность Pentium 4 раскрывается действительно только в
задачах потоковой обработки данных. И то, часть заслуги за высокую
производительностьэтого процессора лежит на подсистеме памяти с гораздо более
высокой пропускной способностью, чем у конкурирующих
платформ. Для
оценки производительностей систем в этом 3D-пакете, мы засекли время рендеринга
сценыAnisotropic Wheel, входящей в дистрибутив. Соответственно, меньшее время
соответствует лучшему результату. Удивительно, но тут производительность Pentium
4 1.4 ГГц вточности повторяет производительность Pentium III 1 ГГц. Это говорит
о том, что FPU в Pentium 4 действительно работает медленнее, чем в Pentium III.
Athlon 1.2ГГц, обладая лучшим блоком FPU легко обошел обоих конкурентов,
построив сцену на 40% быстрее. Тестирование в
архиваторах позволяет увидеть целочисленную производительность процессоров
приоперировании с небольшими объемами данных. В архиваторе WinZip лучшую
скорость (на диаграмме меньшее значение соответствует лучшему
результату)продемонстрировал Athlon 1.2 ГГц. По всей видимости, сказывается
большой кеш первого уровня у этого процессора. Как можно увидеть из
диаграммы (на ней меньшее значение снова соответствует лучшему
результату),Pentium 4 1.4 ГГц с ALU, работающим на частоте 2.8 ГГц здесь равных
нет. Влияние объемного кеша первого уровня Athlon в WinRAR сводится на
нетдостаточно большим объемом словаря, используемого в этом архиваторе. Перейдем
теперь к результатам, которые показали испытуемые системы в
игровыхприложениях. В Quake3 Pentium 4
1.4 ГГц показывает себя с лучшей стороны, показывая на 30% более
высокоебыстродействие, чем Athlon 1.2 ГГц, не говоря уже о Pentium III. Это
объясняется как тем, что ALU протестированного Pentium 4 работает на частоте2.8
ГГц, так и тем, что Quake3 использует SSE инструкции, которые, как мы показали
выше, исполняются на Pentium 4 очень быстро. С одной стороны,
число fps в высоких разрешениях в Quake3 зависит в основном от пропускной
способностишин, связывающих различные компоненты системы, однако с другой –
ограничивается скоростью заполнения используемой в системе видеокарты. Именно
поэтому, тутразброс результатов не так велик, как в предыдущем случае. Однако,
благодаря Quad Pumped bus Pentium 4 остается в лидерах. Однако, Athlon, с200-
мегагерцовой шиной EV6 дышит практически ему в затылок. Тут лидирующую
позицию удерживает Athlon, имеющий самый производительный среди всех участвующих
втесте процессоров блок FPU. Однако, при
возрастании нагрузки на шины передачи данных в системе, которое влечет за собой
увеличениеразрешения, вперед выходит Pentium 4. Что ж, с 400-мегагерцовой шиной
и памятью с пропускной способностью 3.2 Гбайт/с поспорить
тяжело. Expendable - игра, производящая во время своей работы интенсивные
операции с небольшими объемамиданных. Поэтому, система на Pentium 4 с RDRAM,
имеющей большую латентность оказывается медленнее обоих своих конкурентов.
Причем, отставание Pentium 4 1.4ГГц от Athlon 1.2 ГГц оказывается немаленьким –
более 30%. Результаты практически полностью повторяют предыдущий случай. К
сожалению, в настоящий момент мы не можем оценить потенциал новых Pentium 4 с
точки зренияразгона. Дело в том, что имевшаяся в нашем распоряжении системная
плата для Pentium 4 Intel D850GB не имела никаких функций для запуска процессора
начастоте, отличающейся от штатной. Однако, по мере появления системных плат от
сторонних производителей, мы протестируем Pentium 4 и на
разгон. Итак, сделать однозначный вывод относительно
процессора Pentium 4 нельзя. Безусловно, егоархитектура имеет массу достоинств,
основным из которых следует признать возможность легкого наращивания тактовых
частот. Однако, производительностьнового процессора в ряде приложений все же не
так высока как хотелось бы: достаточно часто она оказывается меньше
производительности старшего процессорасемейства Athlon. Виной этому –
сверхдлинный 20-стадийный конвейер и недостаточно большой кеш данных первого
уровня. Поэтому, в ближайшее времяPentium 4 обогнать по быстродействию
конкурента от AMD, Athlon, который также имеет пути для наращивания скорости
посредством перехода на новое ядро Palominoи использования DDR SDRAM, не
сможет. В то же время, у систем на Pentium 4 есть и более существенные
недостатки, главный из которых – цена. Поскольку стоимостьRDRAM, необходимой для
Pentium 4, а также системных плат для него достаточно высока, Athlon-платформы
обладают сегодня гораздо лучшим соотношениемцена-производительность. Тем
не менее, Pentium 4 все же имеетотдаленные перспективы. С переводом
технологического процесса на 0.13 мкм и с выпуском чипсетов, поддерживающих
более дешевые чем RDRAM типы памяти, Pentium4 может стать массовым процессором.
Пока же его удел – высокопроизводительные рабочие станции. 2. Журнал "Страна игр", №22 2000 г.
| |