|
|||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||
Сказ о том,
как согбенный старик
|
|||||||||||||||||||||||||||||||||||||||||||||||||||
Забелин / Невысокий Случилась тут междоусобица в пенатах Intel. Решили выяснить отношения старый, хотя и не такой уж и согбенный, боец по имени Pentium III и молодой, полный сил, Pentium 4. У кого силушки больше? Но перед тем как перейти к решительным действиям, противники спонтанно начали обкладывать друг друга трехэтажным и демонстрировать на словах свои возможности. Молодой боец играет мышцами, демонстрируя принципиально новую архитектуру NetBurst, что дает ему основания обещать нам: сейчас он "сделает" противника одним ударом. Что ж, посмотрим, как это у него получится. Ну вот, началось. Pentium 4 заявляет, что число фаз его конвейера в 2 раза больше, чем у Pentium III, их 20, и это называется гиперконвейером, и это неоспоримое преимущество во множестве ситуаций на ринге. Pentium III парирует тем, что ситуаций, когда его короткий десятиступенчатый конвейер позволит ему выиграть, ничуть не меньше. Pentium 4 соглашается, что такие ситуации есть, но его кэши - нечто новое и мощное. Кэш-память команд более не является обычным буфером для команд процессора. Теперь она больше похожа на внутреннюю очередь микроинструкций, в которой может их стоять до 12 000. Называется такая технология Execution Trace Cache. Да и протокол кэш-памяти второго уровня стал иным. Теперь Pentium 4 демонстрирует свою новую системную шину. Она явно работает быстрее, чем у Pentium III: частота составляет 400 МГц против 133 МГц у старого бойца. Это обеспечивает существенный перевес при обращении к памяти, да и вообще системе в целом. Кроме того, Pentium 4 показывает, какие у него большие пакеты на шине. Ведь смысла пересылать маленькие блоки данных больше нет. Теперь по массивной шине с легкостью бегут большие пакеты: в то время как по шине Pentium III данные пересылаются блоками по 32 бита, Pentium 4 пересылает и принимает по 128 бит в одном пакете. Подумал Pentium III, почесал ядро и изрек: "Да вы, батенька, не забегайте вперед - давайте посмотрим, какие приложения сейчас чаще всего пользуются, - вот и увидим, у кого ядро ядристей". Ушли процессоры в свои комнаты,
посидели
С ужасом взглянул на результаты тестов Pentium 4. Даже опережение в две минуты в одном из тестов не смогло умерить его печали от проигрыша в 6 секунд в другом. А Pentium III уже расслабился и небрежно чистит ножки для следующего теста. И тут Pentium 4 заявляет свою технологию SSE2 - новые инструкции по работе с массивами целых чисел и управления кэшем: вычисления с массивами чисел с плавающей точкой и массивами целых чисел продолжают совершенствоваться, и Pentium 4 подобные свершения вычислительных технологий не только не обошли стороной, но и воплотились в нем в самой что ни на есть лучшей форме. P4 - один из самых лучших, а скорее всего, самый лучший процессор с этой точки зрения. В его архитектуру внесена даже возможность выполнения операций со 128-битными целыми числами. Но это уже не матричные операции. И число такое может быть только одно, а никак не массив. Самодовольно ухмыляясь, Pentium III небрежно говорит о том, что выигрыш если и будет, то только в оптимизированных приложениях, а на сегодняшний день "четвертый" пока "отдыхает". Лукаво улыбнувшись, "четвертый" достает пачку дисков и протягивает старичку Pentium III. Каждый удаляется в свою комнату для тестов. Через час Pentium III выходит и видит своего соперника, уже уставшего ждать. Одновременно они сдергивают покрывала с мониторов своих стендов (таблица 2). Мда… погорячился Pentium III… Ему нечем парировать, он чувствует, что даже с переходом на шину с частотой 200 МГц не сможет догнать соперника. А Pentium 4 снова начал хвалиться своим конвейером. Дескать, 20 ступеней позволяют ему без особых усилий работать на частоте 1,3, 1,4 и 1,5 ГГц, а в недалеком будущем накачать мышцы до 1,7 ГГц. Но Pentium III не прост. Он знает, что разница в 1,5 раза в тактовой частоте говорит не о полуторной разнице в производительности, а лишь о дополнительных процентах скорости работы, а при таком длинном конвейере еще и в зависимости от ситуации. "Вот в бизнес-приложениях, - утверждает он, - с моим конвейером работать удобнее. Кто знает, что сейчас сделает юзер? Тебе надо сбрасывать весь конвейер и загружать заново. А на 20 ступеней ты потратишь куда больше времени, чем я на 10". "Это правда, - соглашается четвертый. - Но где ты найдешь такого юзера, который будет печать в Word с такой скоростью?" Вот Pentium 4 выкрикнул, что его буфер адресов переходов хранит 4096 адресов, а не 512. Это веский аргумент. Число как-никак в 8 раз больше. Но все не так просто: от "третьего пня" мы узнаем, что он может точно предсказать 98% переходов, а "четвертый" всего лишь на некоторые доли процента больше. Однако "четвертый" не
успокаивается. На его тактовой частоте и
с его гиперконвейером даже эти доли
процента играют существенную роль. На
практике доказано, что технология
предсказания ветвлений Pentium 4 - лучшая в
мире. Благодаря Rapid Execution Engine он в состоянии сделать и такое. Суть этой новейшей технологии в том, что арифметико-логические устройства (АЛУ) процессора работают на частоте, в два раза превышающей частоту всех остальных блоков кристалла. Достигается это множителем.
Прием, в общем-то, старый - он был придуман еще во времена четверок, когда в 80486DX2 тактовая частота была удвоена по сравнению с частотой шины. Однако внутрь кристалла таких схем еще не встраивал никто. Но вот соперники снова вернулись к вопросам кэш-памяти, теперь уже они сыплют подробностями. Pentium III демонстрирует два своих кэша первого уровня для команд и данных по 16 кб каждый и дерзко смеется над тем, что у Pentium 4 всего 8 кб для данных, а для команд вообще какая-то очередь, которая к тому же еще и перезагружается при сбросе конвейера. Pentium 4 отвечает, что это ничего, зато кэш-память данных у него откликается быстрее. Причем намного.
А очередь помогает ему при исполнении большинства команд ликвидировать первые пять стадий конвейера, поскольку расположена после них. А пропускная способность кэш-памяти второго уровня - 45 Гб/с при тактовой частоте 1,4 ГГц, что в 2,8 раза больше, чем у старого противника. Да еще и возрастает с ростом частоты. Работа с системной памятью у Pentium 4 тоже на высоте: от процессора к чипсету - 3,2 Гб, а от чипсета к памяти - два канала по 1,6 Гб, что в сумме составляет те же 3,2 Гб. При всех нареканиях на RDRAM лучшей альтернативы пока не нашлось, хотя в перспективе наш молодой боец предполагает за счет новых чипсетов научиться не менее эффективно использовать и DDR SDRAM. "А как известно, при работе с графикой - память одно из самых узких мест", - говорит он. "Ну что же, давай посмотрим", - отвечает Pentium III, и они снова удаляются в свои комнаты. По возвращении, шатаясь от безумной частоты смены кадров, они сталкиваются лбами и роняют результаты тестов (таблица 3).
"Даже те программы, которые изначально оптимизированы под тебя, я выполняю быстрее", - кричит Pentium 4 и начинает хвастаться, что у него целых 4 конвейера, а АЛУ могут выполнять две команды за такт. При этом у Pentium III всего 3 конвейера и 1 команда за такт. Однако Pentium III знает, что его собрат лукавит. Реально речь идет, по свидетельству самих производителей, всего лишь о некоторых простых операциях, выполняемых за полтакта. На первый взгляд может показаться, что в Pentium 4 была достигнута суперскалярность восьмого уровня, то есть за один такт могут заканчиваться операции по восьми микроинструкциям. Однако реальная суперскалярность - четвертого уровня, а за счет удвоенной тактовой частоты лишь некоторые операции могут исполняться за один такт АЛУ или полтакта процессора. Так что суперскалярность четвертого уровня Pentium 4 реально выступает против суперскалярности третьего уровня Pentium III. В общем, спорить они могут бесконечно, но, судя по тому, как себя зарекомендовали сегодняшние противники, уже можно сделать выводы. Pentium 4 готов себя проявить во множестве вычислений, ориентированных на поточную обработку информации. Например, сжатие архивов, кодирование и декодирование, сжатие и распаковка изображений и звуков, воспроизведение и запись видео, игровые вычисления, вычисления с оптимизированным под его команды кодом. Он может значительно вырваться вперед на коде, который хорошо предсказуем. Ахиллесова пята процессора - код, который предсказывать невозможно. Это, прежде всего, приложения, где от ввода-вывода зависят дальнейшие действия программы. Во-вторых, это циклы с малым количеством повторов. В этих случаях процессор, настроившись на то, что цикл пойдет дальше, неожиданно получает перезагрузку конвейера и кэша команд, что налагает дополнительные "штрафы", выражающиеся в тактах, потраченных на восстановление конвейера после отката (сброса). С Pentium III ситуация тоже очевидна.
Большинство программ уже
оптимизированы под старичка, и из-за
высокой цены Pentium 4 только производители
очень серьезного софта будут вкладывать
деньги в оптимизацию под архитектуру
Pentium 4. Если вы работаете с серьезными
графическими или мультимедийными
пакетами, то альтернативы Pentium 4 нет. Если
ваши секунды не стоят вам нервов и денег,
то не спешите: уже опробованные системы
на Pentium III еще долго послужат вам верой и
правдой. Источник: http://www.computery.ru/upgrade/
|
|||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||
Copyright © "Internet Zone", info@izcity.com | |||||||||||||||||||||||||||||||||||||||||||||||||||
Копирование и использование данных материалов разрешается только в случае указания на журнал "Internet Zone", как на источник получения информации. При этом во всех ссылках обязательно явное указание адреса вэб-сайта http://www.izcity.com/. При наличии у копируемого материала авторов и источника информации - их также нужно указывать, наряду со ссылкой на нас. |