IZONE- http://www.izcity.com/- бесплатный софт, вэб-сервисы, ресурсы для раскрутки, свежие номера журнала "Internet Zone".

XPримент AMD

Алексей Солабуто

Все-таки интересная вещь - законы рынка! Как только одни люди придумывают новый способ освободить от лишней тяжести чужие карманы, так сразу же находятся другие люди, пытающиеся переплюнуть первых в этом искусстве. И все это называется здоровая конкуренция.

1Но для нас это даже и хорошо: из-за нее мы имеем возможность выбирать - при помощи каких компаний расстаться со своими деньгами.

Процессор Athlon XP выпущен AMD для создания здоровой конкуренции Pentium 4. Рождение его было загадочным. После удачного старта процессоров на ядре Thunderbird компания AMD планировала осчастливить потребителя и обогатить рынок новым товаром - серверной модификацией Athlon.

Им должен был стать процессор на базе ядра Mustang (прямой потомок Thunderbird), в котором предполагалось реализовать системную шину с частотой 266 МГц и поддержку процессором памяти DDR. Кэш второго уровня планировалось интегрировать в чип. Но что-то у них там не срослось.

И "мустангу" не суждено было увидеть свет. Вместо легендарной американской лошадки мы теперь имеем процессор Athlon XP (изначально именуемый Athlon 4) с загадочным именем ядра - Palomino, в котором AMD все обещала усугубить, углубить и чрезвычайно расширить в высоту. Что же он из себя представляет?
Что касается микроархитектуры, то наличествуют некоторые довольно серьезные переделки.

Следует отметить, что в процессоре Athlon XP Palomino в качестве базы для разработок использовалось все то же ядро Thunderbird. Например, AMD утверждает, что "опыты с инженерами в лабораториях Advanced Micro Devices" (бедные инженеры! - прим. ред.) привели к увеличению скоростного потенциала процессора.

Обещанная рабочая частота Palomino - 1,5 ГГц, ну, конечно, и выше. При этом напряжения питания снижено с 1,75 В у Athlon Thunderbird 1 ГГц до 1,4 В у Palomino. Возможность снижения напряжения появилась благодаря применению новых транзисторов и их расположения на камне, то есть благодаря новой компоновке кристалла.

В микроархитектуре нового ядра есть и новые примочки, составляющие "лицо фирмы". Давайте рассмотрим это лицо во всех деталях, ибо именно на этих деталях и зиждется довольно высокая производительность процессоров серии Athlon.

Блоки вычислений

Для начала: блок целочисленных операций, который и так всегда был быстрее, чем у Pentium, подвергся переработке. Теперь он состоит из трех конвейеров, а следовательно, позволяет выполнять сразу три целочисленных инструкции. У Coppermine в подобном блоке содержится только два конвейера.

Что касается операций с плавающей запятой, в новом процессоре они производятся в трех различных блоках - сложения, умножения и операций с данными. Как следствие, операции сложения и умножения чисел с плавающей запятой выполняются одновременно, в противовес микроархитектуре процессоров Intel, где подобные операции выполняются только последовательно.

Конвейер

Теперь о конвейере. Образно говоря, такой параметр, как "длина" конвейера микропроцессора измеряется в "стадиях". У Athlon конвейер целочисленной арифметики имеет 10 стадий, а конвейер операций с плавающей запятой - 15 стадий, что несколько меньше, чем у "пентиумов" (12-17 и 25 соответственно).

Чем больше длина конвейера, тем легче организовать высокую тактовую частоту процессора, поскольку упрощаются действия, выполняемые на каждой стадии. Очень сильно влияет на эффективность конвейера механизм предсказания переходов. Чтобы многочисленные конвейеры микропроцессора не простаивали понапрасну, их нужно постоянно наполнять - подавать следующую инструкцию до того, как выполнена предыдущая (что ликвидирует "пустые места" на конвейерах).

Для того чтобы решить эту довольно сложную задачу, процессор использует "таблицу предсказания переходов", куда он заносит результаты своих вычислений по предсказанию ветвлений программы. Если ветвление предсказано правильно, то конвейер выполняет операции без потери производительности.

В случае ошибки предсказания оказывается, что конвейер большую часть своей работы выполнял напрасно. Весь процесс необходимо начинать сначала. Это приводит к значительным потерям времени, и чем длиннее конвейер, тем больше тактов теряется впустую.

Кэши

Кэшей, как обычно, два. И работают они, как раньше. И объемом они, как раньше. Опять же как раньше, кэш инструкций первого уровня - двухканальный, размером 64 кб. И такой же кэш данных. И точно такой же, как и раньше, - 16-канальный, эксклюзивный - кэш L2 размером 256 кб. (Эксклюзивный значит, что адреса, побывавшие в кэше первого уровня, не могут всплыть на втором уровне.) Никакого движения. А жаль.

Зато изменения коснулись логики работы кэша - в Athlon XP встроен модернизированный аппарат предсказания будущего! То есть упреждающей выборки данных. Используя магический кристалл, процессор "смотрит в будущее" и узнает, какие данные ему могут понадобиться для следующей инструкции.

Эти данные немедленно извлекаются из основной памяти для помещения в кэш. Конечно, это несколько нагружает процессор и вдобавок снижает пропускную способность памяти, поэтому "атлону" сподручнее использовать память DDR. В предыдущих моделях процессоров AMD (и не только) упреждающая выборка данных уже существовала, так что в Athlon XP мы имеем последнее поколение этого блока.

Хорошо, что разработчики добавили в основной набор инструкции для программной инициализации упреждающей выборки данных. Понятно, что упомянутые инструкции имеют приоритет по сравнению с автоматическими действиями процессора.

Также увеличилось количество строк в TLB (Translation Lookside Buffer - буфер быстрого перевода адреса) для кэша второго уровня. TLB является посредником между процессором и памятью. В силу конструктивных особенностей процессор не использует физических адресов в памяти для доступа к данным, а имеет свои виртуальные адреса. Между виртуальными и физическими адресами существует взаимно однозначное соответствие.

Причина таких адресных наворотов кроется в стремлении к экономии времени - при работе камня с физическими адресами запрос на данные пойдет окольными путями, лишние сигналы потекут по нескольким шинам. Для того чтобы этот процесс прошел быстрее, и делают кэши. А для того, чтобы процессор и "все остальное" понимали друг друга, нужен переводчик - виртуальный адрес нужно преобразовать к физическому.

TLB хранит результат этой операции. Понятно, чем больше объем TLB, тем больше вероятность доступа к данным за 1 такт. Если же в TLB нужного адреса нет, то процессор его должен вычислить, на что уйдет целых 3 такта. Комментарии

3DNow!, SSE и проч.

Теперь поговорим о SIMD-инструкциях (Single Instruction Multiple Data, что дословно переводится как "Одна инструкция - много данных"). SIMD - это тип инструкции, позволяющий применять ее (инструкцию) к нескольким большим наборам данных. Основоположником в этой области является Intel с ее Streaming SIMD Extensions (SSE).

Однако AMD решила не отставать, и с самого первого процессора серии в Athlon были реализованы наборы инструкций этого рода. В первый Athlon было добавлено 19 новых инструкций - это была технология Enhanced 3DNow!. Смело можно сказать, что это аналог SSE (действительно смело сказано - прим. ред.), правда, не совместимый на уровне команд.

Для работы с трехмерными объектами (и не только) используются действия с матрицами (таблицами чисел) - их перемножением, сложением и т. д. В лучших высших учебных заведениях нашей необъятной Родины учат, что такие математические операции выполняются со скрипом и подвисанием даже старыми, повидавшими виды профессорами.

До изобретения SSE (сперва MMX) программисты должны были заставлять камень делать такие действия поэлементно, что, разумеется, сказывалось на скорости выполнения программ и на состоянии психического здоровья самих программистов. Очевидно, жалея бедных программистов, разработчики процессора не без основания подумали, что SSE - вещь хорошая, и, поиграв воображением, добавили в Athlon XP еще и 3DNow! Professional (52 новые инструкции), поддерживающий SSE на уровне команд.

Понятно, что такой шаг мотивирован желанием добиться лучшей работы процессора при выполнении программ, написанных под интеловский набор SSE. Тем более что количество таких приложений неуклонно растет, а фирмы - производители языков высокого уровня, например Borland, уже давно пишут компиляторы для вышеупомянутого типа программ.

Энергетика

В новом "атлоне"-чемпионе 37,5 млн. транзисторов, причем "оптимизированных" по площади (всего 128 мм2). Каким образом они это оптимизировали, мы без "пол-литры" точно не разберемся, поэтому и пытаться вникать не будем. Для нас важно то, что эти самые оптимизированные транзисторы позволяют уменьшить электрическую мощность процессора примерно на 20 процентов, а следовательно, и уменьшить рассеиваемое кристаллом тепло.

В плане питания и энергообеспечения добавлено кое-что еще. В Athlon XP разработчики реализовали технологию AMD PowerNow!. Не то чтобы это было в новинку или в диковинку (К6-2 уже обладал PowerNow!), но в Athlon XP она будет крайне полезна.

Это замечательное нововведение позволяет - если так можно сказать - эксплуатировать процессор в щадящем режиме. В самом деле, ну зачем гигагерцовому процессору при 1,4 В питания корпеть над не заслуживающем такой частоты и производительности приложением? Технология PowerNow! позволяет процессору динамически изменять тактовую частоту и напряжение питания.

Самые низкие частота и напряжение, на которых сможет работать процессор, составляют 500 МГц и 1,2 В. Всего в наборе выставляемых таким образом частот - 32 позиции. Все это позволит работать большее время в низкопроизводительном режиме, что несколько увеличит ресурс процессора, а также позволит экономить заряд батареи при работе на мобильных компьютерах.

Разумеется, чтобы все было на деле, а не на словах, технология PowerNow! должна поддерживаться BIOS и чипсетом. При пониженном напряжении работы снижается также и количество тепла, выделяемого процессором. Кстати говоря, для контроля собственной температуры у Athlon есть термодиод, причем он не просто фиксирует градусы, а еще и имеет обратную связь с самим процессором, так что камень может отключиться при критическом значении температуры.

Такое устройство поможет нерадивому пользователю не лишиться самой важной части своего компьютера при неправильной организации охлаждения. Разумеется, и эта функция будет работать лишь в случае поддержки материнской платой и, естественно, BIOS.

Вот и все, что нужно было сказать о процессоре Athlon XP . Теория ясна? Испытания на практике - в следующем номере.

Источник: http://www.computery.ru/upgrade/

 


Copyright © "Internet Zone", http://www.izcity.com/, info@izcity.com