|
*** |
GeForceFX: NVIDIA покоряет Голливуд?Оригинал: TomsHardwareGuide На осеннем Comdex Fall 2002 NVIDIA объявит наследника крайне успешной линейки графических чипов GeForce4 Ti, который в свою очередь предстанет перед публикой компьютерных магазинов в феврале. Этим шагом NVIDIA похожа на своего главного конкурента ATi, поскольку компания представляет новый чип GeForceFX с кодовым названием NV30 по частям. На Comdex NVIDIA откроет только лишь детали о технологиях и возможностях чипа, которые далеко превосходят спецификации DirectX 9. Однако компания не будет давать никакой конкретной информации о производительности или ассортименте версий будущих карт – не говоря уже о предоставлении тестовых образцов. Поэтому сегодня вряд ли можно ответить на вопрос, который многие задают последние месяцы. Сдаст ли ATi свои позиции по технологическому лидерству и производительности, которых компания достигла благодаря выпуску Radeon 9700 PRO? Мы все же постараемся ответить на этот вопрос в конце статьи, ну а пока давайте рассмотрим основные функции и возможности нового GeForceFX.
Аппаратное обеспечение
3D возможности
ЧипGeForceFX, ранее известный под кодовым именем NV30, является первым чипом NVIDIA, который использует технологии, полученные от 3dfx и Gigapixel. Сам чип имеет совершенно новый дизайн, у которого с GeForce4 Ti мало чего общего. Чип GeForceFX будет изготавливаться на фабриках TSMC по 0,13 мкм техпроцессу, то есть это первый потребительский 3D чип, освоивший новый техпроцесс. По сравнению с текущим 0,15 мкм техпроцессом, новый дизайн уменьшает площадь кристалла на 25% и увеличивает производительность транзисторов на 25%. В соответствии с данными NVIDIA, энергопотребление при этом падает на 36%. Однако наибольшее преимущество перехода на 0,13 мкм заключается в повышенных тактовых частотах. Этому немало помогает упаковка с шариковыми выводами flip-chip, в которой затвор транзистора может быть напрямую соединен с контактной ножкой. В старых дизайнах чип соединялся с контактами с помощью дорожек, что усиливало помехи. Благодаря новому масштабируемому дизайну, NVIDIA готова во всеоружии встретить свое будущее, даже при высоких затратах на производство. И хотя NV30 содержит на 25 млн. больше транзисторов, чем ATi R300, размер у кристалла будет примерно такой же, если не меньше. Как вы догадываетесь, чип со 125 миллионами транзисторов выделяет довольно много тепла. Для эффективного (и тихого) отвода тепла от чипа NVIDIA разработала собственное решение по охлаждению для GeForceFX, которое получило название Flow FX. Медный радиатор использует тепловые трубки – подобно ABIT OTES – и передает тепло от чипа за пределы корпуса. Такой подход кроме всего прочего позволяет понизить температуру внутри корпуса. Демонстрационная плата NVIDIA, которая была установлена на систему nForce2, выделяла большое количество тепла. Выдуваемый воздух был очень горяч. И хотя вся система была довольно тихой, мы отчетливо различали шум вентилятора Flow FX, что не очень радует. NVIDIA пообещала изменить дизайн для уменьшения шума. Память DDR-II и интерфейс памятиDDR память уже прочно утвердилась в качестве стандартной памяти практически для всех видеокарт, включая бюджетные. DDR означает удвоенную скорость передачи, что достигается благодаря передаче данных на обоих фронтах тактового импульса. В результате мы получаем удвоенное значение теоретической пропускной способности без дополнительного увеличения тактовой частоты. DDR память передает по 2 бита за один такт по одной линии, а DDR-II – уже 4 бита, таким образом еще увеличивая пропускную способность DDR памяти в два раза. DDR-II также обладает и другими преимуществами:
Чип GeForceFX с самого начала разрабатывался под интерфейс памяти DDR-II. Чип, скорее всего, будет поставляться с памятью на 500 МГц (1 ГГц DDR-II), подключенной по 128-битной шине памяти, что приводит к пиковой пропускной способности около 16 Гбайт/с. И хотя значение пропускной способности выросло по сравнению с GeForce4 Ti 10,4 Гбайт/с, оно все еще далеко от 19,6 Гбайт/с ATi Radeon 9700 PRO с 256-битным интерфейсом DDR памяти. Конечно, повышение пропускной способности нельзя не приветствовать. Однако современные графические карты показывают столь высокую производительность благодаря применению специальных технологий работы с памятью. Самым ярким примером служит Matrox Parhelia. Даже при теоретической пропускной способности в два раза выше GeForce4 Ti4600 (NV25), Parhelia и близко не может подойти к Ti4600 по производительности. Причина здесь заключается в высоко оптимизированном интерфейсе памяти (Lightspeed Memory Architecture). GeForceFX (NV30) будет использовать улучшенную версию этого интерфейса. Помимо компрессии Z-данных, чип будет производить цветовую компрессию 4:1 в реальном времени без потерь (подробнее об этом чуть позже, в секции Intellisample). NVIDIA обещает существенный прирост в производительности при включении сглаживания. Помимо этого в новом чипе используются кэши большего размера, которые также подверглись некоторым улучшениям. Не стоит забывать и о перекрестном контроллере памяти. Пиксельные конвейерыGeForceFX обладает восемью пиксельными конвейерами, в результате карта производит отображение до 8 пикселей за такт с одной текстурой. При использовании двух текстур (классическое мульти-текстурирование), GeForceFX обрабатывает до 4 пикселей за такт. И так далее. Что касается числа текстур на конвейер, то FX может накладывать до 16 текстур за один проход. Каждый пиксельный конвейер оснащен своим блоком пиксельных программ, чья производительность (число выполненных операций и инструкций за такт) сильно зависит от используемого кода.NVIDIA оптимизировала конвейеры под трилинейную и анизотропную фильтрацию. При работе на пиковой производительности, блок фильтрации способен определять семплы для фильтрации, что повышает производительность. NVIDIA также аппаратно реализовала метод адаптивной фильтрации наподобие ATi. Чип определяет уровень фильтрации сцены (анизотропный или трилинейный фильтр) без ухудшения визуального качества картинки на основе текстур и геометрии сцены. При некоторых значениях перспективы и определенных видах текстур, повышение уровней фильтрации не приводит к увеличению качества картинки, зато ощутимо сказывается на производительности. «Умный» адаптивный алгоритм позволит решить эту проблему. Адаптивную фильтрацию можно включать и выключать в меню драйвера, так что вы всегда можете перейти к «классическому» методу фильтрации. Отрадно, что NVIDIA оставила выбор за конечным пользователем. Скорость заполнения GeForceFX явно превосходит Radeon 9700 PRO. 8 пикселей на такт составляют теоретическую скорость заполнения 4000 Мпикселей/с (при частоте ядра 500 МГц). Это на приличные 54% выше Radeon (2600 Мпикселей/с). Блок вершинных программДо сегодняшнего дня производительность блоков вершинных программ выражалась через число доступных вершинных блоков (Geforce4 Ti: 2 / Radeon 9700 PRO: 4). В отличие от них, GeForceFX использует программируемый массив с плавающей запятой, который позволяет достичь скорость трансформации треугольников выше 350 Мвершин/с. Для сравнения, скорость трансформации треугольников GeForce4 Ti составляет около 136 Мвершин/с, а Radeon 9700 PRO – около 325 Мвершин/с.При нормализации по тактовой частоте мы получаем следующую картину:
И хотя общая производительность блока вершинных программ у GeForceFX выше, чем у Radeon, достигается это лишь благодаря большей тактовой частоте. Если бы частота Radeon была на 8% выше (350 МГц), он бы показывал равную GeForceFX производительность. Но поскольку все эти значения чисто теоретические, нам нужно дождаться тестирования на реальных приложениях. Показанные же выше значения основываются на «идеальной» геометрии, которая в жизни встречается редко. Высокие тактовые частоты GeForceFX могут значительно усилить производительность карты на реальных приложениях. IntellisampleТак NVIDIA назвала оптимизацию качества картинки GeForceFX. Название подразумевает технологии фильтрации, которые мы уже описывали выше при рассмотрении пиксельных конвейеров, равно как и улучшенное сглаживание.Цветовая компрессияКак мы уже упоминали, интерфейс памяти GeForceFX задействует цветовую компрессию без потерь, которая сжимает цветовые данные в реальном времени в отношении 4:1 без ущерба производительности. Таким образом, можно повысить эффективность использования пропускной способности памяти, что в свою очередь повысит общую производительность. Цветовая компрессия используется для пикселей с фиксированным значением цвета внутри полигона. Сэкономленная пропускная способность будет использоваться для рендеринга пикселей на краях полигона.СглаживаниеGeForceFX оснастили новыми режимами сглаживания. В добавление к 6XS, появился новый 8x режим, который использует в два раза больше пикселей для расчета изображения, чем режим 4x. Благодаря сжатию Z-данных и цветовой информации, сглаживание на GeForceFX работает быстрее предшественников. Как обещает NVIDIA, вы сможете включать даже 8x режим без существенного падения частоты кадров. Помимо этого NVIDIA стала использовать гамма-коррекцию. Сглаживающий фильтр очень гибок во многих отношениях. Четкость текстур может быть повышена через большее число семплов, улучшенную фильтрацию, равно как и через использование карт масштабирования (mipmap) с высоким разрешением. Поскольку каждый конвейер может просчитывать до 1024 текстурных операций за один проход, можно использовать сложные технологии фильтрации без существенного ухудшения производительности.Динамическая коррекция цветаНовая функция GeForceFX упрощает работу с уровнями гаммы при программируемых вычислениях. Разработчику не нужно больше постоянно держать в уме диапазоны яркостей.Без гамма-коррекции слева, с коррекцией справа Компоненты на платеGeForceFX использует два интегрированных 400 МГц 10 бит RAMDAC. Каждый из них может выводить сигнал на ЭЛТ монитор с максимальным разрешением 2048x1536@85 Гц. Чип также имеет встроенную функцию ТВ-выхода. И хотя поддержка 10-битного разрешения цвета на канал присутствовала уже с первого поколения карт GeForce, преимущество от ее наличия могут оценить лишь немногие пользователи, поскольку мониторы с отображением более 8-ми бит на цветовой канал очень редки.Новый чип был также отлажен под улучшенное качество картинки на аналоговых мониторах для того, чтобы сделать качество независимым от дизайна плат. Так что мы должны получить улучшенное и более четкое качество картинки по сравнению с GeForce4 Ti. Возможности DirectX 9, программируемость и CgКак считает NVIDIA, наибольшая сила GeForceFX кроется в блоках вершинных и пиксельных программ, которые ушли далеко за спецификации DirectX 9. Так что такое программа (шейдер)? Это обычная программа, которая просчитывает эффекты и накладывает текстуры на объект. Ничего принципиально нового в шейдерах нет. Процедуры в приложениях по рендерингу представляют собой большой набор программ-шейдеров, которые последовательно запускаются.В современных картах принято различать пиксельные программы, которые обрабатывают текстуры и пиксели, и вершинные программы, которые работают с векторными объектами. К примеру, эффект хромированной стали T1000 в Terminator 2 достигается подключением соответствующей программы, которая вычисляет отражения и освещение. Другими примерами могут служить эффекты ржавчины или пыли, выхлоп турбины или мотора, облака и дым, необработанные поверхности и т.д. Практическая польза очевидна – разработчикам игр больше не нужно мучаться с симуляцией эффектов через текстуры. Они могут просто накладывать «реальные» математические эффекты, наподобие тех, что используются в приложениях по рендерингу. Вершинные программы, с другой стороны, модифицируют 3D модели. Программирование волн воды с помощью классических технологий анимации отнимает очень много времени у разработчика. Благодаря вершинным программам волновые эффекты очень легко создавать – благодаря свободно распространяемым математическим моделям. Среди других применений можно отметить анимацию лица и деформации, типа смятия крыла автомобиля. Так что программы-шейдеры отнюдь не новы. До сих пор их расчет в приложениях по рендерингу всегда требовал больших процессорных ресурсов. 3D чип типа GeForceFX предоставляет высоко оптимизированные под данные задачи аппаратные ресурсы. Подобные специализированные устройства всегда работают на несколько порядков быстрые центрального процессора, который в силу своей природы предназначен для универсальной работы. Программа-шейдер, с другой стороны, создана под решение строго определенной задачи и не подходит ни для чего другого. В качестве примера можно привести теперь уже антикварные платы с декодером MPEG 2 и DVD, хотя они не отличались программируемостью. С появлением DirectX 8 графические чипы потребительского уровня стали поддерживать программируемость. Однако их возможности все еще были ограничены. До сих пор была невозможной реализация сложных программ. Кроме того, в программах можно было использовать только целочисленные данные, которые приводили к ошибкам точности при вычислениях. В случае пиксельных программ появлялись характерные артефакты – пятна. DirectX 9 значительно расширил возможности программирования и добавил поддержку данных с плавающей запятой. Среди улучшений следует отметить циклы, увеличенный код программ и несколько других расширений (см. таблицу при обзоре 3D функций выше). Создание подобный программ – дело нелегкое, поскольку их формат очень близок к коду ассемблера, так что вам необходимо обладать специальными знаниями. В 3D приложениях по рендерингу уже используются свои языки программирования, и NVIDIA создала что-то очень похожее – Cg (C для графики). Разработчики сегодня могут создавать свои программы на универсальном высокоуровневом языке. Затем компилятор Cg создает из инструкций необходимый машинный код. NVIDIA Cg полностью совместим с Microsoft HLSL (высокоуровневым языком программирования графики). Cg создает код для любой задачи, независимо от использования ею DirectX 8/9 или OpenGL. К тому же язык Cg очень близок к уже существующим языкам в приложениях по рендерингу, что ускорит внедрение нового языка. Подведем итог – аппаратная поддержка программ является важным шагом в достижении фотореализма. В DirectX 9 реализованы следующие наиболее важные улучшения:
NVIDIA 2.0+Программируемость чипа далеко превосходит спецификации DirectX 9. NVIDIA делает на этом особый упор, добавляя «+» в номера версий. Вряд ли имеет смысл излагать в этой статье все функции и возможности новых пиксельных и вершинных программ, поскольку подобная информация будет осмыслена лишь программистами.Обзор расширений GeForceFX: GeForceFX вершинные программы 2.0+По сравнению с DirectX 9 (стандарт)
GeForceFX пиксельные программы 2.0+:По сравнению с DirectX 9 (стандарт)
Основные преимущества, по данным NVIDIA:
Управление потокомУправление потоком применительно к пиксельным и вершинным программам позволяет прекратить выполнение программы на ранней стадии, к примеру, если желаемый результат уже был получен и дополнительные шаги рендеринга не нужны. При этом можно также использовать процедуры, а эффекты могут быть сгруппированы в категории или реализовываться рекурсивно через ветвления.Цвет с высокой точностьюПомимо поддержки 8-битного цвета на канал, GeForceFX также поддерживает 16-битный и 32-битный режимы цвета с плавающей запятой. Таким образом, пиксельные программы могут выполнять вычисления со 128-битной точностью для максимального качества или с 64-битной точностью, когда главной является производительность. Разработчики могут использовать оба режима вместе, что увеличивает их степень свободы. Хотя ATi R300 тоже поддерживает 128-битную точность, там используется только 24 бита на канал цвета – а получающиеся 96 бит переводятся в 128 бит при записи в кадровый буфер. С новыми 128-битными цветами с плавающей запятой мы можем получить аккуратность воспроизведения цвета, доступную раньше только приложениям по рендерингу. Как видим, GeForceFX – это еще один шаг вперед на пути к фотореализму.Заключение и анализ производительностиИтак, после обзора всех функций нового чипа давайте попытаемся ответить на поставленный в начале статьи вопрос. Насколько хороша GeForceFX по сравнению с Radeon 9700 PRO (R300)? На бумаге NVIDIA вернула технологическое превосходство перед ATi, легко затмевая собой R300. Расширенные возможности пиксельных и вершинных программ, далеко превосходящие спецификации DirectX 9, позволят разработчикам игр создавать и использовать намного более сложные эффекты в реальном времени по сравнению с R300. К тому же NVIDIA оснастила разработчиков соответствующим инструментом в виде компилятора Cg. Однако будущее покажет, воодушевятся ли разработчики новыми возможностями и станут ли их использовать. Пользователи-энтузиасты и игроки уже давно привыкли к циклам разработки, в результате которых появляются новые продукты с умопомрачительными возможностями, которые остаются не реализованными на практике в течение, по крайней мере, года. И именно для решения данной проблемы и был создан Cg – он должен дать разработчикам способ легко создавать новые программы, которые могут выполняться на базе как существующего оборудования, так и новых продуктов. Таким образом «ранние» покупатели видеокарт смогут получить преимущество от купленной новинки, не ограничиваясь какими-либо узкоспециализированными приложениями. В конце концов, издателей игр волнует лишь одно: строчка итого. Она наполняется с помощью продажи игр – продажи большого количества игр. А используют игры шейдеры или не используют – их мало волнует. По игре типа Stalker можно прикинуть, что нас ждет в будущем. Дополнительные скриншоты можно посмотреть здесь. Главная проблема NVIDIA заключается в том, что сегодня не используются даже простейшие DirectX 9 функции. Единственная доступная сегодня версия DirectX 9 – это публичная бета, а DirectX 9 игры появятся еще позже. NVIDIA будет очень трудно продавать продукт, вся соль которого заключается в будущей реализации новых технологий. И здесь у Radeon 9700 PRO сильные позиции. Он комбинирует теоретические преимущества поддержки DX9 с прекрасной производительностью в сегодняшних играх. Такой эффект достигается благодаря очень высокой пропускной способности памяти, высокой пропускной способности треугольников в блоках вершинных программ и в силу крайне быстрых пиксельных конвейеров. При одновременном включении сглаживания и анизотропной фильтрации R300 прекрасно себя показывает и превосходит любое решение, доступное сегодня на рынке. Как видим, наиболее важный параметр у GeForceFX для принятия решения о покупке должен заключаться в чистой производительности, которая очень много значит в сегодняшних играх. Что касается скорости пиксельного заполнения, то GeForceFX явно превосходит ATi Radeon 9700 PRO. С производительностью вершинных программ, то есть пропускной способностью треугольников, ситуация менее понятна. Хотя GeForceFX немного обгоняет Radeon, ATi может сравнять результаты простым поднятием тактовых частота от 325 МГц до 350 МГц. Для увеличения скорости заполнения такой способ не подойдет. 0,15 мкм дизайн ATi не позволяет значительно увеличить тактовые частоты, в то время как 0,13 мкм чип NVIDIA имеет некоторый запас прочности. О производительности памяти трудно судить по данным на бумаге. И хотя у ATi пропускная способность выше, по причине использования 256-битной шины памяти (19,6 Гбайт/с против 16 Гбайт/с), NVIDIA может компенсировать разницу своей новой возможностью цветовой компрессии. Мы уже подчеркивали важность оптимизированного интерфейса памяти. И снова, давайте для примера возьмем Matrox Parhelia, чья производительность и рядом не находится с GeForce4 Ti (10,4 Гбайт/с) или Radeon 9700 PRO несмотря на впечатляющую пропускную способность памяти в 18 Гбайт/с. Только лишь тесты на реальных приложениях покажут, насколько быстр интерфейс памяти NVIDIA. NVIDIA сделала колоссальный шаг вперед по производительности и качеству изображения. Благодаря адаптивной анизотропной фильтрации и быстрому трилинейному фильтру, о падение производительности GeForce4 Ti4600 в этих режимах можно забыть. Еще одна позитивная деталь заключается в предоставлении пользователю возможности полного контроля настроек фильтрации, благодаря чему можно всегда переключиться в режим «классической фильтрации». В режиме полноэкранного сглаживания GeForceFX должна превзойти Radeon 9700 PRO, поскольку цветовая компрессия дает ощутимый прирост производительности, что в свою очередь позволяет достичь большей частоты кадров. Без сомнения NVIDIA вновь приблизила нас к цели – фотореалистичному рендерингу в реальном времени. Сейчас все зависит от разработчиков игр – ведь от новых возможностей должны выиграть не только люди в студиях Голливуда. Сегодня для финального заключения нам не хватает только одной вещи – тестового образца. Как объявила NVIDIA, образцы чипов будут высланы производителям карт в декабре, в это же время мы получим в свое распоряжение и тестовый образец. Если вы надеялись купить новую карту GeForceFX к рождеству, то боимся вас разочаровать – в продаже карты появятся не раньше февраля. Просуммируем статус продукта: Анонс: сделан Первые образцы: ноябрь 2002 Массовое производство: декабрь 2002 Поступление в продажу: февраль 2003 Источник: "Железная столица", http://tech.stolica.ru/
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Copyright © "Internet Zone", info@izcity.com |