Надоел медленный Интернет? 
Попробуй Ускоритель!

Marketscore - бесплатный сервис, практически вдвое увеличивающий скорость загрузки вашим браузером страниц и сайтов в Интернете. В среднем, скорость загрузки вэбстраниц с графикой и текстом ускоряется на 75%. 
Особенно заметен выигрыш, если у вас медленный модем или вы выходите в Интернет на маленьких скоростях (до 56 Кб/сек). Подробнее...

реклама у нас

***

GeForceFX: NVIDIA покоряет Голливуд?

Оригинал: TomsHardwareGuide
Перевод: Дмитрий Чеканов

На осеннем Comdex Fall 2002 NVIDIA объявит наследника крайне успешной линейки графических чипов GeForce4 Ti, который в свою очередь предстанет перед публикой компьютерных магазинов в феврале. Этим шагом NVIDIA похожа на своего главного конкурента ATi, поскольку компания представляет новый чип GeForceFX с кодовым названием NV30 по частям. На Comdex NVIDIA откроет только лишь детали о технологиях и возможностях чипа, которые далеко превосходят спецификации DirectX 9. Однако компания не будет давать никакой конкретной информации о производительности или ассортименте версий будущих карт – не говоря уже о предоставлении тестовых образцов.

Поэтому сегодня вряд ли можно ответить на вопрос, который многие задают последние месяцы. Сдаст ли ATi свои позиции по технологическому лидерству и производительности, которых компания достигла благодаря выпуску Radeon 9700 PRO? Мы все же постараемся ответить на этот вопрос в конце статьи, ну а пока давайте рассмотрим основные функции и возможности нового GeForceFX.


NVIDIA GeForce4 Ti4600 NVIDIA GeForceFX ATI Radeon 9700 PRO
Технология чипа 256 бит 256 бит 256 бит
Техпроцесс 0,15 микрон 0,13 микрон 0,15 микрон
Число транзисторов 63 млн. 125 млн. ~107 млн.
Ширина шины памяти 128 бит DDR 128 бит DDR2 256 бит DDR
Пропускная способность памяти 10,4 Гбайт/с 16 Гбайт/с 19,8 Гбайт/с
Пиксельная скорость заполнения 1,24 Гигапикселей/с ~4 Гигапикселей/с 2,6 Гигапикселей/с
Скорость заполнения сглаживания 4,8 млрд. AA семплов/с ~16 млрд. AA семплов/с 15,6 млрд. AA семплов/с
Максимальный режим сглаживания 4x 8x 6x
Скорость трансформации треугольников 69 млн. треугольников/с 350 млн. треугольников/с 325 млн. треугольников/с
Шина AGP 1x/2x/4x 1x/2x/4x/8x 1x/2x/4x/8x
Объем памяти 128 Мб 128/256 Мб 128/256 Мб
Частота чипа 300 МГц ~500 МГц 325 МГц
Частота памяти 325 МГц (650 DDR) ~500 МГц (1000 DDR) 310 МГц (620 DDR)
Характеристики памяти BGA 2,8 нс BGA 2,0 нс BGA 2,9 нс
Число блоков вершинных программ 2 FP массив 4
Число пиксельных конвейеров 4 8 8
Число текстурных блоков на конвейер 2 1 1
Число текстур на текстурный блок 4 16 8
Версия вершинных программ 1.1 2.0+ 2
Версия пиксельных программ 1.3 2.0+ 2
Поколение DirectX 8 9.0 (+) 9
Режим сглаживания МультиСемплинг МультиСемплинг МультиСемплинг
Оптимизация работы с памятью LMA II LMA II оптимизированное сжатие цвета
Hyper Z III
Число выходов на дисплеи 2 2 2
Встроенный Ramdac 2 x 400 МГц 2 x 400 МГц 2 x 400 МГц
Внешний Ramdac - - -
Число бит на канал цвета 8 10 10
Особые возможности - ТВ кодер на чипе
Расширенные возможности программирования
Адаптивная фильтрация
ТВ кодер на чипе
FullStream
Адаптивная фильтрация
Предполагаемая цена ~ $200-300 Не указана $399

Аппаратное обеспечение

  • Изготавливается по 0,13 мкм техпроцессу
  • Упаковка flip-chip
  • 128-битный чип
  • 125 млн. транзисторов
  • 8 блоков пиксельных программ
  • x блоков вершинных программ
  • Тактовые частоты не меньше 500 МГц
  • Частота работы DDR-II не меньше 500 МГц (1 ГГц DDR)
  • 128-битный интерфейс памяти
  • Оптимизированный интерфейс памяти с Z-компрессией без потерь и сжатием цветовых данных
  • AGP 8X
  • FX Flow – решение по охлаждению на базе тепловых трубок

3D возможности

  • Полная поддержка DirectX 9
  • Адаптивная анизотропная фильтрация
  • Сглаживание Intellisample
  • 32/64/128 битный формат представления цвета (изменяемый)
  • Digital Vibrance Control 3.0
  • Пиксельные программы 2.0+


DirectX 8 DirectX 8.1 DirectX 9 GeForceFX
Версия пиксельных программ 1.1 1.4 2.0 2.0+
Максимальное число текстурных инструкций 4 6 16 16
Максимальное число цветовых инструкций 4 8 32 1024
Максимальный объем временного хранения 8 8 64 1024
Тип данных Целые Целые Плавающая запятая Плавающая запятая
Максимальная точность данных 32-bit 48-bit 128 (96) бит 64 или 128 бит
Число предикатов инструкций - - 12 64
Неограниченное число зависимых текстур - - - Да
Настройка адресов (Swizzling) - - - Да
Дополнительные инструкции - - - Да
Условные маски записи - - - Да
Динамическое управление потоком - - - Да
В таблице показаны отличия между GeForce4 Ti 4600 и Radeon 8500/9000 (версия пиксельных программ 1.1), Radeon 9500/9700 (2.0) и GeForceFX (2.0+).

  • Вершинные программы 2.0+


DirectX 8 DirectX 9 GeForceFX
Версия вершинных программ 1.1 2 2.0+
Максимальное число инструкций 128 1024 65536
Максимальное число статических инструкций 128 256 256
Максимальное число констант 96 256 256
Число временных регистров 12 12 16
Максимальное число циклов 0 4 256
Условные маски записи - - Да
Вызов и возврат - - Да
Статический контроль потока - Да Да
Динамический контроль потока - - Да
В таблице показаны отличия между GeForce4 Ti 4600 (версия пиксельных программ 1.1), Radeon 8500/9000 (1.4), Radeon 9500/9700 (2.0) и GeForceFX (PS 2.0+).

Чип


GeForceFX, ранее известный под кодовым именем NV30, является первым чипом NVIDIA, который использует технологии, полученные от 3dfx и Gigapixel. Сам чип имеет совершенно новый дизайн, у которого с GeForce4 Ti мало чего общего.

Чип GeForceFX будет изготавливаться на фабриках TSMC по 0,13 мкм техпроцессу, то есть это первый потребительский 3D чип, освоивший новый техпроцесс. По сравнению с текущим 0,15 мкм техпроцессом, новый дизайн уменьшает площадь кристалла на 25% и увеличивает производительность транзисторов на 25%. В соответствии с данными NVIDIA, энергопотребление при этом падает на 36%. Однако наибольшее преимущество перехода на 0,13 мкм заключается в повышенных тактовых частотах. Этому немало помогает упаковка с шариковыми выводами flip-chip, в которой затвор транзистора может быть напрямую соединен с контактной ножкой. В старых дизайнах чип соединялся с контактами с помощью дорожек, что усиливало помехи.

Благодаря новому масштабируемому дизайну, NVIDIA готова во всеоружии встретить свое будущее, даже при высоких затратах на производство. И хотя NV30 содержит на 25 млн. больше транзисторов, чем ATi R300, размер у кристалла будет примерно такой же, если не меньше.

Как вы догадываетесь, чип со 125 миллионами транзисторов выделяет довольно много тепла. Для эффективного (и тихого) отвода тепла от чипа NVIDIA разработала собственное решение по охлаждению для GeForceFX, которое получило название Flow FX. Медный радиатор использует тепловые трубки – подобно ABIT OTES – и передает тепло от чипа за пределы корпуса. Такой подход кроме всего прочего позволяет понизить температуру внутри корпуса.
Демонстрационная плата NVIDIA, которая была установлена на систему nForce2, выделяла большое количество тепла. Выдуваемый воздух был очень горяч. И хотя вся система была довольно тихой, мы отчетливо различали шум вентилятора Flow FX, что не очень радует. NVIDIA пообещала изменить дизайн для уменьшения шума.

Память DDR-II и интерфейс памяти

DDR память уже прочно утвердилась в качестве стандартной памяти практически для всех видеокарт, включая бюджетные. DDR означает удвоенную скорость передачи, что достигается благодаря передаче данных на обоих фронтах тактового импульса. В результате мы получаем удвоенное значение теоретической пропускной способности без дополнительного увеличения тактовой частоты. DDR память передает по 2 бита за один такт по одной линии, а DDR-II – уже 4 бита, таким образом еще увеличивая пропускную способность DDR памяти в два раза. DDR-II также обладает и другими преимуществами:
  • пониженное напряжение питания с 2,5 В до 1,8 В
  • меньшее время доступа – между 1,8 нс и 2,2 нс по сравнению с 2,9 нс DDR
  • линии данных затерминированы на чипе памяти, а не на плате (что приводит к повышению качества сигнала)
Все эти факторы в совокупности позволяют достичь более высоких тактовых частот памяти.

Чип GeForceFX с самого начала разрабатывался под интерфейс памяти DDR-II. Чип, скорее всего, будет поставляться с памятью на 500 МГц (1 ГГц DDR-II), подключенной по 128-битной шине памяти, что приводит к пиковой пропускной способности около 16 Гбайт/с. И хотя значение пропускной способности выросло по сравнению с GeForce4 Ti 10,4 Гбайт/с, оно все еще далеко от 19,6 Гбайт/с ATi Radeon 9700 PRO с 256-битным интерфейсом DDR памяти.
Конечно, повышение пропускной способности нельзя не приветствовать. Однако современные графические карты показывают столь высокую производительность благодаря применению специальных технологий работы с памятью. Самым ярким примером служит Matrox Parhelia. Даже при теоретической пропускной способности в два раза выше GeForce4 Ti4600 (NV25), Parhelia и близко не может подойти к Ti4600 по производительности. Причина здесь заключается в высоко оптимизированном интерфейсе памяти (Lightspeed Memory Architecture). GeForceFX (NV30) будет использовать улучшенную версию этого интерфейса. Помимо компрессии Z-данных, чип будет производить цветовую компрессию 4:1 в реальном времени без потерь (подробнее об этом чуть позже, в секции Intellisample). NVIDIA обещает существенный прирост в производительности при включении сглаживания. Помимо этого в новом чипе используются кэши большего размера, которые также подверглись некоторым улучшениям. Не стоит забывать и о перекрестном контроллере памяти.

Пиксельные конвейеры

GeForceFX обладает восемью пиксельными конвейерами, в результате карта производит отображение до 8 пикселей за такт с одной текстурой. При использовании двух текстур (классическое мульти-текстурирование), GeForceFX обрабатывает до 4 пикселей за такт. И так далее. Что касается числа текстур на конвейер, то FX может накладывать до 16 текстур за один проход. Каждый пиксельный конвейер оснащен своим блоком пиксельных программ, чья производительность (число выполненных операций и инструкций за такт) сильно зависит от используемого кода.

NVIDIA оптимизировала конвейеры под трилинейную и анизотропную фильтрацию. При работе на пиковой производительности, блок фильтрации способен определять семплы для фильтрации, что повышает производительность. NVIDIA также аппаратно реализовала метод адаптивной фильтрации наподобие ATi. Чип определяет уровень фильтрации сцены (анизотропный или трилинейный фильтр) без ухудшения визуального качества картинки на основе текстур и геометрии сцены. При некоторых значениях перспективы и определенных видах текстур, повышение уровней фильтрации не приводит к увеличению качества картинки, зато ощутимо сказывается на производительности. «Умный» адаптивный алгоритм позволит решить эту проблему.

Адаптивную фильтрацию можно включать и выключать в меню драйвера, так что вы всегда можете перейти к «классическому» методу фильтрации. Отрадно, что NVIDIA оставила выбор за конечным пользователем.

Скорость заполнения GeForceFX явно превосходит Radeon 9700 PRO. 8 пикселей на такт составляют теоретическую скорость заполнения 4000 Мпикселей/с (при частоте ядра 500 МГц). Это на приличные 54% выше Radeon (2600 Мпикселей/с).

Блок вершинных программ

До сегодняшнего дня производительность блоков вершинных программ выражалась через число доступных вершинных блоков (Geforce4 Ti: 2 / Radeon 9700 PRO: 4). В отличие от них, GeForceFX использует программируемый массив с плавающей запятой, который позволяет достичь скорость трансформации треугольников выше 350 Мвершин/с. Для сравнения, скорость трансформации треугольников GeForce4 Ti составляет около 136 Мвершин/с, а Radeon 9700 PRO – около 325 Мвершин/с.

При нормализации по тактовой частоте мы получаем следующую картину:
  • NVIDIA GeForce4 Ti4600 (300 МГц): 0,453 Мвершины/такт
  • NVIDIA GeForceFX (500 МГц): 0,7 Мвершин/такт
  • ATi Radeon 9700 PRO (325 МГц): 1 Мвершина/такт

И хотя общая производительность блока вершинных программ у GeForceFX выше, чем у Radeon, достигается это лишь благодаря большей тактовой частоте. Если бы частота Radeon была на 8% выше (350 МГц), он бы показывал равную GeForceFX производительность. Но поскольку все эти значения чисто теоретические, нам нужно дождаться тестирования на реальных приложениях. Показанные же выше значения основываются на «идеальной» геометрии, которая в жизни встречается редко. Высокие тактовые частоты GeForceFX могут значительно усилить производительность карты на реальных приложениях.

Intellisample

Так NVIDIA назвала оптимизацию качества картинки GeForceFX. Название подразумевает технологии фильтрации, которые мы уже описывали выше при рассмотрении пиксельных конвейеров, равно как и улучшенное сглаживание.
Цветовая компрессия
Как мы уже упоминали, интерфейс памяти GeForceFX задействует цветовую компрессию без потерь, которая сжимает цветовые данные в реальном времени в отношении 4:1 без ущерба производительности. Таким образом, можно повысить эффективность использования пропускной способности памяти, что в свою очередь повысит общую производительность. Цветовая компрессия используется для пикселей с фиксированным значением цвета внутри полигона. Сэкономленная пропускная способность будет использоваться для рендеринга пикселей на краях полигона.
Сглаживание
GeForceFX оснастили новыми режимами сглаживания. В добавление к 6XS, появился новый 8x режим, который использует в два раза больше пикселей для расчета изображения, чем режим 4x. Благодаря сжатию Z-данных и цветовой информации, сглаживание на GeForceFX работает быстрее предшественников. Как обещает NVIDIA, вы сможете включать даже 8x режим без существенного падения частоты кадров. Помимо этого NVIDIA стала использовать гамма-коррекцию. Сглаживающий фильтр очень гибок во многих отношениях. Четкость текстур может быть повышена через большее число семплов, улучшенную фильтрацию, равно как и через использование карт масштабирования (mipmap) с высоким разрешением. Поскольку каждый конвейер может просчитывать до 1024 текстурных операций за один проход, можно использовать сложные технологии фильтрации без существенного ухудшения производительности.
Динамическая коррекция цвета
Новая функция GeForceFX упрощает работу с уровнями гаммы при программируемых вычислениях. Разработчику не нужно больше постоянно держать в уме диапазоны яркостей.

Без гамма-коррекции слева, с коррекцией справа

Компоненты на плате

GeForceFX использует два интегрированных 400 МГц 10 бит RAMDAC. Каждый из них может выводить сигнал на ЭЛТ монитор с максимальным разрешением 2048x1536@85 Гц. Чип также имеет встроенную функцию ТВ-выхода. И хотя поддержка 10-битного разрешения цвета на канал присутствовала уже с первого поколения карт GeForce, преимущество от ее наличия могут оценить лишь немногие пользователи, поскольку мониторы с отображением более 8-ми бит на цветовой канал очень редки.

Новый чип был также отлажен под улучшенное качество картинки на аналоговых мониторах для того, чтобы сделать качество независимым от дизайна плат. Так что мы должны получить улучшенное и более четкое качество картинки по сравнению с GeForce4 Ti.

Возможности DirectX 9, программируемость и Cg

Как считает NVIDIA, наибольшая сила GeForceFX кроется в блоках вершинных и пиксельных программ, которые ушли далеко за спецификации DirectX 9. Так что такое программа (шейдер)? Это обычная программа, которая просчитывает эффекты и накладывает текстуры на объект. Ничего принципиально нового в шейдерах нет. Процедуры в приложениях по рендерингу представляют собой большой набор программ-шейдеров, которые последовательно запускаются.

В современных картах принято различать пиксельные программы, которые обрабатывают текстуры и пиксели, и вершинные программы, которые работают с векторными объектами. К примеру, эффект хромированной стали T1000 в Terminator 2 достигается подключением соответствующей программы, которая вычисляет отражения и освещение. Другими примерами могут служить эффекты ржавчины или пыли, выхлоп турбины или мотора, облака и дым, необработанные поверхности и т.д. Практическая польза очевидна – разработчикам игр больше не нужно мучаться с симуляцией эффектов через текстуры. Они могут просто накладывать «реальные» математические эффекты, наподобие тех, что используются в приложениях по рендерингу.

Вершинные программы, с другой стороны, модифицируют 3D модели. Программирование волн воды с помощью классических технологий анимации отнимает очень много времени у разработчика. Благодаря вершинным программам волновые эффекты очень легко создавать – благодаря свободно распространяемым математическим моделям. Среди других применений можно отметить анимацию лица и деформации, типа смятия крыла автомобиля.

Так что программы-шейдеры отнюдь не новы. До сих пор их расчет в приложениях по рендерингу всегда требовал больших процессорных ресурсов. 3D чип типа GeForceFX предоставляет высоко оптимизированные под данные задачи аппаратные ресурсы. Подобные специализированные устройства всегда работают на несколько порядков быстрые центрального процессора, который в силу своей природы предназначен для универсальной работы. Программа-шейдер, с другой стороны, создана под решение строго определенной задачи и не подходит ни для чего другого. В качестве примера можно привести теперь уже антикварные платы с декодером MPEG 2 и DVD, хотя они не отличались программируемостью.

С появлением DirectX 8 графические чипы потребительского уровня стали поддерживать программируемость. Однако их возможности все еще были ограничены. До сих пор была невозможной реализация сложных программ. Кроме того, в программах можно было использовать только целочисленные данные, которые приводили к ошибкам точности при вычислениях. В случае пиксельных программ появлялись характерные артефакты – пятна. DirectX 9 значительно расширил возможности программирования и добавил поддержку данных с плавающей запятой. Среди улучшений следует отметить циклы, увеличенный код программ и несколько других расширений (см. таблицу при обзоре 3D функций выше).

Создание подобный программ – дело нелегкое, поскольку их формат очень близок к коду ассемблера, так что вам необходимо обладать специальными знаниями. В 3D приложениях по рендерингу уже используются свои языки программирования, и NVIDIA создала что-то очень похожее – Cg (C для графики). Разработчики сегодня могут создавать свои программы на универсальном высокоуровневом языке. Затем компилятор Cg создает из инструкций необходимый машинный код. NVIDIA Cg полностью совместим с Microsoft HLSL (высокоуровневым языком программирования графики). Cg создает код для любой задачи, независимо от использования ею DirectX 8/9 или OpenGL. К тому же язык Cg очень близок к уже существующим языкам в приложениях по рендерингу, что ускорит внедрение нового языка.

Подведем итог – аппаратная поддержка программ является важным шагом в достижении фотореализма.
В DirectX 9 реализованы следующие наиболее важные улучшения:
  • Пиксельные программы 2.0: движок пиксельных шейдеров получил истинную программируемость в DX9. Впервые чип сможет реализовывать процедурное затенение (procedural shading).
  • Вершинные программы 2.0: DX9 значительно увеличивает мощь предыдущих DirectX вершинных шейдеров с помощью удлинения их максимального размера и повышения гибкости программирования.
  • Высокоточный цвет с плавающей точкой: DX9 снимает ошибки точности, которые ограничивали графику для ПК в прошлом. С помощью использования 128-битных значений цвета с плавающей запятой на пиксель удалось достичь высокой точности и визуального качества.

NVIDIA 2.0+

Программируемость чипа далеко превосходит спецификации DirectX 9. NVIDIA делает на этом особый упор, добавляя «+» в номера версий. Вряд ли имеет смысл излагать в этой статье все функции и возможности новых пиксельных и вершинных программ, поскольку подобная информация будет осмыслена лишь программистами.

Обзор расширений GeForceFX:
GeForceFX вершинные программы 2.0+
По сравнению с DirectX 9 (стандарт)
  • 256 инструкций в хранимой программе (было 128)
  • 256 констант (было 96)
  • Векторный регистр адреса (был скалярным)
  • Максимальное число инструкций, которые могут быть выполнены в программе – 65 536
Основные преимущества, по данным NVIDIA:
  • До 65 536 вершинных инструкций на вершину (до 256 статических инструкций на программу). Движок CineFX обеспечивает высокую вычислительную мощность по обработке вершин. Помимо удвоения хранимых инструкций, добавление управления потоком значительно увеличило количество вычислений, которые могут быть произведены над каждой вершиной. Подобная гибкость уменьшает общее число вершинных программ, требующихся приложению.
  • До 256 векторных констант. Число регистров констант в движке CineFX вершинных программ было увеличено с 96 до 256 учетверенных слов. Подобное увеличение позволяет обрабатывать массивные матрицы для матричного наложения текстур (matrix palette skinning) и увеличенного количества одновременных источников света.
  • Шестнадцать временных векторных регистра. Количество временных регистров было увеличено на 33% - с 12 до 16. Временные регистры особенно полезны в больших программах.
  • До 64 отдельных циклов. Движок вершинных программ CineFX позволяет создавать более простые программы благодаря полной поддержке ветвления и циклов (включая вложенные циклы и ветвления). В одной программе может использоваться до 64 различных ветвлений. Сейчас разработчик сможет легко прогнать цикл по всем источникам света и выбрать необходимый тип освещения.
  • По-компонентные коды условия и маски записи. Коды условия отвечают за условное ветвление, они также позволяет увеличить производительность и упростить код условных выражений.
  • Вызов и возврат (процедуры). Помимо улучшенного ветвления, вершинный процессор поддерживает подпрограммы с семантикой CALL/RETURN, со стеком вызова вплоть до 4 глубины.
  • Циклы и ветвления при статическом и динамическом управлении потоком. Универсальные циклы и ветвления делают CineFX программы гибкими и мощными.
GeForceFX пиксельные программы 2.0+:
По сравнению с DirectX 9 (стандарт)
  • Регистры и инструкции могут использовать 12-битные числа с фиксированной запятой, 16-битные и 32-битные числа с плавающей запятой
  • Любое число текстурных запросов, число текстур при этом - вплоть до 16 уникальных текстур
  • 1024 инструкции на проход рендеринга
  • 8 текстурных координат (до 16 активных текстур)
  • Если целевая поверхность задана плавающей запятой (float surface), тогда данные с плавающей запятой подвергаются преобразованию ширины (width convert) для соответствия цели рендеринга, затем происходит сохранение. (Для подобных поверхностей не допускается блендинг)
  • Если источник является поверхностью с плавающей запятой, то пиксельный блок не может производить фильтрацию (отсутствие билинейной фильтрации данных с плавающей запятой).
  • Все преобразования типа и ширины происходят без ущерба производительности
  • Все пиксели в группе затрачивают одинаковое число тактов

Основные преимущества, по данным NVIDIA:
  • Добавление нового набора инструкций для пиксельных программ: зарезервированные раньше инструкции для обработки вершин сегодня доступны для пиксельных программ, они были расширены необходимым инструкциями по обработке пикселей.
  • Удаление существовавших ограничений: программы могут быть больше (до 1024 инструкции) и использовать до 16 текстур на пиксель с бесконечными уровнями обращений к зависимым текстурам
  • Значительно расширено число пиксельных операций: до 1024 пиксельных операций; по-компонентная настройка по адресам (swizzling); по-компонентные условные маски записи; произвольные текстурные фильтры и другие расширенные инструкции. DirectX 8 поддерживал восемь инструкций. Благодаря последнему API и соответствующему поколению графических чипов число инструкций возросло до 64. Движок NVIDIA CineFX с 1024 инструкциями поддерживает более длинные программы, что позволяет достичь впечатляющих результатов.
  • Улучшенное фрагментное хранение программ: хранение в видео памяти, в отличие от вершинных программ, снижает потребление ресурсов при управлении фрагментными программами.
  • До 16 карт текстур. Движок NVIDIA CineFX позволяет запрашивать до 16 разных карт текстур в одной пиксельной программе. Текстуры могут определять свойства поверхности: например, это могут быть карты неровностей, карты окружающей среды, карты теней и т.д.
  • До 1024 текстурных инструкций на программу. В предыдущих архитектурах число уникальных текстурных карт было привязано к числу текстурных запросов. CineFX снимает это ограничение, позволяя реализовывать до 1024 текстурных запросов в одной программе, которые используют до 16-ти текстур. Благодаря такому подходу можно реализовывать новые эффекты, которые используют множественное обращение к текстурам.
    • Мягкие тени (soft shadows). Мягкие тени могут быть созданы с помощью взятия произвольно большого числа семплов с карты теней и дальнейшего использования семплов для фильтрации тени.
    • Эффекты пост-обработки кадрового буфера. Можно создать множество интересных эффектов с помощью взятия нескольких текстурных семплов с кадрового буфера. Среди них размытие, гало, не-фотореалистичные эффекты затенения типа мультфильмов, эффекты масляного полотна и т.д..
    • Сложные фильтры. При обращении к текстурам может быть выполнена высококачественная фильтрация. Бикубический фильтр, к примеру, требует взятия 16 семплов с одной и той же текстуры.
Пока что мы воздержимся от комментариев по поводу всех этих расширений. Как считает ATi, современные карты не способны обработать длинные и сложные программы в играх за приемлемое время. Конечно, мнение NVIDIA противоположно. Так что придется обратиться к разработчикам игр, чтобы они пролили свет на эту проблему путем использования новых возможностей GeForceFX – или путем их не использования.

Управление потоком

Управление потоком применительно к пиксельным и вершинным программам позволяет прекратить выполнение программы на ранней стадии, к примеру, если желаемый результат уже был получен и дополнительные шаги рендеринга не нужны. При этом можно также использовать процедуры, а эффекты могут быть сгруппированы в категории или реализовываться рекурсивно через ветвления.

Цвет с высокой точностью

Помимо поддержки 8-битного цвета на канал, GeForceFX также поддерживает 16-битный и 32-битный режимы цвета с плавающей запятой. Таким образом, пиксельные программы могут выполнять вычисления со 128-битной точностью для максимального качества или с 64-битной точностью, когда главной является производительность. Разработчики могут использовать оба режима вместе, что увеличивает их степень свободы. Хотя ATi R300 тоже поддерживает 128-битную точность, там используется только 24 бита на канал цвета – а получающиеся 96 бит переводятся в 128 бит при записи в кадровый буфер. С новыми 128-битными цветами с плавающей запятой мы можем получить аккуратность воспроизведения цвета, доступную раньше только приложениям по рендерингу. Как видим, GeForceFX – это еще один шаг вперед на пути к фотореализму.

Заключение и анализ производительности


Итак, после обзора всех функций нового чипа давайте попытаемся ответить на поставленный в начале статьи вопрос. Насколько хороша GeForceFX по сравнению с Radeon 9700 PRO (R300)? На бумаге NVIDIA вернула технологическое превосходство перед ATi, легко затмевая собой R300. Расширенные возможности пиксельных и вершинных программ, далеко превосходящие спецификации DirectX 9, позволят разработчикам игр создавать и использовать намного более сложные эффекты в реальном времени по сравнению с R300. К тому же NVIDIA оснастила разработчиков соответствующим инструментом в виде компилятора Cg. Однако будущее покажет, воодушевятся ли разработчики новыми возможностями и станут ли их использовать.

Пользователи-энтузиасты и игроки уже давно привыкли к циклам разработки, в результате которых появляются новые продукты с умопомрачительными возможностями, которые остаются не реализованными на практике в течение, по крайней мере, года. И именно для решения данной проблемы и был создан Cg – он должен дать разработчикам способ легко создавать новые программы, которые могут выполняться на базе как существующего оборудования, так и новых продуктов. Таким образом «ранние» покупатели видеокарт смогут получить преимущество от купленной новинки, не ограничиваясь какими-либо узкоспециализированными приложениями. В конце концов, издателей игр волнует лишь одно: строчка итого. Она наполняется с помощью продажи игр – продажи большого количества игр. А используют игры шейдеры или не используют – их мало волнует.

По игре типа Stalker можно прикинуть, что нас ждет в будущем. Дополнительные скриншоты можно посмотреть здесь.

Главная проблема NVIDIA заключается в том, что сегодня не используются даже простейшие DirectX 9 функции. Единственная доступная сегодня версия DirectX 9 – это публичная бета, а DirectX 9 игры появятся еще позже. NVIDIA будет очень трудно продавать продукт, вся соль которого заключается в будущей реализации новых технологий. И здесь у Radeon 9700 PRO сильные позиции. Он комбинирует теоретические преимущества поддержки DX9 с прекрасной производительностью в сегодняшних играх. Такой эффект достигается благодаря очень высокой пропускной способности памяти, высокой пропускной способности треугольников в блоках вершинных программ и в силу крайне быстрых пиксельных конвейеров. При одновременном включении сглаживания и анизотропной фильтрации R300 прекрасно себя показывает и превосходит любое решение, доступное сегодня на рынке.
Как видим, наиболее важный параметр у GeForceFX для принятия решения о покупке должен заключаться в чистой производительности, которая очень много значит в сегодняшних играх.
Что касается скорости пиксельного заполнения, то GeForceFX явно превосходит ATi Radeon 9700 PRO. С производительностью вершинных программ, то есть пропускной способностью треугольников, ситуация менее понятна. Хотя GeForceFX немного обгоняет Radeon, ATi может сравнять результаты простым поднятием тактовых частота от 325 МГц до 350 МГц. Для увеличения скорости заполнения такой способ не подойдет. 0,15 мкм дизайн ATi не позволяет значительно увеличить тактовые частоты, в то время как 0,13 мкм чип NVIDIA имеет некоторый запас прочности.
О производительности памяти трудно судить по данным на бумаге. И хотя у ATi пропускная способность выше, по причине использования 256-битной шины памяти (19,6 Гбайт/с против 16 Гбайт/с), NVIDIA может компенсировать разницу своей новой возможностью цветовой компрессии. Мы уже подчеркивали важность оптимизированного интерфейса памяти. И снова, давайте для примера возьмем Matrox Parhelia, чья производительность и рядом не находится с GeForce4 Ti (10,4 Гбайт/с) или Radeon 9700 PRO несмотря на впечатляющую пропускную способность памяти в 18 Гбайт/с. Только лишь тесты на реальных приложениях покажут, насколько быстр интерфейс памяти NVIDIA.

NVIDIA сделала колоссальный шаг вперед по производительности и качеству изображения. Благодаря адаптивной анизотропной фильтрации и быстрому трилинейному фильтру, о падение производительности GeForce4 Ti4600 в этих режимах можно забыть. Еще одна позитивная деталь заключается в предоставлении пользователю возможности полного контроля настроек фильтрации, благодаря чему можно всегда переключиться в режим «классической фильтрации». В режиме полноэкранного сглаживания GeForceFX должна превзойти Radeon 9700 PRO, поскольку цветовая компрессия дает ощутимый прирост производительности, что в свою очередь позволяет достичь большей частоты кадров.

Без сомнения NVIDIA вновь приблизила нас к цели – фотореалистичному рендерингу в реальном времени. Сейчас все зависит от разработчиков игр – ведь от новых возможностей должны выиграть не только люди в студиях Голливуда. Сегодня для финального заключения нам не хватает только одной вещи – тестового образца. Как объявила NVIDIA, образцы чипов будут высланы производителям карт в декабре, в это же время мы получим в свое распоряжение и тестовый образец. Если вы надеялись купить новую карту GeForceFX к рождеству, то боимся вас разочаровать – в продаже карты появятся не раньше февраля.

Просуммируем статус продукта:

Анонс: сделан
Первые образцы: ноябрь 2002
Массовое производство: декабрь 2002
Поступление в продажу: февраль 2003

Источник: "Железная столица", http://tech.stolica.ru/

 


Copyright © "Internet Zone"info@izcity.com 
Копирование и использование данных материалов разрешается только в случае указания на журнал "Internet Zone", как на источник получения информации. При этом во всех ссылках обязательно явное указание адреса вэб-сайта http://www.izcity.com/.
При наличии у копируемого материала авторов и источника информации - их также нужно указывать, наряду со ссылкой на нас. Подробнее условия использования материалов смотрите здесь.