Читать «Журнал "Компьютерра" №723» онлайн - страница 67

Компьютерра

В ассортименте продукции фирмы EVGA есть карта e-GeForce 8800 Ultra Black Pearl 768MB , оснащенная специально разработанной системой водяного охлаждения, а также разогнанная e-GeForce 8800 Ultra Superclocked 768MB, где ядро работает на частоте 655 МГц, а видеопамять GDDR3 - на эффективной частоте 2250 МГц.

AMD/ATI RADEON

Появившееся прошлой весной семейство графических процессоров с кодовым названием R600 положило начало серии HD 2xxx. Важнейшими функциональными отличиями этой серии стали поддержка нового программного интерфейса (API) Microsoft DirectX 10, реализованного в операционной системе Windows Vista, а также встроенный унифицированный аппаратный декодер видео высокого разрешения UVD (кроме HD 2900), работающий с форматами H.264 и VC-1 и использующийся для кодирования записей на дисках Bluray и HD DVD. Как ни странно, в топовой серии HD 2900 XT модуль UVD отсутствует.

Объяснение может быть только одно: мощное графическое ядро и без сторонней помощи справится с декодированием видео, тем более что при воспроизведении фильмов видеокарта вряд ли будет занята чемто другим.

Архитектура R600 стала для AMD (ATI) значительным шагом вперед. Впервые в графических ускорителях этой компании стала использоваться унифицированная архитектура, прошедшая обкатку в специализированном процессоре для игровой приставки Microsoft Xbox 360. В ее основу положены унифицированные суперскалярные потоковые процессоры, которых в R600 целых 320 штук. Эти процессоры не имеют четкой специализации и могут при необходимости выполнять расчет любых данных (пиксельных, вершинных, гео метрических и др.). Распределением потоков данных и "раздачей заданий" вычислительным модулям занимается диспетчер потоков (Ultra-Threaded Dispatch Processor).

Упомянутые 320 потоковых процессоров не следует сравнивать, например, со 128 скалярными процессорами в графическом ядре nVidia G80. Дело в том, что 320 заявленных AMD/ATI потоковых процессоров - это 64 суперскалярных процессора, состоящие из пяти шейдерных блоков (арифметико-логических устройств, ALU) в каждом. При этом только один блок является универсальным, способным выполнять сложные вычисления (синусы, косинусы, логарифмы, экспоненты и пр.); остальные четыре рассчитаны лишь на арифметические операции сложения и умножения.

В ядре же nVidia G80 все 128 скалярных процессора являются универсальными.

Каждый ALU в R600 выполняет одну инструкцию, а число потоков равно 64, то есть числу суперскалярных процессоров. И хотя в G80 вдвое больше потоков, в R600 количество операций за такт может достигать 320, что означает гораздо более высокую скорость обработки шейдеров. Но только теоретически: все зависит от "оптимальности" кода и от эффективности работы диспетчера, ведь в худшем случае производительность может упасть до 64 операций за такт.