enfrdepluk
Search find 4120  disqus socia  tg2 f2 lin2 in2 X icon 3 y2  p2 тільки steam2

Radeon HD 3870 особливості архітектури

4574242

Навряд чи для когось сьогодні є секретом той факт, що перше покоління масових графічних процесорів, що володіють підтримкою DirectX 10, а також відеоадаптерів на їх основі вийшло вкрай невдалим – насамперед з точки зору продуктивності. Незважаючи на інноваційну архітектуру, ATI Radeon HD 2600 і Nvidia GeForce 8600 показали себе в іграх далеко не найкращим чином, нерідко поступаючись рішенням попереднього покоління, нехай не настільки досконалим, але не мають очевидних вузьких місць у вигляді малої кількості виконавчих пристроїв, а також недостатньої оптимізації. драйверів. Не менш важливим фактором стримування було використання обома грандами графічного ринку 128-бітної шини пам'яті, явно нездатної наситити даними GPU в умовах сучасних ігор, особливо при використанні FSAA та високих роздільних здібностей екрану.

Здавалося, AMD, теперішньому власнику всіх активів ATI Technologies, варто було б поквапитися зі "зброєю відплати", особливо, у світлі все більш хиткого становища компанії в секторі споживчої тривимірної графіки. Під керівництвом AMD доходи ATI у другому кварталі цього року впали на 2006% порівняно з другим кварталом 40 року, частка ж ринку ATI Radeon впала до 2006% з 19,1% в момент анонсу про злиття ATI та AMD Очевидно, що AMD терміново потребувала заходів, здатних виправити ситуацію та повернутися на вірний курс. GPU RV670 і налагодження масових поставок рішень на його основі якраз могли б стати такими заходами, тим більше, що процесор був успішно протестований ще в серпні минулого року, проте Advanced Micro Devices вирішила здійснити запуск нової лінійки ATI Radeon HD в рамках анонсу нової ігрової платформи під кодовою назвою "Spider". У свою чергу, її запуск неодноразово В результаті, анонс платформи був відкладений на 19 листопада, і навіть до цього часу нові процесори AMD змогли досягти лише позначки 2.30 ГГц, а графічний підрозділ продовжував зазнавати втрат. RV670, який, нехай і із затримкою, але все ж таки, нарешті, побачив світло.

Раніше ATI Technologies неодноразово і справедливо критикувалася за плутанину в найменуваннях її продуктів. Не змінила вона своїм звичкам і тепер, будучи підрозділом Advanced Micro Devices. сенсу - новий чіп не можна було назвати революційним; він був закономірним еволюційним розвитком R670. GPU нового покоління. Наявність підтримки DirectX 10.1 не була підставою для присвоєння новинкам статусу "рішень наступного покоління", однак, що зроблено, зроблено, і нові графічні карти AMD ATI Radeon маркуються наступним чином:

114110

ATI Radeon HD 3850
ATI Radeon HD 3870

ATI Radeon HD 3800: архітектура

AMD пішла далі в освоєнні більш тонких техпроцесів, ніж Nvidia – її чіп став першим у світі графічним процесором, який використовує 55-нм норми виробництва, що дозволило впевнено переступити позначку 700 МГц, принаймні у старшій моделі Radeon HD 3800. Одночасно вдалося кілька зменшити складність чіпа, мабуть, за рахунок оптимізації внутрішньої архітектури чіпа та спрощення топології кільцевого контролера пам'яті, оскільки за кількістю функціональних блоків RV670 відповідає R600. Це перший за довгий час випадок, коли новий GPU ATI відстає за кількістю транзисторів від класичного графічного процесора Nvidia. З цієї точки зору ATI знову вдалося вийти у технологічні лідери, але як виглядають новинки порівняно з GeForce 8800 GT?

В першу чергу, ATI Radeon HD 3800 перевершує Nvidia GeForce 8800 GT у частоті ядра, що, однак, компенсується меншою кількістю функціональних блоків, наприклад, TMU. Значна перевага в кількості виконавчих блоків, як ми вже знаємо, не є по суті такою, і справа не тільки й не стільки в тому, що ALU у чіпах Nvidia працюють на вищій частоті: архітектура VLIW, реалізована в Radeon HD, потребує особливо ретельної. оптимізації драйверів для забезпечення ефективного розпаралелювання шейдерного коду. В іншому випадку, якщо не вдається домогтися завантаження всіх ALU незалежними інструкціями, ефективність роботи шейдерних суперскалярних процесорів Radeon HD різко падає; у гіршому випадку може задіятися лише 1 ALU з кожних 5, які входять до складу кожного з 64 таких процесорів. За іронією долі саме AMD/ATI Technologies зазнає найбільших труднощів із програмною оптимізацією, оскільки не має доступу до коду ігор, що розробляються в рамках програми Nvidia "The Way It's Meant To Be Played" до їхнього офіційного релізу. Часто такий стан справ безпосередньо відбивається на продуктивності графічних рішень AMD/ATI в іграх, і, зрозуміло, не на краще.

114092

Якщо орієнтуватися виключно на блок-схему RV670, то відмінностей від R600 на ній виявити не вдасться. Вони лежать більш глибокому рівні, тому про них слід поговорити докладніше. З помітних відмінностей між RV670 та R600 можна назвати підтримку DirectX 10.1 (Shader Model 4.1) та наявність повноцінного апаратного відеопроцесора UVD, аналогічного тому, що входить до складу ATI Radeon HD 2600.

Як і R600, кожен шейдерний процесор RV670 складається із шести блоків – п'яти ALU та одного блоку виконання інструкцій управління потоком, таких, як розгалуження, перевірка відповідності, цикли та виклик підпрограм. Крім того, він містить і набір регістрів загального призначення

114093

З п'яти ALU чотири є простими, здатними виконувати по одній інструкції FP MAD за такт, а п'ятий ALU, крім цього, може виконувати складні інструкції типу SIN, COS, LOG, EXP і т.д. Така архітектура надзвичайно гнучка та чудово масштабується, проте її слабким місцем є залежність від програмних оптимізації. Хоча до складу графічних ядер ATI Radeon HD входить спеціальний диспетчер розподілу завдань, ефективність роботи безпосередньо залежить від ефективності роботи компілятора шейдерного коду, що є частиною драйверів. Справа в тому, що суперскалярна архітектура досягає найбільшої ефективності тоді, коли всі ALU зайняті виконанням незалежних операцій, а досягти цього досить складно, тому що в 3D-додатках багато операцій залежать від результатів виконання попередніх.

Архітектурно текстурні та растрові процесори ATI Radeon HD 3800 також не відрізняються від аналогічних блоків ATI Radeon HD 2900. Вони є комплексними пристроями, тому про їхню еквівалентність традиційним TMU і ROP можна говорити лише приблизно. Всього у складі RV670 є чотири великі текстурні процесори, кожен з них містить такі блоки всередині:

8 блоків адресації текстур
20 блоків вибірки текстур
4 блоки фільтрації текстур

114094

Кожен із растрових процесорів RV670 містить у своєму складі:
4 блоки роботи з альфа-каналом та туманом
8 блоків роботи з Z- та стенсил-буферами
4 блоки блендінгу
16 блоків обробки мультисемплінгу
Таким чином, він приблизно еквівалентний 4 класичним ROP і може обробляти чотири пікселі за такт, сумарно 16, тому що всього таких процесорів чотири. У разі роботи з Z-буфером, тобто пікселями, що не містять даних про колір, продуктивність подвоюється і становить 32 пікселя за такт. Як і текстурні модулі, растрові процесори RV670 зазнали деяких досить серйозних змін, що наділили їх підтримкою можливостей DirectX 10.1.

Контролер пам'яті RV670 був удосконалений і пропускна спроможність пам'яті використовується новим чіпом значно ефективніше, що дозволяє йому на рівних конкурувати з R600. Проте практично ми можемо бачити лише зменшення розрядності зовнішньої шини пам'яті з 512 до 256 біт, і навіть зменшення загальної розрядності внутрішніх кільцевих шин контролера з 1024 до 512 біт. Більш тонкі зміни, якщо такі і мали місце, від нас, на жаль, приховані, і ми не можемо сказати, чи є заявлена ​​порівняна продуктивність RV670 та R600 їх результатом, чи наслідком неефективного використання можливостей підсистеми пам'яті останнього. Ми схиляємося до другого варіанту, тому що в реальних ігрових умовах наявність 512-бітної зовнішньої шини пам'яті з пропускною здатністю понад 100 ГБ/сек, часто не давав ATI Radeon HD 2900 XT ніяких переваг.

Також ATI RV670 є першим у світі настільним графічним процесором, що володіє такими ж просунутими засобами управління енергоспоживанням, як і графічні ядра ATI, призначені для мобільних застосувань. Завдяки технології ATI PowerPlay, новий чіп вміє гнучко керувати своїми частотами, напругою живлення і навіть відключати блоки, що не використовуються, при невеликому навантаженні на ядро. На відміну від інших настільних GPU, Підтримка функцій енергозбереження RV670 реалізована на апаратному рівні, що забезпечує швидшу реакцію на зміну навантаження і виключає помилки визначення роботи графічного процесора.

В історії ATI Technologies вже траплялися випадки, коли компанія підтримувала стандарт, який не набув до цього широкого поширення. Так, ATI Radeon 8500 підтримав специфікації Pixel Shader 1.4, що були частиною DirectX 8.1. Ці специфікації були значно гнучкішими, ніж PS1.0/1.1/1.3, підтримувані чіпами Nvidia, і дозволяли досягти більш якісних спецефектів, але саме через обмежену підтримку вони так і не набули широкого поширення серед розробників ігор під час життєвого циклу ATI Radeon 8000 Аналогічна доля спіткала підтримку Shader Model 2.0b, реалізовану в сімействі ATI Radeon X700/X800/X850, так само як і Shader Model 2.0a, що просувається Nvidia у сімействі GeForce FX. DirectX 9 Shader Model 3.0 почала набувати скількись суттєвого поширення тільки після появи ігор-портів з ігрових приставок Microsoft Xbox 360 і Sony PlayStation 3, що було явно поза рамками життєвого циклу GeForce 6 і ранніх GeForce 7.

DirectX 10.1, став першим та останнім підмножиною DirectX 10. Офіційно він увійшов до складу Windows Vista з виходом Service Pack 1

Основні нововведення в DirectX 10.1:

Підтримка масивів кубічних карт: дозволяє досягти прийнятної швидкості під час використання глобального освітлення сцени за рахунок звернення до кількох кубічних карт за 1 прохід рендерингу. Даний метод глобального освітлення включає розрахунок непрямого розсіяного освітлення, заломлень, м'яких тіней і більш точний розрахунок відображень.
Поліпшені техніки відкладеного рендерингу та FSAA: підтримка незалежних режимів блендингу для кожного MRT, обов'язкова підтримка MSAA 4x, підтримка запису масок покриття пікселя з шейдера, pattern sample selection, вибірка з буфера мультисемплінгу, підтримка фільтрів визначення пікселів, підтримка фільтрів визначення пікселів.
Збільшено кількість регістрів вершинних шейдерів: нові специфікації забезпечують 32 регістри замість 16 у специфікаціях DirectX 10.
Підтримка Gather4: аналогічна функції Fetch4 ATI Radeon X1000, дозволяє здійснювати вибірку блоку з 4 пікселів (2х2) для однокомпонентної текстури. Служить для прискорення роботи з тіньовими картами та покращення якості тіней.
Поліпшено техніки блендингу та фільтрації: підтримка інструкції LOD, що повертає рівень деталізації для відфільтрованої текстурної вибірки, введена підтримка INT16 для блендингу та FP32 для фільтрації (INT8 та FP16 у DirectX 10)

Графічний процесор RV670 вражає розмірами ядра – при тому, що воно складається з 666 мільйонів транзисторів, його площа становить лише 192 квадратні міліметри (13.7х14 мм.). Це наочно свідчить, на що здатний новий 55-нм техпроцес. Окрім логотипу ATI та дати виготовлення, ядро ​​не несе на собі осмисленої для кінцевого користувача інформації. Наш екземпляр був виготовлений на 39 тижні 2007 року, що припав на 23-29 вересня. Оскільки для графічних процесорів ATI Radeon HD не декларуються різні тактові частоти для різних частин чіпа, незважаючи на те, що різні домени працюють на 26 різних частотах, прийнято вказувати лише "основну" частоту чіпа; для Radeon HD 3870 вона складає 775 МГц. Упаковка кристала позбавлена ​​захисної рамки, тому, при монтажі та демонтажі системи охолодження слід бути обережними, щоб уникнути скола ядра.

З точки зору конфігурації блоків відмінностей від ATI Radeon HD 2900 XT немає: чіп містить 320 ALU, згрупованих у 64 суперскалярні обчислювальні блоки по 5 ALU в кожному. При цьому 4 ALU у кожному такому блоці здатні виконувати прості інструкції типу MAD (Multiply+Add), а п'ятий, складніший, може виконувати також трансцендентні інструкції типу SIN, COS, LOG, EXP і т.д. Додатково кожен обчислювальний процесор містить блок управління розгалуженням, відповідальний виконання інструкцій управління потоком (порівняння, цикли, виклик підпрограм тощо.). Єдиною відмінністю від R600 у цьому випадку є підтримка розширених можливостей DirectX 10.1 (Shader Model 4.1)

 

Характеристики ATI Radeon HD 3870

Найменування Radeon HD 3870
Ядро RV670
Техпроцес (мкм) 0.055
Транзисторів (млн) 666
Частота роботи ядра 775
Частота роботи пам'яті (DDR) 1125 (2250)
Шина та тип пам'яті GDDR4 256 Bit
ПСП (Гб/с) 72
Уніфіковані шейдерні блоки 320
Частота уніфікованих шейдерних блоків 775
TMU на конвеєр 16 (всього)
ROP 16
Текстур за такт 16
Текстур за прохід 16
Shaders Model 4.1
Fill Rate (Mpix/s) 12400
Fill Rate (Mtex/s) 12400
DirectX 10.1
Anti-Aliasing (Max) MS-24x
Анізотропна фільтрація (Max) 16x
Обсяг пам'яті 512
Інтерфейс PCIE 2.0
RAMDAC 2x400

 

Хоча графічні карти ATI Radeon HD 3870 і ATI Radeon HD 3850 мають непогану продуктивність, позиціонування моделі HD 3870 залишило дуже неприємний осад. Як виявилося, замість конкуренції продуктів GeForce 8800 GT 512MB і Radeon HD 3870 ми отримали небажання AMD змагатися з Nvidia.ATI, як і раніше, становила конкуренцію не в швидкісному плані а в ціновому.

Need for Speed ​​Pro Street

210708143a3c

Топ матеріалів GameGPU

Топ новин GameGPU