gamegpu     Search find 4120

 tg2 f2 lin2 in2 X icon 3 y2  p2 тільки steam2

Radeon R9 290X

 Новий графічний чіп Hawaii, який лежить в основі відеокарти AMD Radeon R9 290X, заснований на вже відомій нам архітектурі Graphics Core Next (GCN), яка була злегка модифікована по обчислювальних здібностях і для повної підтримки всіх можливостей DirectX 11.2, як це було раніше зроблено чіпі Bonaire (Radeon HD 7790), який також став основою для Radeon R7 260X. Архітектурні зміни в Bonaire і Hawaii відносяться до поліпшень обчислювальних можливостей (підтримка більшої кількості потоків, що одночасно виконуються) і нової версії технології AMD PowerTune, про яку ми ще розповімо нижче.

Radeon R9 290X

Нові можливості DirectX 11.2 включають тайлові ресурси, які використовують апаратні особливості Hawaii щодо обмеження віртуальної пам'яті GPU, які називаються partially-resident textures (PRT). Використовуючи віртуальну відеопам'ять, легко отримати ефективну апаратну підтримку алгоритмів, що дозволяють застосовувати у додатках величезні обсяги текстур та їх підкачування (streaming) у відеопам'ять. PRT дозволяє підвищити ефективність використання відеопам'яті в таких завданнях і подібні техніки вже використовуються в деяких ігрових двигунах.

Незважаючи на те, що можливості GCN були розширені, головним завданням AMD при проектуванні нового топового GPU було покращення енергоефективності чіпа, оскільки Tahiti вже споживав надто багато енергії, а в Hawaii включили більше обчислювальних блоків. Погляньмо, що вдалося зробити інженерам компанії AMD, щоб виставити на ринок конкурентоспроможний продукт:

diag gpu small


Новий графічний процесор логічно розділений на чотири частини (Shader Engine), кожна з яких містить по 11 укрупнених обчислювальних блоків (Compute Unit), що включають і текстурні модулі, по одному геометричному процесору та розтеризатору, а також по кілька блоків ROP. Іншими словами, блок-схема найсучаснішого чіпа AMD стала ще більше схожа на схему чіпів NVIDIA, які також мають подібну організацію.

Всього до складу графічного чіпа Hawaii входить: 44 обчислювальні блоки Compute Units, що містять 2816 потокових процесорів, 64 блоки ROP і 176 блоків TMU. Розглянутий GPU має 512-бітну шину пам'яті, що складається з восьми 64-бітових контролерів, а також 1 МБ кеш-пам'яті другого рівня. Він виробляється на тому ж 28 нм техпроцесі, як і Tahiti, але містить вже 6.2 млрд. транзисторів (у Tahiti — 4.3 млрд.).

Розглянемо блок-схему шейдерного двигуна, у тому числі складається графічний процесор Hawaii. Це крупноблочна частина чіпа, який містить чотири таких движки:


Кожен із Shader Engine включає по одному геометричному процесору та розтеризатору, які здатні обробляти по одному геометричному примітиву за такт. Схоже, що геометрична продуктивність Hawaii не тільки зросла, а й має бути непогано збалансованою порівняно з попередніми GPU компанії AMD.

dx112

Шейдерний двигун архітектури GCN може містити до чотирьох укрупнених блоків Render Back-ends (RB), які включають по чотири блоки ROP кожен. Кількість обчислювальних блоків Compute Unit у складі шейдерного движка також може бути різним, але в даному випадку їх 11 штук, хоча кеші для інструкцій та констант поділяються на кожні чотири блоки Compute Unit. Тобто, логічніше було б включення до складу Shader Engine не 11, а 12 обчислювальних блоків, але схоже, що така кількість вже не входила до меж з енергоспоживання Hawaii.


Обчислювальний блок архітектури GCN включає різні функціональні блоки: модулі текстурних вибірок (16 штук), модулі текстурної фільтрації (чотири штуки), блок прогнозування розгалужень, планувальник, обчислювальні блоки (чотири векторні та один скалярний), кеш-пам'ять першого рівня (16 КБ на обчислювальний блок), пам'ять для векторних і скалярних регістрів, а також пам'ять (64 КБ на кожен Compute Unit).


Так як шейдерних двигунів в графічному процесорі Hawaii чотири, то він має чотири блоки обробки геометрії і двигунів растеризації. Відповідно новий топовий GPU компанії AMD вміє обробляти до чотирьох геометричних примітивів за такт. Крім цього, у Hawaii покращено буферизацію геометричних даних та збільшено кеші для параметрів геометричних примітивів. Все це забезпечує серйозне зростання продуктивності при великих обсягах розрахунків в геометричних шейдерах і активному використанні тесселяції.

Також деякі зміни зазнали і обчислювальні здібності нового, нехай і графічного, але все ж таки процесора. До складу чіпа входять два DMA-движки, які забезпечують повне використання можливостей шини PCI Express 3.0, заявлено двонаправлену пропускну здатність в 16 ГБ/с. Порівняно новою можна назвати і можливість асинхронних обчислень, що здійснюється за допомогою восьми (у разі чіпа Hawaii) обчислювальних двигунів Asynchronous Compute Engines (ACE).

мантія


Блоки ACE працюють паралельно з графічним командним процесором і кожен із них здатний керувати вісьмома потоками команд. Така організація забезпечує незалежне планування та роботу в багатозадачному середовищі, доступ до даних у глобальній пам'яті та L2-кеші, а також швидке перемикання контексту. Це особливо важливо в обчислювальних задачах, а також в ігрових програмах при використанні GPU і для графічних і загальних обчислень. Також це нововведення теоретично може бути перевагою при використанні низькорівневого доступу до можливостей GPU за допомогою таких API як Mantle.

Повернемося до можливостей Hawaii, які застосовуються до графічних обчислень. Через зростання вимог до дозволу з очікуваним розповсюдженням UltraHD-моніторів стає необхідним підвищення обчислювальних можливостей блоків растрових операцій - ROP. У чіп Hawaii включено 16 блоків Render Back End (RBE), що вдвічі більше, ніж Tahiti. Шістнадцять RBE містять 64 блоки ROP, які здатні обробляти до 64 пікселів за такт, і це може бути дуже корисним у деяких випадках.

Що стосується підсистеми пам'яті, то Hawaii має 1 мегабайт кеш-пам'яті другого рівня, поділений на 16 розділів по 64 КБ. Заявлено як 33% збільшення обсягу кеш-пам'яті, так і підвищення внутрішньої пропускної здатності на третину. Загальна пропускна здатність L2/L1-кешів заявлена ​​1 ТБ/с.

Доступ до пам'яті здійснюється за допомогою восьми 64-бітових контролерів, що разом складає 512-бітову шину. Мікрохеми пам'яті в Radeon R9 290X працюють на частоті 5.0 ГГц, що дає загальну пропускну здатність пам'яті в 320 ГБ/с, що більш ніж на 20% вище, ніж у Radeon HD 7970 GHz. При цьому площу чіпа, яку займає контролер пам'яті, вдалося знизити на 20%, порівняно з 384-бітним контролером у Tahiti. 

Характеристики Radeon Radeon R9 290X

Найменування Radeon R9 290X
Ядро Гаваї
Техпроцес (мкм) 0.028
Транзисторів (млн) 6200
Частота роботи ядра 1000
Частота роботи пам'яті (DDR) 5000
Шина та тип пам'яті GDDR5 512-bit
ПСП (Гб/с) 320
Уніфіковані шейдерні блоки 2816
Частота уніфікованих шейдерних блоків 1000
TMU на конвеєр 176
ROP 64
Fill Rate (Mpix/s) 64600
Fill Rate (Mtex/s) 176400
DirectX 11.2
Обсяг пам'яті 4096
Інтерфейс PCI-E 3.0 x16

Порівняно з попередником Radeon HD 7970, продуктивність Hawaii в особі Radeon R9 290X збільшиться приблизно на 40-60%.

Коментарі (0)