gamegpu

tg2 f2 lin2 in2 tw2 y2  p2 тільки steam2
 

Особливості архітектури GeForce GTX 280

 

Найбільш продуктивним одночіповим рішенням досі був GeForce GTX 280 - має 240 шейдерних процесорів, 80 текстурних процесорів, підтримує до 1 Гб відеопам'яті. Фактично сучасне графічне ядро ​​сімейства GeForce GTX 200 можна представити як універсальний чіп, який підтримує два різні режими – графічний та обчислювальний. Архітектуру чіпів сімейств GeForce 8 і 9 зазвичай представляють масивами масштабованих процесорів (Scalable Processor Array, SPA). Архітектура чіпів сімейства GeForce GTX 200 заснована на доопрацьованій та покращеній архітектурі SPA, що складається з ряду так званих "кластерів обробки текстур" (TPC, Texture Processing Clusters) у графічному режимі або "кластерів обробки потоків" у режимі паралельного обчислення. 
 

1

При цьому кожен модуль TPC складається з масиву потокових мультипроцесорів (SM, Streaming Multiprocessors), і кожен SM містить вісім процесорних ядер, які також називаються потоковими процесорами (SP, Streaming Processor), або тредовими процесорами (TP, Thread Processor). Кожен SM також включає процесори текстурної фільтрації для графічного режиму, також використовується для різних операцій фільтрації в обчислювальному режимі.


Нижче представлена ​​блок-схема GeForce 280 GTX у традиційному графічному режимі.

3

Перемикаючись у обчислювальний режим, апаратний диспетчер потоків (вгорі) керує тредами TPC.

4

Кластер TPC при найближчому розгляді: розподілена пам'ять кожного SM; кожне процесорне ядро ​​SM може розподіляти дані між іншими ядрами SM за допомогою розподіленої пам'яті без необхідності звернення до зовнішньої підсистеми пам'яті.

Таким чином, уніфікована шейдерна та комп'ютерна архітектура NVIDIA використовує дві абсолютно різні обчислювальні моделі: для роботи TPC використовується MIMD (multiple instruction, multiple data), для обчислень SM - SIMT (single instruction, multiple thread), просунута версія SIMD (single instruction, multiple data).
Стосовно загальних характеристик, у порівнянні з попередніми поколіннями чіпів сімейство GeForce GTX 200 має такі переваги:

Можливість обробки втричі більшої кількості потоків даних за одиницю часу
Новий дизайн планувальника виконання команд, з підвищеною на 20% ефективністю обробки текстур
512-бітний інтерфейс пам'яті (384 біта у попереднього покоління)
Оптимізований процес z-вибірки та компресії для досягнення кращих результатів продуктивності при високих роздільних здібностях екрану екрану
Архітектурні вдосконалення для збільшення продуктивності при обробці тіней
Повношвидкісний блендинг буфера кадрів (проти напівшвидкісного у 8800 GTX)
Вдвічі збільшений буфер команд для підвищення продуктивності обчислень
Подвоєна кількість регістрів для більш оперативного обчислення довгих та складних шейдерів
Подвоєна точність обчислення даних з плаваючою комою відповідно до стандарту версії IEEE 754R
Апаратна підтримка 10-бітового кольору (тільки з інтерфейсом DisplayPort)

Так виглядає список основних характеристик нових чіпів:

Підтримка NVIDIA PhysX
Підтримка Microsoft DirectX 10, Shader Model 4.0
Підтримка технології NVIDIA CUDA
Підтримка шини PCI Express 2.0
Підтримка технології GigaThread
Двигун NVIDIA Lumenex
128-бітові обчислення з плаваючою комою (HDR)
Підтримка OpenGL 2.1
Підтримка Dual Dual-link DVI
Підтримка технології NVIDIA PureVideo HD
Підтримка технології NVIDIA HybridPower

Окремо зазначено, що DirectX 10.1 сімейством GeForce GTX 200 не підтримується. Причиною названий той факт, що при розробці чіпів нового сімейства, після консультацій з партнерами, було прийнято сконцентрувати увагу не на підтримці DirectX 10.1, поки що мало затребуваного, а на покращенні архітектури та продуктивності чіпів.

Заснована на пакеті фізичних алгоритмів, реалізація технології NVIDIA PhysX є потужним фізичним двигуном для обчислень в реальному часі. В даний час підтримка PhysX реалізована у більш ніж 150 іграх. У поєднанні з потужним GPU, двигун PhysX забезпечує значне збільшення фізичної обчислювальної потужності, особливо в таких моментах як створення вибухів з розльотом пилу та уламків, персонажів зі складною мімікою, нових видів зброї з фантастичними ефектами, реалістично одягнених або розривних тканин, туману та диму з динамічним обтіканням об'єктів.

До реалізації фізичних ефектів в іграх вже давно прагнуть багато девелоперів та розробників ігор. З кожним роком цей напрямок стає все актуальнішим. У сучасних іграх взаємодія об'єктів з навколишнім середовищем здійснюється силами двох двигунів, що набрали найбільшої популярності - Havok і PhysX.

Havok є найстарішим двигуном, на якому пишеться чимало ігор під PC та консолі. Ще далекого 2006 року, тоді ще незалежна ATI, демонструвала прискорення фізичних ефектів силами відеокарт Radeon X1900XT. Однак пізніше Havok купила компанія Intel, яка заявила, що фізичні ефекти розраховуватимуться цим двигуном силами процесорів.

5

PhysX було розроблено компанією AGEIA, яка реалізовувала "фізику" акселераторами власної розробки. Але так склалося, що, незважаючи на велику популярність цього движка серед розробників ігор, реалізація фізичних ефектів в іграх силами спеціалізованих прискорювачів виявилася дуже спірною.

І ось минулого року компанія NVIDIA купила AGEIA PhysX. Було зроблено заяву, що за допомогою оптимізації драйверів двигун PhysX буде адаптований під використання відеокарт GeForce 8800GT і вище.

Ще одна важлива новація – нові режими економії енергії. Завдяки використанню прецизійного 65 нм техпроцесу та нових схемотехнічних рішень вдалося досягти більш гнучкого та динамічного контролю енергоспоживання. Так, споживання сімейства графічних чіпів GeForce GTX 200 в режимі очікування або в режимі 2D становить близько 25 Вт; при відтворенні фільму Blu-ray DVD – близько 35 Вт; при повному 3D навантаженні TDP не перевищує 236 Вт. Графічний чіп GeForce GTX 200 може зовсім відключатися завдяки підтримці технології HybridPower з материнськими платами на HybridPower-чіпсетах nForce з інтегрованою графікою (наприклад, nForce 780a або 790i), при цьому потік графіки незначної інтенсивності просто обраховується GPU. Крім цього, GPU сімейства GeForce GTX 200 також мають спеціальні модулі контролю енергоспоживання, покликаними відключати блоки графічного процесора, не задіяні в даний момент.

6

Користувач може конфігурувати систему на базі двох або трьох відеокарт сімейства GeForce GTX 200 в режимі SLI під час використання материнських плат на базі відповідних чіпсетів nForce. У традиційному режимі Standard SLI (з двома відеокартами) декларується приблизно 60-90% приріст продуктивності в іграх; у режимі 3-way SLI – максимальна кількість кадрів за секунду при максимальних роздільних здібностях екрану екрана.

В рамках анонсу нової серії графічних процесорів сімейства GeForce GTX 200 компанія NVIDIA пропонує зовсім по-новому поглянути на роль центрального та графічного процесорів у сучасній збалансованій настільній системі. Такий оптимізований ПК, що базується на концепції гетерогенних обчислень (тобто обчислень потоку різнорідних різнотипних завдань), на думку фахівців NVIDIA, має набагато більш збалансовану архітектуру та значно більший обчислювальний потенціал. Мається на увазі поєднання центрального процесора з порівняно помірною продуктивністю з найбільш потужною графікою або навіть SLI-системою, що дозволяє досягти пікової продуктивності в найважчих іграх, 3D та медіа додатках.

інтенсивні обчислення за допомогою сучасних графічних відеокарт давно не новина, але саме з появою графічних процесорів сімейства GeForce GTX 200 компанія NVIDIA очікує значного підвищення інтересу до технології CUDA.

CUDA (Compute Unified Device Architecture) - обчислювальна архітектура, націлена на вирішення складних завдань у споживчій, діловій та технічній сферах - у будь-яких додатках, що інтенсивно оперують даними, за допомогою графічних процесорів NVIDIA. З погляду технології CUDA новий графічний чіп GeForce GTX 280 – це ні що інше як потужний багатоядерний (сотні ядер!) процесор для паралельних обчислень.


Як було зазначено вище, графічне ядро ​​сімейства GeForce GTX 200 можна представити як чіп, що підтримує графічний та обчислювальний режими. В одному з цих режимів - "обчислювальному", той же GeForce GTX 280 перетворюється на програмований мультипроцесор з 240 ядрами і 1 Гб виділеної пам'яті - такий собі виділений суперкомп'ютер з продуктивністю під терафлоп, що в рази підвищує результативність роботи з додатками, що добре розпаралелює , кодування відео, наукові обчислення та ін.


Графічні процесори сімейств GeForce 8 і 9 стали першими на ринку, що підтримують технологію CUDA, зараз їх продано понад 70 млн штук і інтерес до проекту CUDA постійно зростає. Детальніше дізнатися про проект та завантажити файли, необхідні для початку роботи, можна тут. Як приклад на наведених нижче скріншотах показані приклади приросту продуктивності обчислень, отримані незалежними користувачами технології CUDA.

7

Порівняно з попереднім лідером GeForce 8800 GTX новий флагманський процесор GeForce GTX 280 має в 1,88 разу велику кількість процесорних ядер; здатний обробляти приблизно 2,5 більше тредів на чіп; має подвоєний розмір файлових регістрів і підтримкою обчислень з плаваючою комою з подвоєною точністю; підтримує 1 Гб пам'яті із 512-бітним інтерфейсом; обладнаний більш ефективним диспетчером команд та покращеними комунікаційними можливостями між елементами чіпа; покращеним модулем Z-буфера та компресії, підтримкою 10-бітної палітри кольорів і т.д.


 Вперше нове покоління чіпів GeForce GTX 200 спочатку позиціонується не тільки як потужний 3D графічний акселератор, але також як серйозне комп'ютерне рішення для паралельних обчислень.

Характеристики NVIDIA GeForce GTX 280

Найменування GeForce GTX 280
Ядро GT200 (D10U-30)
Техпроцес (мкм) 0.065
Транзисторів (млн) 1400
Частота роботи ядра 602
Частота роботи пам'яті (DDR) 1107
Шина та тип пам'яті GDDR3 512-bit
ПСП (Гб/с) 141,67
Уніфіковані шейдерні блоки 240
Частота уніфікованих шейдерних блоків 1296
TMU на конвеєр 80
ROP 32
Shaders Model 4.0
Fill Rate (Mtex/s) 48160
DirectX 10
Інтерфейс PCIe 2.0

Революції не відбулося, новий графічний процесор GT200 та протестована сьогодні відеокарта GeForce 280GTX(285GTX, 295GTX) є подальшим розвитком уніфікованої шейдерної архітектури від компанії NVIDIA. Новий графічний процесор містить більше функціональних блоків, ніж у попередників, що дає йому право називатися найпотужнішим GPU на сьогоднішній день.

Коментарі (0)

Топ матеріалів GameGPU

Starfield тест GPU/CPU...

Starfield тест GPU/CPU...

01 Вер 2023 | RPG/Role playing
Перегляди : 61057
Alan Wake 2 тест GPU/CPU...

Alan Wake 2 тест GPU/CPU...

27 жовтня 2023 | Action / FPS / TPS
Перегляди : 51182
The Last of Us Part I тест GPU/CPU...

The Last of Us Part I тест GPU/CPU...

29 березня 2023 | Action / FPS / TPS
Перегляди : 48617
Resident Evil 4 тест GPU/CPU...

Resident Evil 4 тест GPU/CPU...

24 березня 2023 | RPG/Role playing
Перегляди : 35485