enfrdepluk
Search find 4120  disqus socia  tg2 f2 lin2 in2 X icon 3 y2  p2 тільки steam2

GeForce GTX 960

960

NVIDIA з відеокартою GeForce GTX 960 перенесла переваги архітектури Maxwell на масовий ринок. Відеокарти отримали такі плюси архітектури, як стиск пам'яті, DSR, MFAA, VXGI і DirectX 12. Для NVIDIA все більше значення мають власні API GameWorks і PhysX, новин з цього приводу поки що немає, але від їхньої підтримки виграють і покупці GeForce GTX 960.

У відеокарти GeForce GTX 960 використовується GPU GM206, мабуть, не в повній версії – під маркуванням GM206-300-A1. Кристал оснащений 2,94 млрд. транзисторів, він значно менш складний, ніж "Tahiti" або "Tonga" від AMD. Оскільки еталонної відеокарти GeForce GTX 960 не представлено, інформація про базову частоту та Boost у таблиці вище практичного значення не має. NVIDIA вказує базову частоту 1.126 МГц, а частоту GPU Boost – 1.178 МГц. 2.048 Мбайт пам'яті GDDR5 NVIDIA виставила на 1.750 МГц, пам'ять підключена за 128-бітним інтерфейсом. В результаті ми отримуємо пропускну спроможність пам'яті 112,2 Гбайт/с – трохи порівняно з конкурентами. Але не забувайте, що NVIDIA використовує технологію стиснення пам'яті, яка теоретично збільшує ефективну пропускну здатність пам'яті, але обіцяні NVIDIA 148,8 Гбайт/с все одно досягаються рідко.

діагноз 1

GPU GM206 спирається на 1.024 потокових процесора, які об'єднані у вісім блоків SMM (streaming multiprocessors), по 4x 32 потокових процесора в кожному. Чотири SMM складають кластер GPC, ми отримуємо два такі кластери на GPU. 8 (SMM) x 4 (блоки SMM) x 32 потокових процесора дають 1.024 потокових процесора.

У кожному SMM використовують вісім текстурних блоків. Відповідно, вісім SMM у GeForce GTX 960 дають 64 текстурні блоки. Два 64-бітових контролера пам'яті підключено до 32 конвеєрів растрових операцій (ROP).

смс

Більш високу ефективність Maxwell NVIDIA змогла отримати завдяки кільком рішенням. Кеш L2 в архітектурі Maxwell був збільшений до 2.048 кбайт в порівнянні з 256 кбайт в архітектурі Kepler. Пропускна здатність кешу залишилася лише на рівні 512 байт на такт. Порівняно з архітектурою Maxwell першого покоління було дещо збільшено загальну пам'ять кожного мультипроцесора SMM. Тепер вона становить уже 96 кбайт, а чи не 64 кбайт. Можна відзначити і новий двигун Polymorph Engine версії 3.0.

Двигун PolyMorph 3.0 відповідає за запити текстур, тесселяцію, налаштування атрибутів, трансформацію поля зору та потоковий висновок. Результати обчислень кластера SMM і двигуна PolyMorph 3.0 потім передаються на двигун растеризації. З другого краю етапі теселятор починає розрахунки позицій поверхонь, залежно від відстані вибирається необхідний рівень деталізації. Скориговані значення надсилаються на кластер SMM, де з ними працюють доменні та геометричні шейдери. Доменний шейдер розраховує фінальну позицію кожного трикутника, враховуючи дані Hull-шейдерів та теселяторів. На цьому етапі накладаються карти усунення. Геометричний шейдер потім порівнює розраховані дані з дійсно видимими об'єктами і відсилає результати назад на движок тесселяції для остаточного розрахунку. На останньому етапі двигун PolyMorph 3.0 виконує трансформацію поля зору та корекцію перспективи. Нарешті, розраховані дані виводяться через потоковий висновок, пам'ять звільняється подальших розрахунків.

Перейдемо до окремих блоків мультипроцесора SMM. Кожен блок із 32 потокових процесорів оснащений буфером інструкцій та warp-планувальником. Два блоки диспетчеризації працюють із 16.384 32-бітовими регістрами кожен. Якщо подивитися на архітектуру "Kepler", то 192 потокові процесори працювали з чотирма warp-планувальниками та вісьмома блоками диспетчеризації, всього було доступно 65.536 32-бітних регістрів. Теоретично на кожен потоковий процесор в архітектурі "Maxwell" припадає 512 регістрів, у "Kepler" їх кількість становила близько 341. Цей захід теж сприяв приросту продуктивності потокових процесорів до 35%.

Характеристики GeForce GTX 960

 дата релізу  22 січня 2015 року
 Стартова ціна, $  199

чіп

 Модель GPU 28nm GM206-300
 Ядра:TMUs: ROPs 1024: 64: 32

частоти

 частота GPU(boost), МГц 1127 (1178)
 Частота пам'яті (ефективна), МГц 1753 (7012)
 Продуктивність FP32, GFLOPS 2,308

Пам'ять

 Об'єм відеопам'яті, мб  2048/4096
 Шина пам'яті, біт  128
 Пропускна спроможність пам'яті, GB/s  112

Інтерфейс та TDP

 Інтерфейс PCI-Express  3.0 x16
 TDP. Вт 120

Також дещо змінилося співвідношення між потоковими процесорами та так званими спеціальними функціональними блоками (Special Function Units, SFU). В архітектурі "Kepler" співвідношення становило 6/1, у "Maxwell" воно знизилося до 4/1. Це ж стосується і співвідношення потокових процесорів і блоків читання/запису (Load/Store, LD/ST). Спеціальні блоки обчислень з подвійною точністю на діаграмі не показані, вони, швидше за все, будуть представлені в GPU GM210 (за аналогією між GK110 та GK104). Але, якщо вірити NVIDIA, співвідношення одиночної та подвійної точності становить 1/24, як і в чіпах "Kepler" першого покоління (GK104).

Невеликі зміни в порівнянні з попередньою реалізацією архітектури "Maxwell" відбулися в движку обробки відео (Video Engine). Тепер він забезпечує як апаратне кодування в H.265, а й апаратне декодування. У GeForce GTX 980 і GeForce GTX 970 також була відсутня підтримка HDCP HDMI 2.2, GeForce GTX 960 і GPU GM206 вона була додана.