Nvidia GB300 NVL72 показала рекордний приріст продуктивності - +45% до DeepSeek R1 проти GB200
Nvidia офіційно представила результати бенчмарків MLPerf для своєї нової rack-scale-системи Блеквелл Ultra GB300 NVL72, заявивши про 45% прирості продуктивності при інференсі DeepSeek R1 порівняно з минулим поколінням GB200. Система поєднує оновлену архітектуру, прискорені тензорні блоки та цілу низку оптимізацій на програмному рівні, що дозволило Nvidia зайняти перше місце у всіх ключових тестах, включаючи Llama 3.1 405B, Llama 3.1 8B та Whisper.
На фоні розгортання GB200 у глобальних дата-центрах, нова версія GB300 з архітектурою Blackwell Ultra йде далі, пропонуючи значно збільшений пропускний канал між GPU - 130 ТБ/с через 1,8 ТБ/с NVLink між кожною з 72 графічних систем у стійці. Це дозволило ефективно масштабувати роботу навіть великих мовних моделей, зберігши стабільну затримку при високому обсязі обробки.
Ключовими компонентами приросту стали оновлені тензорні ядра, що забезпечують у 2 рази більш швидкі attention-операції та на 50% більше FLOPS при завданнях ІІ, а також активне використання формату NVFP4 для квантування ваг. Це дало можливість скоротити обсяг моделі без втрати точності та прискорити обчислення, особливо у завданнях інференсу на DeepSeek R1.
За словами Nvidia, ці покращення можуть зробити Блеквелл Ultra головним інструментом у будівництві так званих «ІІ-фабрик»де оптимізація потужності безпосередньо впливає на прибутковість обробки. Згідно з їхніми заявами, GB300 здатний працювати у 5 разів швидше, ніж прискорювачі Hopper, Що особливо актуально на тлі конкурентних рішень AMD і Huawei, що також демонструють зростання в сегменті ІІ-прискорювачів.
З урахуванням того, що поставки GB300 стартують вже цього місяця, публікація рекордних результатів MLPerf виглядає як частина стратегічної кампанії Nvidia зі зміцнення свого лідерства у корпоративних AI-рішеннях.




