Чому апскейлінг та генерація кадрів працюють не на всіх відеокартах
Технології апскейлінгу та генерації кадрів за останні п'ять років стали невід'ємною частиною ігрового графічного рендерингу. Вони дозволяють досягти високої якості зображення за менших витрат продуктивності, а також підвищують плавність геймплею навіть на ультра-налаштуваннях. Однак більшість подібних рішень – таких як DLSS від NVIDIA, FSR від AMD та XeSS від Intel – обмежені у сумісності: одні працюють лише на певних поколіннях GPU, Інші зовсім ексклюзивні для однієї архітектури. Чому так відбувається? У цій статті ми докладно розберемося в походженні, розвитку та апаратних обмеженнях найпопулярніших апскейлерів, щоб зрозуміти, чому вони не підтримуються на всіх відеокартах.
Як з'явилися апскейли: на прикладі DLSS та генерації кадрів DLSS
Сучасні апскейли є результатом тривалої еволюції технологій рендерингу, що почалася з простої фільтрації та згладжування і призвела до використання нейромереж та машинного навчання. Переломний момент настав у 2018 році, коли NVIDIA представила першу версію DLSS (Deep Learning Super Sampling). Хоча спочатку технологія планувалася як інтелектуальний алгоритм згладжування, її творці на чолі з Дженсеном Хуаном швидко зрозуміли, що потенціал DLSS виходить далеко за рамки простої боротьби з «драбинками» на краях об'єктів. Ставка була зроблена на підвищення продуктивності за рахунок апскейлінгу зображення з більш низької роздільної здатності до високої за збереження візуальної якості, порівнянної з нативним рендерингом.
DLSS 1.0 використовував навчені на конкретних іграх моделі нейромереж, що вимагало значних зусиль від розробників: NVIDIA мала попередньо аналізувати кожну гру і навчати модель з урахуванням унікальних характеристик сцени та поведінки камери. Це обмежувало гнучкість та викликало нарікання на адресу якості: у деяких тайтлах спостерігалася надмірна мильність чи артефакти.
DLSS 2.0 повністю змінила підхід: було створено універсальну архітектуру, яка використовує тимчасові буфери, дані руху, карти глибини та кольору, а також удосконалений алгоритм апроксимації деталей. Це дозволило суттєво покращити якість та спростити інтеграцію до ігор. DLSS 2.0 працював стабільно та якісно на безлічі проектів без додаткового навчання.
З DLSS 3 NVIDIA пішла далі: було представлено генерацію кадрів (Frame Generation), у рамках якої система не просто покращувала дозвіл, а й створювала нові кадри на основі аналізу руху між попередніми двома. Це стало можливим завдяки Optical Flow Accelerator – блоку, здатному інтерпретувати вектори руху та особливості сцени на рівні піксельних потоків. Проте повноцінна генерація кадрів вимагає як хорошого потоку даних, а й швидкого прийняття рішень у часі. Тому DLSS 3 став ексклюзивом RTX 40: архітектура Ada Lovelace дозволила досягти потрібної швидкості обробки завдяки третьому поколінню Tensor Core та Reflex-системі.
Наступний ступінь - DLSS 4 - з'явився в 2025 році і був ексклюзивним для RTX 50. У цій версії NVIDIA впровадила Multi Frame Generation — метод, у якому між кожним реальним кадром вставляється відразу кілька «передбачених» фреймів. Це стало можливим завдяки застосуванню трансформерних моделей нейромереж — тих же, що використовуються у сучасному NLP та генеративних ІІ. Для роботи таких моделей потрібні гігантські обчислювальні потужності та пропускна спроможність, а також спеціалізовані апаратні блоки для навчання та інференсу. RTX 50 вперше запропонувала такі компоненти: Tensor Core п'ятого покоління, прискорені RT-блоки та розширені кеші. Таким чином, DLSS еволюціонував від згладжування до повноцінного відеогенератора, але кожен крок уперед супроводжувався підвищенням вимог до заліза.
Як з'явився FSR та генерація кадрів FSR
AMD пішла зовсім іншим шляхом. У 2021 році компанія представила першу версію FidelityFX Super Resolution (FSR), розпочавши з максимально універсального рішення: FSR 1.0 був повністю просторовим алгоритмом апскейлінгу. Він не спирався на тимчасову інформацію, не вимагав машинного навчання та запускався на будь-якому сучасному GPU, включаючи картки NVIDIA і навіть інтегровану графіку Intel. Такий підхід забезпечив моментальне поширення технології, але якість була нижчою, ніж у DLSS.
З появою FSR 2.0 в 2022 році AMD додала в алгоритм тимчасові буфери та вектори руху. Це дало якісний стрибок в апскейлінг, зробивши зображення менш галасливим і підвищивши стабільність у динаміці. Однак FSR, як і раніше, не використовував нейромережі — його головною метою була доступність.
Це змінилося з виходом FSR 3 в 2023 році: AMD представила генерацію кадрів, за аналогією з DLSS 3. І хоча технологія залишалася «відкритою», для коректної роботи FSR 3 була потрібна більш висока продуктивність, включаючи ефективну реалізацію оптичного потоку та роботу з тимчасовими буферами. З цієї причини генерація кадрів у FSR 3 працювала далеко не на всіх GPU.
FSR 4, який вийшов у 2025 році, став ще більш вимогливим. новее. Отже, хоча основа FSR 4 залишається відкритою, її просунуті функції FG (Frame Generation) працюють виключно на останніх відеокартах AMD.
Як з'явився XeSS
XeSS (Xe Super Sampling) був представлений компанією Intel у 2022 році як відповідь на існуючі рішення від AMD та NVIDIA. На відміну від конкурентів, Intel спочатку поставила за мету зробити свою технологію універсальною та кросплатформною. XeSS використовує машинне навчання, але реалізує його з урахуванням відмінностей у апаратному забезпеченні. На відеокартах Intel Arc використовують апаратне прискорення через XMX-блоки (Xe Matrix Extensions) — спеціалізовані модулі, аналогічні Tensor Core у NVIDIA. Ці блоки призначені для швидкого виконання матричних операцій, які необхідні при інференсі нейромереж.
Для інших відеокарт XeSS підтримує fallback-режим, заснований на DP4a-інструкціях - це можливість прискореного обчислення через SIMD, що є в GPU починаючи з NVIDIA GTX 10-ї серії та AMD RDNA 1. При цьому якість зображення та продуктивність поступаються XMX-режиму. Така гнучка архітектура дозволила Intel забезпечити мінімальну сумісність із широким набором обладнання.
Intel просуває XeSS як технологію з відкритою специфікацією. Однак останні оновлення – версії 1.3 і вище – додали підтримку експериментальних функцій тимчасової генерації кадрів. Поки що вони доступні лише на графіку Intel Battlemage, де реалізовано другу версію XMX-ядер. Ці ядра отримали покращену пропускну здатність, підтримку роботи зі змінною точністю (FP8/INT4) та оптимізацію для real-time завдань.
Таким чином, хоча XeSS починався як максимально відкритий і сумісний проект, його еволюція показує, що просунуті функції теж починають вимагати апаратної підтримки. GPU, то функції, аналогічні DLSS 3 та 4, вимагають останніх графічних процесорів Intel.
Чому DLSS 1 та 2 не підтримувалися на відеокартах крім RTX
Обмеження DLSS 1 та 2 тільки на відеокартах RTX пояснюється технічною архітектурою цих рішень. Обидві версії спочатку розроблялися з опорою на Tensor Core - спеціалізовані модулі для нейромережевих операцій, які вперше представлені в архітектурі Turing. Ці ядра забезпечують високу швидкість виконання матричних множень, що необхідне виконання згорткових операцій у глибоких нейромережах.
GTX-серія (наприклад, GTX 1080 Ti) і відеокарти AMD не мають таких блоків. Навіть якщо спробувати емулювати DLSS з використанням звичайних CUDA-ядер або шейдерних блоків, продуктивність падає в десятки разів, а результат стає марним. Крім того, DLSS використовує NGX SDK (Neural Graphics Acceleration), який перевіряє наявність Tensor Core та архітектури RTX на рівні драйвера.
Таким чином, навіть за наявності потужного графічного чіпа (наприклад, TITAN V) неможливо запустити DLSS: відсутність інтеграції NGX і Tensor Core блокує доступ до API. Сторонні спроби модифікувати SDK або запускати DLSS через зовнішні методи хакерів не дають результатів, оскільки сама логіка роботи DLSS базується на тісній зв'язці заліза і програмного коду.
Чому генерація кадрів DLSS 3 підтримується на відеокартах не нижче RTX 40
Генерація кадрів DLSS 3 спирається на технологію Optical Multi Frame Flow, яка реалізована в архітектурі Ada Lovelace. Для аналізу руху між кадрами використовується Optical Flow Accelerator третього покоління – спеціалізований апаратний модуль, який відсутній у RTX 30 та молодших серіях.
Цей прискорювач розраховує вектори руху між пікселями у двох кадрах, використовуючи карти глибини, буфери швидкості та тіньові маски. Без цього модуля неможливо точно згенерувати проміжний кадр – результатом стануть візуальні артефакти та «двоєння» зображення. Саме тому RTX 30, незважаючи на наявність Tensor Core, не може підтримувати DLSS 3 Frame Generation.
Додатково DLSS 3 потребує взаємодії із системою NVIDIA Reflex. Вона синхронізує кадри між CPU та GPUзнижуючи input lag. Без Reflex використання додаткових кадрів сильно збільшувало б затримку управління. Підтримка Reflex у DLSS 3 строго пов'язана з архітектурою Ada Lovelace, що робить її неможливою на RTX 30.
Чому генерація кадрів DLSS 4 підтримується на відеокартах не нижче RTX 50
DLSS 4 вимагає архітектури Blackwell та нових Tensor Core п'ятого покоління. Ця версія використовує трансформерні моделі - складні нейромережі, здатні передбачати динаміку сцени на 3-4 кадри вперед. Для цього необхідно буферизувати кілька тимчасових шарів: оптичний потік, карти глибини, маски руху, стан частинок і поведінку камери.
Подібна багаторівнева обробка потребує високошвидкісного доступу до відеопам'яті, додаткової лінії кешування та переробленої ієрархії ALU-блоків. Всі ці компоненти вперше реалізовані тільки в RTX 50. Навіть RTX 40 з її потужною архітектурою не може забезпечити одночасну обробку 4-6 буферів в реальному часі.
До того ж DLSS 4 вимагає подвоєного пропускного каналу для операцій змішаного типу (FP16/INT8) та наявність перетворюючих модулів для адаптивної масштабованості - ці функції вбудовані в Tensor Core 5.0. Таким чином, зсув у бік Multi Frame Generation зажадав радикального оновлення архітектури, що робить DLSS 4 неможливим більш старих картах.
Чому генерація кадрів FSR підтримується на відеокартах не нижче RX 9000
FSR 4 від AMD став першим, хто запровадив адаптивну генерацію кадрів на базі ML. На відміну від FSR 3, де кадри генерувалися по жорстко заданому алгоритму з опорою на оптичний потік, FSR 4 застосовується система передбачення, що навчається, заснована на тимчасових патернах і аналізі попередніх станів сцени. Для виконання цих завдань необхідні апаратні прискорювачі ІІ - блоки AI Compute Units, що з'явилися лише в архітектурі RDNA 4.
Відеокарти серій RX 6000 і 7000 (RDNA 2 і 3) не містять цих блоків. Крім того, їм не вистачає ширини шин пам'яті, необхідної для паралельної обробки буферів руху і передбачуваних моделей. 4.
FSR 4 вимагає як мінімум 64 AI-ядра, підтримку BFLOAT16, змінну довжину інструкцій та обробку в режимі INT4 - все це з'явилося в RX 9000. Тому, незважаючи на формальну відкритість FSR, нова генерація кадрів працює виключно на останніх відеокартах AMD.
Висновок
Сучасні апскейли перестали бути простими алгоритмами розтягування картинки. Це складні системи, куди входять елементи комп'ютерного зору, аналізу руху, роботи з тимчасовими буферами і навіть трансформерні нейромережі. Тому не дивно, що для їхньої повноцінної роботи потрібне спеціалізоване апаратне забезпечення: тензорні ядра, прискорювачі оптичного потоку, AI-блоки та вдосконалені кеші. Кожна нова ітерація DLSS, FSR або XeSS піднімає планку, а й жорсткіше прив'язує технології до конкретних поколінь відеокарт. Таким чином, відсутність підтримки на старих GPU пояснюється не жадібністю виробників, а об'єктивними технічними рамками. Прогрес вимагає нових рішень — і нових чіпів, здатних справлятися зі складністю графіки, що зросла, в реальному часі.