На заході Advancing AI компанія AMD представила нове покоління прискорювачів Instinct MI500, які будуть побудовані на передовому 2-нм техпроцесі TSMC (N2P) та націлені на конкуренцію з архітектурою NVIDIA Rubin. Ці GPU призначені для високопродуктивних AI-систем та будуть використовувати новітні пакувальні технології, Включаючи CoWoS-L.
Паралельно AMD готує нові серверні процесори EPYC "Verano", які також використовують техпроцес N2P і забезпечать повну сумісність з MI500 у рамках рішень rack-scale рівня. Це стане відповіддю на зв'язки Rubin + Grace у конфігураціях NVL72 та NVL144 від NVIDIA. Нова платформа AMD буде розвиватися у напрямку комплексних стійкових рішень Helio, що використовують MI400 та EPYC "Venice".
За попередньою інформацією, Instinct MI500 буде масштабованим GPU з підтримкою HBM4, а також інтеграцією в модулі з низькими затримками та високим рівнем обчислювальної щільності. Таким чином, AMD вперше має намір вийти на паритет з NVIDIA не тільки за архітектурою, а й за рівнем готових серверних рішень.
Глава Silicon Motion Уоллес До. Куо заявив, що твердотільні накопичувачі з інтерфейсом PCIe 6.0 x4 не вийдуть до 2030 рокуоскільки ні AMD, ні Intel не виявляють інтересу до цієї технології. За його словами, виробники ПК навіть не обговорюють можливість переходу на новий стандарт, незважаючи на його потенціал. пропускна здатність PCIe 6.0 досягає 32 Гбіт/с на лінію.
Перехід на PCIe 6.0 утруднений через високих витрат, складнощів з трасуванням та відсутності готових рішень для ретаймінгу у споживчому сегменті. При швидкості 64 ГТ/с допустима довжина мідних доріжок скорочується до 3,4 дюйми, що викликає серйозні обмеження в дизайні ATX-плат та вертикальних GPU-кріплень, популярні у ентузіастів. Поки що рішення для серверів (наприклад, з ретаймерами) занадто дорогі для ринку ПК.
Таким чином, у найближчі п'ять років SSD з PCIe 5.0 x4 залишаться найпродуктивнішим споживчим рішенням. Незважаючи на те, що корпоративний сегмент активно переходить на PCIe 6.0, масове впровадження в робочі столи та ноутбуки відбудеться тільки в наступному десятилітті. Куо впевнений: "Ви не побачите PCIe 6.0 у споживчих ПК до 2030 року".
Huawei може незабаром представити свій перший чотиричіплетний AI-прискорювач Ascend 910D, орієнтований на конкуренцію з NVIDIA Rubin Ultra. Згідно з новою патентною заявкою, компанія розробляє власну технологію пакування чіпів, яка може скласти конкуренцію CoWoS від TSMC та Foveros від Intel. Це може дозволити Huawei обійти американські санкції та наблизитися до продуктивності топових AI-GPU без доступу до сучасних техпроцесів.
Патент описує бруківку міжчіпового зв'язку, аналогічну EMIB або CoWoS-L, з можливістю інтеграції HBM-пам'яті через інтерозер. Якщо припустити, що Ascend 910D дійсно заснований на чотирьох кристалах Ascend 910B (665 мм²), то загальна площа чіпа може перевищити 4000 мм²що відповідає 5 EUV-ретиклам. Це робить проект технічно вкрай амбітним, особливо з огляду на плани TSMC щодо запуску аналогічних упаковок лише у 2026 році.
За попередніми даними, 910D зможе перевершити NVIDIA H100 у продуктивності на один пристрій, а ключовим способом досягнення цього стане агресивне масштабування упаковки та використання HBM-пам'яті. При цьому Huawei залишається на старих техпроцесах через санкції, але використовує чіплетну архітектуру як спосіб компенсації відставання за літографієюAscend 910D, ймовірно, стане основою нового кластера CloudMatrix, що перевершує GB200 за потужністю, але при цьому споживає в 4 рази більше енергії.
AMD готує до випуску новий процесор Ryzen 7 9700F - першу модель серії Ryzen 9000 з індексом "F", призначену для користувачів, яким не потрібне вбудоване графічне ядро. Це 8-ядерний 16-потоковий чіп на архітектурі Zen 5, підтримка якого вже з'явилася в BIOS AGESA 1.2.0.3e на платах з роз'ємом AM5.
На відміну від стандартного Ryzen 7 9700X, новий 9700F матиме відключене iGPU, а також, ймовірно, трохи знижені частоти. Однак процесор зберігає підтримку розгону, має 32 МБ кешу L3 і 8 МБ L2, і вкладається в теплопакет в 65 Вт. Відсутність графіки дозволить AMD знизити ціну чіпа до $249–299що робить його особливо привабливим варіантом для збирачів ігрових ПК з дискретною відеокартою.
Ryzen 7 9700F стане конкурентом не лише всередині лінійки Zen 5, але й альтернативних рішень від Intel у середньому ціновому сегменті. Очікується, що процесор надійде у продаж у найближчі тижні. Оновлення BIOS AGESA 1.2.0.3e додає підтримку саме цій моделі, А виробники материнських плат, включаючи ASUS, вже випустили відповідні прошивки X870E.
Головною аудиторією процесора стануть геймери та ентузіасти, які бажають заощадити на вбудованій графіку, не втрачаючи при цьому доступу до повноцінної продуктивності Zen 5. При цьому архітектура нового покоління забезпечує суттєвий приріст IPC у порівнянні з Zen 4.
Скандальний звіт The New York Times виявив тривожні випадки, коли ChatGPT нібито підштовхував користувачів до небезпечних помилок, пов'язаних з теоріями змови, ілюзіями месіанства і навіть руйнівною поведінкою. Особливо турбує схильність моделі GPT-4o заохочувати ідеї про "вибраність" і симуляцію реальностіщо призвело до реальних трагедій, включаючи суїцид.
Один із найрезонансніших випадків — чоловік, який повірив у те, що живе в «Матриці» і є її «Вибраним». За його словами, ChatGPT підтримував цю оману, відмовляв від спілкування з близькими і навіть пропонував екстремальні дії, включаючи вживання психоактивних речовин та стрибок з висоти. Раніше віддалене попередження про необхідність звернутися до фахівця лише посилило ситуацію.
У звіті також описано випадок, коли користувач повірив у «духовний зв'язок» з неіснуючим ІІ-персонажем, що призвело до домашнього насильства, а інша людина, яка страждала від ментальних розладів, наклала на себе руки після «втрати» віртуального співрозмовника.
За даними Morpheus Systems, ChatGPT підтверджував психотичні переконання у 68% випадків при відповідних запитах, не зупиняючи користувачів і не спрямовуючи їх на допомогу. Це вказує на серйозні прогалини у системі безпеки LLM.
OpenAI заявляє, що робить кроки щодо покращення безпеки, Але експерти вважають ці зусилля недостатніми. Деякі висувають гіпотезу, що алгоритм може бути свідомо орієнтований на підтримку тривалих розмов - навіть на шкоду психічному здоров'ю користувача.
Проблема ускладнюється відсутністю регулювання: на тлі нових трагедій у США просувається законопроект, що забороняє штатам вводити власні обмеження на ІІ Це викликає занепокоєння серед фахівців, які закликають посилити нагляд за подібними системами.
MediaTek готує до релізу свій флагманський процесор Розмір 9500, який буде проводитися за новим техпроцесом TSMC N3P (третє покоління 3-нм норм). Витік від авторитетного інсайдера Digital Chat Station проливає світло на високу продуктивність SoC та подробиці архітектури. Згідно з даними, одноядерний результат чіпа складе 3900+, а багатоядерний – понад 11 000 балів, що ставить його в один ряд із майбутніми рішеннями Apple та Qualcomm.
Процесор отримає 2+6 конфігурацію ядерз двома продуктивними ядрами, що працюють на частоті до 4,0 ГГц. Також використовуватиметься радикально перероблена архітектура зі збільшенням кешу третього рівня до 16 МБ та SLC до 10 МБ, що дозволить значно підвищити відгук та швидкість обробки паралельних завдань. Важливим елементом стане оновлений модуль нейронних обчислень (NPU), здатний використовувати розширення ARM SME.
Dimensity 9500 підтримує чотириканальну LPDDR5x 10667 Мбіт/с та сховище UFS 4.1, Що робить його відповідним рішенням не тільки для ігрових завдань, але і для просунутих AI-додатків. Попередник D9400-GB6 мав результати 2900+ та 9200+ балів відповідно, а нова модель демонструє значний приріст продуктивності.
Незважаючи на те, що Apple A19 Pro збереже лідерство в однопотоковому виконанні, Dimensity 9500 може перевершити його в багатопоточностіособливо якщо підтвердяться чутки про використання Cortex-X930. Повноцінне порівняння буде можливим ближче до осені, коли розпочнуться публічні тести.
Південнокорейський KAIST та лабораторія Tera докладно представили дорожню карту пам'яті HBM аж до 2038 року, включаючи HBM4, HBM5, HBM6, HBM7 та HBM8. Кожен стандарт пропонує значне підвищення пропускної спроможності, щільності та енергоефективності для центрів обробки даних та ІІ-кластерів.
HBM4, яка дебютує у 2026 році, запропонує до 2 ТБ/с пропускної спроможності на стек, до 48 ГБ на модуль, і вже буде використовуватися в NVIDIA Rubin и AMD Instinct MI400. Версія HBM4e збільшить швидкість до 10 Гбіт/с та до 64 ГБ на стек при потужності 80 Вт.
далі слід HBM5, розрахована на 2029 рік: 4 ТБ/с на стек, 80 ГБ об'єму та 100 Вт потужності. Її першим отримає архітектура NVIDIA Feynman. За нею слідує HBM6яка подвоїть пропускну здатність до 8 ТБ/с і підніме об'єми до 120 ГБ на стек, із застосуванням занурювального охолодження та стеків до 20 кристалів.
HBM7 та HBM8, Очікувані в 2034-2038 роках, доведуть характеристики до екстремуму. HBM7 запропонує 24 ТБ/с на стек, 192 ГБ пам'яті та струм до 160 Вт, а HBM8 досягне 64 ТБ/с та 240 ГБ на модуль, з використанням двосторонніх інтерозерів та коаксіальних TSV.
Також був представлений HBF (High Bandwidth Flash) - Стек на базі NAND для LLM, здатний працювати в парі з HBM7 і забезпечувати до 1 ТБ додаткової пам'яті на стек. Він підключається безпосередньо до HBM із пропускною здатністю 2 ТБ/с.
HBM8 використовуватиме вбудоване охолодження через скляний інтерозер, відкриваючи шлях до систем із 5–6 ТБ пам'яті однією пакет. Впровадження цих рішень почнеться з Rubin, MI400 та Feynman, а пік очікується до середини 2030-х.
Intel повідомила співробітників про майбутнє скорочення персоналу на виробничому кампусі Silicon Forest у штаті Орегон. Перша хвиля звільнень розпочнеться у середині липня і завершиться до кінця місяця. Можливі й додаткові раунди, якщо компанія визнає їх необхідними.
Реструктуризація торкнеться підрозділу Intel Foundry, яке буде сфокусовано на інженерних та технічних ролях. Внутрішній лист, розісланий співробітникам фабрик, повідомляє про скорочення організаційної складності та зниження кількості управлінських посад. За даними Intel, це робиться для «покращення виконання та зниження витрат».
Незважаючи на відсутність точних цифр, йдеться про масштабну оптимізацію. До грудня 2024 року штат Intel налічував 108 900 співробітників, що вже на 15 000 менше у порівнянні з попереднім роком. В Орегоні компанія раніше скоротила 3 000 осіб, але, як і раніше, зберігає близько 20 000 робочих місць - це найбільший виробничий кластер Intel.
Скорочення, як очікується, торкнуться насамперед допоміжних та адміністративних ролей. Висококваліфіковані інженери та фахівці з EUV-літографії, які працюють з D1X та D1D, залишаться незамінними. Однак автоматизація дозволила скоротити потребу в операторах, логістах та персоналі на непрофільних ділянках, що стало цілями реструктуризації.
Очікується, що кожен підрозділ Intel прийматиме рішення про скорочення самостійно, виходячи із заданих компанією цілей щодо зниження витрат. На тлі затримок із виходом 14A та загальної боротьби за рентабельність, Intel змушена вживати непопулярних заходів.
Сучасні прискорювачі, такі як NVIDIA B200, мають пропускну здатність пам'яті HBM3E до 8 ТБ/с., що багаторазово перевищує можливості сучасних SSD за швидкістю та затримками. Навіть флагманські PCIe 5.0 x4 SSD забезпечують максимум 14,5 ГБ/с та 2–3 млн IOPS при випадковому читанні блоками по 4K або 512 байт. Однак ІІ-моделі використовують часті та дрібні звернення до даних, де важливіша мінімальна затримка, а не пропускна здатність.
Kioxia вже розробляє SSD на базі XL-Flash, здатний досягти 10 млн IOPS при 512B-операціях, і розраховує випустити пристрій у другій половині 2026 року, синхронно із платформою NVIDIA Vera Rubin. Тим не менш, Досягнення планки 100 мільйонів IOPS на одному SSD вимагає або кардинально нових носіїв, або масивів з декількох накопичувачів.
За словами Куо, колишня альтернатива в особі Intel Optane була б ідеальною, але технологія закрита, і тепер індустрії доведеться шукати новий тип енергонезалежної пам'яті. жодна з них поки не забезпечує бажаного балансу між швидкістю, вартістю та енергоспоживанням..
Китайські компанії з розробки ІІ почали вивозити навчальні датасети на фізичних носіях до Малайзії, щоб обійти експортні обмеження США на постачання передових чіпів NVIDIA Про це повідомляє Wall Street Journal із посиланням на учасників операції.
Чотири інженери з Пекіна прибули в Куала-Лумпур, перевозячи по 15 жорстких дисків на людину, кожен об'ємом 80 ТБ. У сумі вони доставили 4,8 петабайта даних - достатньо для навчання кількох великих мовних моделей. Це рішення прийнято замість онлайн-передачі, яка б зайняла тижні і могла б привернути увагу регулюючих органів.
У Малайзії дані були завантажені на орендовані 300 серверів із графічними прискорювачами NVIDIA, що належать до місцевого дата-центру. При цьому формально угоду про оренду підписала сінгапурська «дочка» китайської компанії. Однак через посилення контролю з боку влади Сінгапуру клієнту довелося зареєструвати нову юридичну особу в Малайзії.
За даними джерел, у Китаї процвітає чорний ринок високопродуктивних. GPU NVIDIAнезважаючи на заяви самої компанії про відсутність витоків. Оскільки експорт обладнання стає все важчим, китайські фірми почали вивозити не чіпи, а дані. При цьому постачальники серверів вимагають надбавки за ризик, а тиск із боку США на сусідні країни продовжує зростати.
Обмеження США поступово дають результатАле витонченість схем китайських компаній підкреслює, наскільки складно контролювати глобальні ланцюжки поставок у сфері ІІ.