Nvidia представила GB300 Blackwell Ultra — мощнейший ИИ-ускоритель с 20 480 CUDA, 288 Гбайт HBM3E и PCIe 6.0

Denver10 · 27.08.2025

Компания Nvidia представила новые подробности об ускорителе искусственного интеллекта GB300 Blackwell Ultra.

Он стал прямым преемником GB200, но получил заметные улучшения: увеличенное количество ядер, расширенный объем памяти, более быстрый интерфейс передачи данных и повышенную мощность.

Архитектура построена на базе двух кристаллов, включающих суммарно 208 миллиардов транзисторов, которые выпускаются по технологии TSMC 4NP. Благодаря интерконнекту NV-HBI со скоростью 10 Тбайт/с они функционируют как единый GPU.

В составе графического процессора — 160 потоковых мультипроцессоров, каждый из которых содержит 128 CUDA-ядер, что в сумме дает 20 480. Также интегрированы тензорные ядра пятого поколения с поддержкой форматов FP8, FP6 и нового NVFP4. Для каждого мультипроцессора выделено по 256 Кбайт тензорной памяти, всего 40 Мбайт. Дополнительно присутствуют блоки для специальных вычислений и операций, оптимизированных под ускорение ИИ.

Оперативная память представлена восемью 12-слойными стеками HBM3E объемом 288 Гбайт. Ширина шины осталась прежней — 8192 бита, а пропускная способность достигает 8 Тбайт/с. Благодаря увеличенному объему стало возможным хранить целые модели ИИ и обрабатывать больше данных без необходимости обращения к внешним ресурсам. Энергопотребление выросло до 1400 Вт.

Связь между графическими процессорами обеспечивает NVLink 5 с пропускной способностью 1,8 Тбайт/с в обоих направлениях. Для соединения с CPU Grace используется NVLink-C2C со скоростью 900 Гбайт/с и поддержкой общей адресации. Впервые применен интерфейс PCIe 6.0 x16 с пропускной способностью 256 Гбайт/с. Система может устанавливаться в конфигурацию GB300 NVL72 с 72 GPU, 20,7 Тбайт памяти HBM3E и общей пропускной способностью до 576 Тбайт/с. Производство ускорителей уже началось, и первые заказчики получили новые чипы.

Источник
Уникальность

Nvidia представила GB300 Blackwell Ultra — мощнейший ИИ-ускоритель с 20 480 CUDA, 288 Гбайт HBM3E и PCIe 6.0

Похожие темы