Компания Nvidia представила новые подробности об ускорителе искусственного интеллекта GB300 Blackwell Ultra.
Он стал прямым преемником GB200, но получил заметные улучшения: увеличенное количество ядер, расширенный объем памяти, более быстрый интерфейс передачи данных и повышенную мощность.
Архитектура построена на базе двух кристаллов, включающих суммарно 208 миллиардов транзисторов, которые выпускаются по технологии TSMC 4NP. Благодаря интерконнекту NV-HBI со скоростью 10 Тбайт/с они функционируют как единый GPU.
В составе графического процессора — 160 потоковых мультипроцессоров, каждый из которых содержит 128 CUDA-ядер, что в сумме дает 20 480. Также интегрированы тензорные ядра пятого поколения с поддержкой форматов FP8, FP6 и нового NVFP4. Для каждого мультипроцессора выделено по 256 Кбайт тензорной памяти, всего 40 Мбайт. Дополнительно присутствуют блоки для специальных вычислений и операций, оптимизированных под ускорение ИИ.
Оперативная память представлена восемью 12-слойными стеками HBM3E объемом 288 Гбайт. Ширина шины осталась прежней — 8192 бита, а пропускная способность достигает 8 Тбайт/с. Благодаря увеличенному объему стало возможным хранить целые модели ИИ и обрабатывать больше данных без необходимости обращения к внешним ресурсам. Энергопотребление выросло до 1400 Вт.
Связь между графическими процессорами обеспечивает NVLink 5 с пропускной способностью 1,8 Тбайт/с в обоих направлениях. Для соединения с CPU Grace используется NVLink-C2C со скоростью 900 Гбайт/с и поддержкой общей адресации. Впервые применен интерфейс PCIe 6.0 x16 с пропускной способностью 256 Гбайт/с. Система может устанавливаться в конфигурацию GB300 NVL72 с 72 GPU, 20,7 Тбайт памяти HBM3E и общей пропускной способностью до 576 Тбайт/с. Производство ускорителей уже началось, и первые заказчики получили новые чипы.
Источник
Уникальность