Компания Nvidia анонсировала два продукта: GB200 NVL4, монструозный модуль с четырьмя GPU B200 и двумя процессорами Grace, и H200 NVL PCIe GPU, предназначенный для центров обработки данных с воздушным охлаждением.
Суперчип GB200 Grace Blackwell NVL4 - это еще более мощный вариант стандартного (не NVL4) двухпроцессорного модуля, включающий в себя четыре графических процессора B200 Blackwell, соединенных между собой интерфейсом NVLink, и два процессора Grace на базе ARM, расположенных на одной материнской плате. Решение предназначено для HPC и AI-гибридных рабочих нагрузок и оснащено огромным объемом когерентной памяти в 1,3 ТБ. Nvidia рекламирует GB200 NVL4 как имеющий в 2,2 раза большую производительность при моделировании, в 1,8 раза большую при обучении и в 1,8 раза большую при выводе данных, чем Nvidia GH200 NVL4 Grace Hopper Superchip - его прямой предшественник.
Nvidia утверждает, что суперчип GB200 NVL4 будет доступен во 2 полугодии 2024 года у различных поставщиков, таких как MSI, Asus, Gigabyte, Wistron, Pegatron, ASRock Rack, Lenovo, HP Enterprise и других.
На противоположной стороне спектра находится двухслотовый графический процессор Nvidia H200 NVL с воздушным охлаждением, поддерживающий интерфейс PCIe 5.0 (128 ГБ/с). Кулер оптимизирован для монтажа в стойку и имеет сквозной дизайн, при котором воздух поступает справа налево; вентилятора нет.
Производительность немного хуже, чем у вышедшей модели Nvidia H200 в форм-факторе SXM. Производительность H200 NVL составляет 30 TFLOPS в FP64 и 60 TFLOPS в FP32. Производительность тензорного ядра оценивается в 60 TFLOPS в FP64, 835 TFLOPS в TF32, 1 671 TFLOPS в BFLOAT16, 1 671 TFLOPS в FP16, 3 341 TFLOPS в FP8 и 3 341 TFLOPs в INT8.
Однако Nvidia утверждает, что H200 NVL намного быстрее, чем H100 NVL, который он заменяет. Он имеет в 1,5 раза больший объем памяти и в 1,2 раза большую пропускную способность, обеспечивая в 1,7 раза более высокую производительность в вычислениях и в 1,3 раза более высокую производительность в рабочих нагрузках HPC. Nvidia также провела сравнение с Ampere, заявив, что H200 NVL в 2,5 раза быстрее, чем аналогичные GPU Ampere.
Графический процессор H200 NVL PCIe оптимизирован для подавляющего большинства конфигураций центров обработки данных, включая серверные стойки с воздушным охлаждением. Nvidia утверждает, что, согласно проведенному исследованию, около 70 % корпоративных стоек используют воздушное охлаждение и мощность 20 кВт или меньше.
Графический процессор PCIe позволяет поставщикам услуг центров обработки данных повторно использовать существующие стойки и заменять только графические процессоры, сокращая количество отходов и значительно снижая затраты на обновление оборудования. H200 NVL также оснащен интерфейсом NVLink, обеспечивающим пропускную способность до 900 ГБ/с на каждый GPU и позволяющим поставщикам систем подключать до четырех GPU в одной стойке для повышения производительности.
Новый GPU Nvidia с воздушным охлаждением появился в то время, когда графические процессоры Blackwell компании Nvidia испытывают серьезные проблемы с перегревом. Несмотря на использование полноценных систем жидкостного охлаждения, системные интеграторы вынуждены перепроектировать серверные стойки с GPU Blackwell из-за огромного количества тепла, рассеиваемого GPU в стойках, потребляющих до 120 КВт. H200 NVL даже близко не конкурент B200, но GPU Nvidia с воздушным охлаждением для дата-центров подчеркивает значительные преимущества графических процессоров с воздушным охлаждением, потребляющих мало энергии.
H200 NVL будет доступен у различных поставщиков, таких как Dell, HP Enterprise, Lenovo и Supermicro. Кроме того, новый GPU будет доступен в платформах от Aivres, ASRock Rack, Asus, Gigabyte, Ingrasys, Inventec, MSI, Pegatron, QCT, Wistron и Wiwynn.
Оригинал
Уникальность