Мини-ПК Nvidia DGX Spark для ИИ получил свою первую премьеру на CES в этом году и был запланирован к запуску в мае на выставке, но платформа столкнулась с задержками на пути к рынку. Проблемы, препятствовавшие запуску, видимо, устранены. Nvidia объявила, что системы DGX Spark будут доступны для покупки начиная с 15 октября — как напрямую от Nvidia, так и у партнёров, включая Dell, Asus, MSI и HP.
Напоминаем: DGX Spark — это мини-ПК на базе Grace Blackwell GB10, специально адаптированный для локального ИИ-выводинга и разработки. Запуск вывода на современных передовых моделях ИИ требует гораздо большего объёма локальной памяти GPU, чем даже 32 ГБ у RTX 5090. (RTX Pro 6000 Blackwell предлагает до 96 ГБ локальной памяти GPU, но это продукт стоимостью свыше 8000 долларов без учёта хост-сервера или рабочей станции).
DGX Spark (ранее известный как Project DIGITS) включает унифицированный coherent-пул памяти LPDDR5X объёмом 128 ГБ, общий для 20-ядерного Arm-процессора Nvidia Grace и GPU Blackwell, который обеспечивает до 1 петафлопс производительности ИИ-выводинга (при условии квантования модели в FP4 со разреженностью).
Компания заявляет, что один DGX Spark поддерживает локально модели с 200 миллиардами параметров (снова при FP4-квантовании). Если одного недостаточно, два устройства можно соединить через встроенный сетевой адаптер Nvidia ConnectX 7, удвоив память и вычислительные ресурсы.
DGX Spark работает на собственной DGX OS от Nvidia (форк Ubuntu) и поддерживает ключевой стек CUDA для разработчиков ИИ. В отличие от Strix Halo, который занял нишу дорогого игрового чипа в устройствах от портативных до настольных, Arm- и Linux-ориентированность DGX Spark делает его менее подходящим для готовых игровых платформ, хотя энтузиасты, вероятно, смогут настроить игры с некоторыми усилиями.
До сих пор мини-ПК и ноутбуки на базе SoC AMD Ryzen AI Max+ 395 (он же Strix Halo) доминировали на рынке «относительно доступных чипов с огромным пулом памяти и достаточной производительностью для вывода ИИ». Strix Halo поддерживает до 112 ГБ памяти GPU (из возможных 128 ГБ встроенной RAM). Однако эти системы не поддерживают CUDA нативно, что создаёт препятствия для разработчиков и энтузиастов, желающих запустить ИИ-проекты.
Nvidia, в свою очередь, сотрудничает с широким кругом партнёров по ПО, чтобы обеспечить совместимость инструментов с DGX Spark, включая Anaconda, Cadence, ComfyUI, Docker, Google, Hugging Face, JetBrains, LM Studio, Meta, Microsoft, Ollama и Roboflow. Таким образом, если у вас есть LLM для локального запуска, DGX Spark должен стать надёжной основой.
Изначально в январе Nvidia указывала стартовую цену DGX Spark от 3000 долларов, но теперь официальная версия от самой компании будет стоить 3999 долларов. Даже по такой цене его компактный размер, скромный энергопотребление 240 Вт и полная поддержка CUDA привлекут множество поклонников в растущей сфере ИИ. Посмотрим, не стали ли задержки помехой на рынке, где всё может измениться за часы или дни.
Оригинал
Уникальность