DeepSeek выпустила новую модель большого языкового искусственного интеллекта — DeepSeek-V3.2-Exp, которая значительно снижает вычислительные затраты. Это позволяет бизнесу, использующему API компании в своих приложениях, экономить деньги, сохраняя доступ к мощному ИИ, занявшему 11-е место среди самых производительных больших языковых моделей в мире.
Эффективность достигнута благодаря архитектуре DeepSeek Sparse Attention (DSA), которая обрабатывает только наиболее релевантные токены, а не все, как в традиционных трансформерах. Это ускоряет обработку текста в пределах окна контекста в 128 тысяч токенов и снижает потребление памяти.Разработчики, использующие DeepSeek V3.2 Exp через публичный API, платят на 50% меньше, чем за предыдущую версию, при сохранении аналогичной производительности на стандартных тестах ИИ.
Модель объёмом 400 ГБ доступна для бесплатного скачивания на Hugging Face и может быть запущена локально на мощных системах с несколькими GPU Nvidia H100, H200, H20 или сервером NVIDIA B200/GB200, требуя 1.5+ ТБ видеопамяти.Для запуска на домашних ПК нужно дождаться квантованных версий модели, таких как V3.1 от unsloth на Hugging Face, и иметь видеокарту с минимум 24 ГБ памяти, например, Nvidia 5090.
Оригинал
Уникальность