DeepSeek привлек много внимания своей моделью искусственного интеллекта R1 в начале этого года, но, по данным The Information, разработка модели следующего поколения R2 застряла из-за нехватки процессоров Nvidia H20 в Китае. Сама DeepSeek не комментирует, когда модель R2 будет доступна. DeepSeek использовала кластер, состоящий из 50 000 графических процессоров Hopper, в том числе 30 000 H20, 10 000 H800 и 10 000 H100, полученных от своего инвестора High-Flyer Capital Management, для обучения своей модели R1.
Неясно, была ли модель R2 уже полностью предварительно обучена. The Information сообщает со ссылкой на двух человек, знакомых с проектом, что команда DeepSeek интенсивно работала над моделью, но генеральный директор Лиан Вэньфэн еще не удовлетворен ее возможностями. Внутри компании продолжается работа по улучшению производительности, прежде чем модель будет готова к развертыванию. R1 быстро и широко была принята рядом пользователей, включая частные стартапы, крупные компании и группы, связанные с правительством.
Большинство этих пользователей запускали модель на процессорах Nvidia H20. Теперь, когда поставки H20 ограничены, это уже вызывает проблемы, ограничивая возможности использования R1 и затрудняя подготовку к запуску R2, согласно отчету The Information. Если предстоящая модель R2 от DeepSeek превзойдет возможности доступных в настоящее время открытых альтернатив, ее использование, по мнению сотрудников этих компаний, цитируемых The Information, может превысить возможности китайских облачных платформ.
Большинство организаций, использующих более раннюю модель R1, работают с ней на процессорах Nvidia H20, которые сейчас в дефиците. В середине апреля правительство США ограничило продажи процессоров Nvidia H20 для обучения и инференции ИИ. Хотя это устройство является сильно урезанной версией популярного графического процессора H100, из-за зависимости китайских компаний, занимающихся искусственным интеллектом, от программного стека CUDA от Nvidia, H20 был довольно популярным продуктом среди таких организаций в Китайской Народной Республике, и Nvidia продавала процессоры H20 на миллиарды долларов каждый квартал.
Сообщается, что программное обеспечение DeepSeek для искусственного интеллекта оптимизировано для оборудования Nvidia, что делает компанию особенно уязвимой для политических решений США. Хотя компания утверждает, что разработала свои модели, используя гораздо меньше ресурсов, чем американские компании, такие как OpenAI, недавние ограничения на экспорт подчеркивают критическую слабость: ведущие китайские компании в области искусственного интеллекта по-прежнему сильно зависят от американского оборудования. Между тем, OpenAI неофициально обвинила DeepSeek в использовании своих проприетарных моделей при разработке R1, хотя компания публично не комментировала эти утверждения.
Оригинал
Уникальность