Huawei добавляет поддержку оптимизированного для DeepSeek вывода для своих графических процессоров Ascend AI

Asal · 30.01.2025

27 января, в тот самый день, когда цена акций Nvidia резко упала после того, как рынок в полной мере оценил значение китайского LLM для индустрии, китайская компания Huawei опубликовала статью, в которой сообщила, что дистиллированная модель ИИ R1 стала доступна бесплатно на платформе ModelArts Studio. Технологическая компания прямо заявила, что эта версия «адаптирована под Ascend», то есть под графические процессоры Ascend для центров обработки данных Huawei.

Huawei не уточняет, какие именно графические процессоры Ascend она использует в ModelArts Studio, особенно в случае с R1, но такие деятели индустрии ИИ, как Ючен Цзинь, считают, что это может быть новейший Ascend 910C. Этот новый GPU, как говорят, был представлен клиентам в сентябре, так что вполне возможно, что 910C уже добавлен в облачные серверы Huawei.

Хотя R1, как сообщается, обучался на более чем двух тысячах графических процессоров H800 от Nvidia, для Huawei важно, что графические процессоры компании имеют явную поддержку для реального выполнения LLM. Это может исключить еще одну часть процесса, в котором китайские ИИ-компании вынуждены полагаться на западные компании, в данном случае Nvidia и AMD, чьи GPU востребованы как для обучения, так и для выводов благодаря их высокой производительности. Однако Huawei, возможно, догоняет их.

«По опыту разработчиков, производительность в области вывода на Huawei 910C достигает 60 % от производительности H100», - сказал Цзинь на сайте X. „С рукописными ядрами CUNN и оптимизацией производительность выше“. Джин также отметил, что для обучения можно использовать и 910C, но официально для обучения R1 использовались чипы H800, хотя это не означает, что DeepSeek будет продолжать использовать эти H800 всегда.

Производительность - серьезная проблема для Nvidia в Китае, поскольку санкции времен Байдена, введенные правительством США, не позволяют компаниям продавать процессоры, которые считаются слишком быстрыми. Многие из лучших графических процессоров Nvidia для центров обработки данных, такие как H200 и B200, не могут быть легально экспортированы в Китай, что вынуждает Nvidia разрабатывать новые модели специально для Китая, которые лишь едва соответствуют ограничениям по производительности.

Фактически, модель H800, которую, как утверждает DeepSeek, использовали для обучения R1 LLM, была выпущена после первого раунда ограничений на экспорт графических процессоров в Китай, введенных администрацией Байдена, чтобы предложить альтернативу запрещенной модели H100. Однако H800 и другие графические процессоры Nvidia для китайского рынка были запрещены после следующего раунда санкций, который снизил предельную производительность чипов, которые можно было легально продавать в Китае.

Из-за экспортных ограничений правительства США Nvidia вынуждена конкурировать в Китае с более слабым оборудованием: флагман компании для Китая, чип H20, имеет гораздо меньше памяти, пропускной способности памяти и TFLOPs, чем H200, топовая карта на базе Hopper.

Это, очевидно, оказало реальное влияние на состояние Nvidia в Китае, и в мае 2024 года компания продавала H20 дешевле, чем Ascend 910B от Huawei. Однако во второй половине прошлого года продажи H20 были намного лучше, а в четвертом квартале выручка выросла на 50 % по сравнению с третьим кварталом, после нескольких кварталов здорового роста. В любом случае, Nvidia окажется в более выгодном положении по отношению к своим китайским конкурентам, если сможет продавать свои самые мощные GPU в Китае.

Однако дело не только в том, что Nvidia сможет конкурировать в Китае. Возможность запускать китайские LLM с передовой производительностью на китайских процессорах может стать важной вехой на пути страны к технологической автаркии. Если Ascend 910C или другой китайский GPU окажется достаточным для обучения и выводов, то потребность в процессорах вроде H20, вероятно, будет еще меньше. Конечно, Китай еще не готов полностью отказаться от западных чипов, пока не достигнет прогресса в их производстве, но такие компании, как Huawei, работают над этим.

Оригинал
Уникальность

Huawei добавляет поддержку оптимизированного для DeepSeek вывода для своих графических процессоров Ascend AI

Похожие темы