HiSilicon Ascend 910C от Huawei - это версия процессора Ascend 910 для обучения ИИ, представленная в 2019 году. К настоящему времени производительности Ascend 910 едва хватает для экономически эффективного обучения больших моделей ИИ. Тем не менее, по данным исследователей из DeepSeek, когда дело доходит до выводов, он обеспечивает 60 % производительности H100 от Nvidia. Хотя Ascend 910C не является чемпионом по производительности, он может добиться успеха в снижении зависимости Китая от графических процессоров Nvidia.
Тестирование, проведенное DeepSeek, показало, что процессор 910C превзошел ожидания по производительности вычислений. Кроме того, с помощью ручной оптимизации ядер CUNN его эффективность можно еще больше повысить. Встроенная поддержка процессоров Ascend в DeepSeek и репозиторий PyTorch позволяют без особых усилий конвертировать CUDA в CUNN, что упрощает интеграцию оборудования Huawei в рабочие процессы ИИ.
Это говорит о том, что возможности ИИ-процессоров Huawei быстро развиваются, несмотря на санкции со стороны правительства США и отсутствие доступа к передовым технологическим процессам TSMC.
Хотя Huawei и SMIC удалось догнать возможности TSMC в эпоху 2019-2020 годов и выпустить чип, который можно считать конкурентоспособным с процессорами Nvidia A100 и H100, Ascend 910C - не лучший вариант для обучения ИИ. Обучение ИИ остается областью, где Nvidia сохраняет неоспоримое лидерство.
Ючен Джин (Yuchen Jin) из DeepSeek говорит, что надежность в долгосрочном обучении - это критическая слабость китайских процессоров. Эта проблема обусловлена глубокой интеграцией аппаратной и программной экосистемы Nvidia, которая создавалась на протяжении двух десятилетий. Хотя производительность вычислений может быть оптимизирована, устойчивые учебные нагрузки требуют дальнейших улучшений в аппаратном и программном стеке Huawei.
Как и в оригинальном Ascend 910, в новом Ascend 910C используется чиплетная упаковка, а его основная вычислительная SoC содержит около 53 миллиардов транзисторов. Если оригинальный чиплет Ascend 910 был изготовлен компанией TSMC по технологии N7+ (7-нм техпроцесс с EUV), то чиплет Ascend 910C изготовлен компанией SMIC по технологии 2-го поколения 7-нм техпроцесса, известной как N+2.
Заглядывая в будущее, некоторые эксперты предсказывают, что по мере перехода моделей ИИ на архитектуры-трансформеры важность экосистемы программного обеспечения Nvidia может снизиться. Опыт DeepSeek в оптимизации аппаратного и программного обеспечения также может значительно снизить зависимость от Nvidia, предложив компаниям, работающим в сфере ИИ, более экономически эффективную альтернативу, особенно в области вычислений. Однако, чтобы конкурировать на мировом уровне, Китай должен преодолеть проблему стабильности обучения и продолжать совершенствовать свою вычислительную инфраструктуру ИИ.
Оригинал
Уникальность