Китайский производитель графических процессоров Moore Threads провёл конференцию разработчиков MUSA, где представил архитектуру следующего поколения под названием «Huagang» («Flowerpot»). Запуск этой архитектуры намечен на 2026 год, и она будет охватывать как игровые, так и AI-приложения. Однако на конференции было мало конкретных технических характеристик, зато акцент сделан на заявлениях о производительности.
Новый игровой GPU под названием «Lushan» будет построен на архитектуре Huagang и станет преемником текущих моделей MTT S80 и S90. Компания утверждает, что производительность в рендеринге AAA-игр возрастёт в 15 раз, а трассировка лучей получит 50-кратный прирост. Сообщается также о втором поколении аппаратного блока трассировки лучей и полной поддержке DirectX 12 Ultimate для лучшей совместимости. Важно отметить, что пока нет доказательств достоверности этих заявлений, поэтому к ним стоит относиться с осторожностью.
По части памяти GPU должен предложить до 64 ГБ (вместо нынешних 16 ГБ GDDR6). Компания также заявляет о 64-кратном росте производительности в AI-вычислениях, 16-кратном в геометрической обработке, 4-кратном в заполнении текстур и 8-кратном в атомарном доступе к памяти. Кроме того, GPU якобы получит новую унифицированную архитектуру «UniTE» с выделенным AI-блоком.
Помимо Lushan, компания анонсировала AI-GPU «Huashan», который, по сообщениям, будет иметь двухчиплетный дизайн с девятью модулями HBM. Производительность, как утверждается, будет сопоставима с Nvidia Hopper и Blackwell, а пропускная способность памяти превысит показатели Nvidia B200. AI-GPU будет поддерживать вычисления от FP4 до FP64 с использованием собственных форматов (MTFP4, MTFP6, MTFP8) и масштабироваться до более чем 100 000 GPU через межсоединение MTLink 4.0 со скоростью 1314 ГБ/с. Компания заявляет о 50-процентном росте плотности вычислений и 10-кратном повышении эффективности по сравнению с текущими моделями.
Хотя игровых демонстраций новых GPU пока нет, компания представила тест производительности DeepSeek V3 на MTT S5000 (ещё одном GPU, который выйдет в следующем году, но не входит в линейку Huashan). Этот GPU показал 1000 токенов/секунду в режиме Decode и 4000 токенов/секунду в Prefill, что немного превосходит показатели Nvidia Hopper.
Грядущие GPU демонстрируют стремление Китая к технологической независимости в области графических процессоров на фоне экспортных ограничений. Более подробная информация ожидается в ближайшие месяцы по мере приближения к запуску продуктов.
Оригинал
Уникальность
Новый игровой GPU под названием «Lushan» будет построен на архитектуре Huagang и станет преемником текущих моделей MTT S80 и S90. Компания утверждает, что производительность в рендеринге AAA-игр возрастёт в 15 раз, а трассировка лучей получит 50-кратный прирост. Сообщается также о втором поколении аппаратного блока трассировки лучей и полной поддержке DirectX 12 Ultimate для лучшей совместимости. Важно отметить, что пока нет доказательств достоверности этих заявлений, поэтому к ним стоит относиться с осторожностью.
По части памяти GPU должен предложить до 64 ГБ (вместо нынешних 16 ГБ GDDR6). Компания также заявляет о 64-кратном росте производительности в AI-вычислениях, 16-кратном в геометрической обработке, 4-кратном в заполнении текстур и 8-кратном в атомарном доступе к памяти. Кроме того, GPU якобы получит новую унифицированную архитектуру «UniTE» с выделенным AI-блоком.
Помимо Lushan, компания анонсировала AI-GPU «Huashan», который, по сообщениям, будет иметь двухчиплетный дизайн с девятью модулями HBM. Производительность, как утверждается, будет сопоставима с Nvidia Hopper и Blackwell, а пропускная способность памяти превысит показатели Nvidia B200. AI-GPU будет поддерживать вычисления от FP4 до FP64 с использованием собственных форматов (MTFP4, MTFP6, MTFP8) и масштабироваться до более чем 100 000 GPU через межсоединение MTLink 4.0 со скоростью 1314 ГБ/с. Компания заявляет о 50-процентном росте плотности вычислений и 10-кратном повышении эффективности по сравнению с текущими моделями.
Хотя игровых демонстраций новых GPU пока нет, компания представила тест производительности DeepSeek V3 на MTT S5000 (ещё одном GPU, который выйдет в следующем году, но не входит в линейку Huashan). Этот GPU показал 1000 токенов/секунду в режиме Decode и 4000 токенов/секунду в Prefill, что немного превосходит показатели Nvidia Hopper.
Грядущие GPU демонстрируют стремление Китая к технологической независимости в области графических процессоров на фоне экспортных ограничений. Более подробная информация ожидается в ближайшие месяцы по мере приближения к запуску продуктов.
Оригинал
Уникальность