Meta была одной из первых компаний, создавших несколько лет назад свои чипы на базе RISC-V для выводов ИИ, чтобы сократить расходы и уменьшить зависимость от Nvidia. По сообщению Reuters, компания сделала еще один шаг вперед и разработала (предположительно при содействии Broadcom) собственный ускоритель для обучения ИИ. Если чип будет соответствовать целям Meta, она сможет уменьшить зависимость от высококлассных графических процессоров Nvidia AI - таких как H100/H200 и B100/B200 - для обучения продвинутых моделей на больших языках.
Meta и Broadcom запустили первый ускоритель обучения искусственному интеллекту Meta совместно с TSMC; последняя выпустила первые рабочие образцы этих чипов, и партнеры успешно довели устройство до ума, говорится в отчете. К настоящему времени Meta начала с ограниченного развертывания ускорителя, оценивая его производительность перед масштабированием производства и развертывания. Неизвестно, проводят ли инженеры Meta бенчмарки на новом чипе; он уже развернут для выполнения некоторой полезной работы.
Технические характеристики чипа неизвестны, но обычно в чипах для обучения ИИ используется конструкция, известная как систолический массив. Эта архитектура состоит из структурированной сети одинаковых вычислительных элементов (ВЭ), расположенных в ряд и столбцы. Каждый элемент обрабатывает вычисления, связанные с матрицами или векторами, а данные последовательно проходят через сеть.
Пользовательский ускоритель RISC-V для ИИ
Поскольку процессор предназначен для обучения ИИ, что означает обработку огромных объемов данных, ожидается, что он будет оснащен памятью HBM3 или HBM3E. Учитывая, что мы имеем дело с процессором, изготовленным на заказ, Meta определила поддерживаемые форматы данных и инструкции, чтобы оптимизировать размер корпуса, энергопотребление и производительность. Что касается производительности, то ускоритель должен обеспечивать конкурентоспособные показатели производительности на ватт с современными AI GPU Nvidia, такими как H200, B200 и, возможно, следующее поколение B300.
Чип является последним дополнением к программе Meta's Meta Training and Inference Accelerator (MTIA). Программа сталкивалась с различными неудачами, в том числе когда разработка останавливалась на разных этапах.
Например, компания прекратила выпуск своего внутреннего процессора для обработки выводов после того, как он не смог достичь целевых показателей производительности и энергопотребления в ходе ограниченных тестов на развертывание. Эта неудача заставила Meta изменить свою стратегию в 2022 году, разместив крупные заказы на графические процессоры Nvidia, чтобы удовлетворить свои неотложные потребности в обработке ИИ.
Стремление Meta к аппаратной независимости ИИ
С тех пор Meta стала одним из крупнейших клиентов Nvidia, приобретя десятки тысяч графических процессоров. Эти устройства сыграли решающую роль в обучении моделей ИИ для рекомендаций, рекламы и серии моделей Llama Foundation. Кроме того, графические процессоры «зеленой» компании использовались в процессах вывода, поддерживая взаимодействие более трех миллиардов ежедневных пользователей на платформах Meta, сообщает Reuters.
Несмотря на эти проблемы, Meta продолжает развивать свою программу по производству кремния на заказ. В прошлом году Meta начала использовать чип MTIA для задач вывода, а в будущем руководство Meta наметило планы начать использовать свои заказные чипы для обучения ИИ к 2026 году. Планируется постепенное расширение использования, если чип будет соответствовать целевым показателям производительности и энергопотребления, что является важным компонентом долгосрочной цели Meta по разработке более специализированных аппаратных решений для своих центров обработки данных.
Интересно отметить, что ускорители MTIA для выводов используют ядра RISC-V с открытым исходным кодом. Это позволяет компании Meta настраивать архитектуру набора инструкций по своему усмотрению, чтобы удовлетворить свои требования, но, с другой стороны, ей не нужно платить лицензионные отчисления третьей стороне. Неясно, основан ли обучающий ускоритель MTIA также на ISA RISC-V, но это возможно. Если это так, то Meta, возможно, разработала один из самых производительных в отрасли чипов на базе RISC-V.
Оригинал
Уникальность