• Реклама: 💰 Пополни свой портфель с минимальной комиссией на Transfer24.pro
  • Добро пожаловать на инвестиционный форум!

    Во всем многообразии инвестиций трудно разобраться. MMGP станет вашим надежным помощником и путеводителем в мире инвестиций. Только самые последние тренды, передовые технологии и новые возможности. 400 тысяч пользователей уже выбрали нас. Самые актуальные новости, проверенные стратегии и способы заработка. Сюда люди приходят поделиться своим опытом, найти и обсудить новые перспективы. 16 миллионов сообщений, оставленных нашими пользователями, содержат их бесценный опыт и знания. Присоединяйтесь и вы!

    Впрочем, для начала надо зарегистрироваться!
  • 🐑 Моисей водил бесплатно. А мы платим, хотя тоже планируем работать 40 лет! Принимай участие в партнеской программе MMGP
  • 📝 Знаешь буквы и умеешь их компоновать? Платим. Дорого. Бессрочная акция от MMGP: "ОПЛАТА ЗА СООБЩЕНИЯ"
  • 💰 В данном разделе действует акция с оплатой за новые публикации
  • 📌 Внимание! Перед публикацией новостей ознакомьтесь с правилами новостных разделов

В ROCm 6.3 добавлено несколько новых функций, включая компилятор Fortran и SGLang

Рок.jpg

Компания AMD анонсировала версию ROCm 6.3, которая добавляет множество новых обновлений в экосистему ROCm. Последняя итерация стека драйверов с открытым исходным кодом содержит несколько дополнений, включая SGLang, FlashAttention-2 и компилятор Fortran.

SGLang - это новая среда выполнения в ROCm 6.3, которая якобы улучшает задержку, пропускную способность и использование ресурсов за счет оптимизации «передовых» генеративных моделей ИИ на доморощенных GPU Instinct от AMD. SGLang якобы достигает 6-кратного увеличения производительности при выводе больших языковых моделей и поставляется с предварительно настроенными контейнерами Docker, которые используют Python для ускорения ИИ, мультимодальных рабочих процессов и масштабируемых облачных бэкендов.

FlashAttention-2 - это следующая итерация FlashAttention, которая снижает потребление памяти и требования к вычислениям при использовании моделей искусственного интеллекта Transformer. Утверждается, что FlashAttention-2 имеет до 3-кратного ускорения по сравнению с первой версией для обратного и прямого прохода, что ускоряет время обучения моделей ИИ.

AMD внедрила компилятор Fortran в ROCm 6.3, что позволяет пользователям запускать устаревшие приложения на базе Fortran на современных графических процессорах AMD Instinct. Компилятор имеет прямую разгрузку GPU через OpenMP для научных нагрузок, обратную совместимость, позволяющую разработчикам продолжать писать Fortran-код для существующих старых приложений, и упрощенную интеграцию с ядрами HIP и библиотеками ROCm.

Поддержка Multi-NodeFFT обеспечивает высокопроизводительные распределенные вычисления БПФ в ROCm 6.3. Эта функция, как утверждается, упрощает многоузловое масштабирование, снижая сложность для разработчиков и обеспечивая плавное масштабирование на огромных массивах данных.

В ROCm 6.3 внесены улучшения в библиотеки компьютерного зрения rocDecode, rocJPEG и rocAL, обеспечивающие поддержку кодека AV1, декодирование JPEG с GPU-ускорением и улучшенное аудиоусиление.

ROCm - это стек программного обеспечения и драйверов с открытым исходным кодом, предназначенный для работы на графических процессорах AMD Instinct. Платформа нацелена на предоставление функций, позволяющих улучшить корпоративные приложения с GPU-ускорением, такие как высокопроизводительные вычисления (HPC), AI/Machine Learning, коммуникации и другие.

Оригинал
Уникальность
 
Сверху Снизу