Исследовательская группа UCCL Калифорнийского университета в Беркли разработала библиотеку mKernel для ускорения обмена данными между графическими процессорами в многоузловых системах.
Библиотека объединяет в единое ядро CUDA три компонента: внутриузловую коммуникацию через NVLink, межузловой обмен по протоколу RDMA и вычислительные операции. По информации разработчиков, такой подход позволяет снизить задержки при передаче данных между GPU.
mKernel реализована как постоянное ядро CUDA, которое остается активным на графических процессорах и управляет коммуникацией без необходимости переключения контекста. Это позволяет избежать накладных расходов на синхронизацию между отдельными операциями.
Разработка ориентирована на системы с несколькими GPU на одном узле и кластеры с множеством узлов. Библиотека предназначена для приложений, требующих интенсивного обмена данными, таких как распределенное обучение нейронных сетей и обработка больших объемов информации.
Университет позиционирует mKernel как инструмент для исследователей и разработчиков, работающих с высокопроизводительными вычислениями. Проект размещен в открытом доступе для использования в научных целях.
Источник: Marktechpost
Реклама: 🔥 Хочешь получить Telegram Premium и стать гуру Polymarket? Кликай сюда!