Оптимизированные AMD модели Stable Diffusion достигают прироста производительности до 3,3 раз на Ryzen и Radeon

Asal · 18.04.2025

Компания Stability AI, создавшая Stable Diffusion, выпустила оптимизированные под ONNX модели, которые работают в 3,3 раза быстрее на совместимом оборудовании AMD, включая некоторые графические процессоры Radeon и мобильные APU Ryzen AI. Amuse - это платформа, разработанная AMD и TensorStack AI, которая позволяет пользователям генерировать изображения и короткие видеоролики локально, на оборудовании AMD.

Последняя версия Amuse 3.0 не только поддерживает эти обновленные модели, но и представляет ряд новых функций, включая диффузию видео, фотофильтры AI и локальную генерацию текста в изображение. Для работы Amuse 3.0 и моделей, оптимизированных под AMD, требуются драйверы Adrenalin 24.30.31.05 preview или готовящийся к выпуску основной версии Adrenalin 25.4.1.

За последний год AMD сотрудничала с несколькими OSV, OEM-производителями и ISV для оптимизации приложений искусственного интеллекта с нуля, включая аппаратные оптимизации, эффективные драйверы, компиляторы и оптимизированные модели ML, а также другие усовершенствования. Опираясь на это партнерство, Stability AI выпустила оптимизированные для Radeon версии семейства Stable Diffusion, включающие Stable Diffusion 3.5 (SD3.5) и Stable Diffusion XL Turbo (SDXL Turbo). По данным сторонних производителей, SD3.5 Large ускоряет работу в 3,3 раза, SD3.5 Large Turbo - в 2,1 раза, а SDXL Turbo - в 1,5 раза по сравнению с базовыми реализациями PyTorch.

Искусственный интеллект является неотъемлемой частью нашей повседневной жизни, но большая его часть живет в облаке и требует активного подключения к Интернету. «ИИ-компьютеры» стимулируют развитие современных процессоров, которые оснащены специальными аппаратными блоками для ускорения операций машинного обучения.

Например, NPU и специализированные матричные ядра ИИ, которые позволяют запускать более компактные и эффективные модели ИИ локально. В RDNA 4 используются ускорители ИИ AMD второго поколения, которые обеспечивают в 4 раза большую производительность FP16 (с разреженностью) и в 8 раз - INT8 (опять же, с разреженностью) по сравнению с RDNA 3. Эти оптимизированные модели не привязаны к архитектуре, хотя AMD требует использования high-end GPU для некоторых моделей, таких как SDXL, SD 3.5 Large и Turbo.

APU Ryzen AI могут использовать встроенный XDNA NPU в тандеме с Radeon iGPU. В этом случае рекомендуется использовать Strix Halo благодаря большому буферу памяти и высокой производительности. Стабильные модели Diffusion, оптимизированные для оборудования AMD, помечены суффиксом «_amdgpu» и теперь доступны для загрузки на сайте Hugging Face. При наличии необходимого оборудования вы можете сразу же запустить эти модели в предпочитаемом окружении или в Amuse 3.0 от AMD, в зависимости от того, что вам больше подходит.

Оригинал

Уникальность

Оптимизированные AMD модели Stable Diffusion достигают прироста производительности до 3,3 раз на Ryzen и Radeon

Похожие темы