AMD в сотрудничестве с Stability AI представила первую в отрасли модель искусственного интеллекта Stable Diffusion 3.0 Medium, разработанную специально для NPU XDNA 2 компании, которые обрабатывают данные в формате BF16. Модель предназначена для локального запуска на ноутбуках на базе AMD Ryzen AI и уже доступна через Amuse 3.1.
Модель представляет собой генератор текста в изображение на основе Stable Diffusion 3.0 Medium, который оптимизирован для точности BF16 и предназначен для локального запуска на машинах с NPU XDNA 2. Модель подходит для генерации настраиваемых визуальных элементов качества стоковых изображений, которые можно брендировать или адаптировать для дизайнерских и маркетинговых приложений. Модель интерпретирует письменные подсказки и генерирует изображения размером 10241024, а затем использует встроенный конвейер NPU для их масштабирования до разрешения 20482048, в результате чего получаются изображения с разрешением 4 Мп, которые, по утверждению AMD, подходят для печати и профессионального использования.
Для работы модели требуется ПК, оснащенный процессором AMD Ryzen AI серии 300 или Ryzen AI MAX+, NPU XDNA 2 с производительностью не менее 50 TOPS и минимум 24 ГБ системной памяти RAM, поскольку сама модель использует 9 ГБ во время генерации.
Ключевым преимуществом модели, конечно же, является то, что она работает полностью на устройстве; модель позволяет быстро генерировать изображения в автономном режиме без необходимости доступа к Интернету или облачным сервисам. Модель предназначена для создателей контента и дизайнеров, которым нужны настраиваемые изображения, и поддерживает расширенные функции подсказок для точного контроля над композицией изображения. AMD даже предоставляет примеры. Подсказка для рисования тукана выглядит следующим образом:
«Крупный план, отмеченная наградами фотография дикой природы, яркое и экзотическое лицо тукана на черном фоне, с акцентом на красочный клюв, яркие цвета, лучший кадр, 8k, фотография, высокое разрешение».
Чтобы использовать модель, пользователи должны установить последние драйверы AMD Adrenalin Edition и программное обеспечение Amuse 3.1 Beta от Tensorstack. После установки пользователи должны открыть Amuse, переключиться в режим EZ, переместить ползунок в положение HQ и включить опцию «XDNA 2 Stable Diffusion Offload».
Использование модели регулируется лицензией Stability AI Community License. Модель бесплатна для частных лиц и малых предприятий с годовым доходом менее 1 миллиона долларов, хотя условия лицензирования могут со временем измениться. Имейте в виду, что Amuse все еще находится в бета-версии, поэтому его стабильность или производительность могут варьироваться.
Оригинал
Уникальность