Какая видеокарта наиболее быстрая для искусственного интеллекта?

1702979200742.png


Это не должно быть особенно шокирующим результатом. Nvidia внедряет технологию искусственного интеллекта через ядра Tensor со времен Volta V100 в конце 2017 года. В серии RTX эта функция была добавлена в 2018 году, с усовершенствованиями и улучшениями производительности в каждом поколении (более подробную информацию о теоретической производительности см. ниже). Благодаря последней настройке RTX 4090 смогла генерировать изображения со стабильной диффузией 512x512 со скоростью более одного изображения в секунду — 75 в минуту.

Самый быстрый графический процессор AMD, RX 7900 XTX, смог обеспечить лишь около трети этого уровня производительности со скоростью 26 изображений в минуту. Еще более тревожным, пожалуй, является то, насколько плохо работают графические процессоры серии RX 6000. RX 6950 XT выдает 6,6 изображений в минуту, что значительно отстает даже от RX 7600. Очевидно, что ускорители AMD AI Matrix в RDNA 3 помогли повысить пропускную способность при этой конкретной рабочей нагрузке.

Самый быстрый графический процессор Intel на данный момент — Arc A770 16 ГБ — обрабатывает 15,4 изображения в минуту. Имейте в виду, что теоретическая производительность оборудования немного выше, чем у RTX 2080 Ti (если сравнивать пропускную способность XMX FP16 с пропускной способностью Tensor FP16): 157,3 терафлопс против 107,6 терафлопс. Похоже, что графические процессоры Arc обеспечивают лишь менее половины своей теоретической производительности, поэтому тесты являются наиболее важным показателем реальной производительности.

Хотя между различными графическими процессорами и архитектурами существуют различия, производительность в значительной степени масштабируется пропорционально теоретическим вычислениям. В нашем тестировании RTX 4090 была на 46% быстрее, чем RTX 4080, хотя теоретически она обеспечивает на 69% большую вычислительную производительность. Аналогично, 4080 обогнал 4070 Ti на 24% и имеет на 22% больше вычислительных ресурсов.

Новые архитектуры не обязательно работают существенно быстрее. 4080 обогнал 3090 Ti на 10%, предлагая при этом потенциально на 20% больше вычислительных ресурсов. Но 3090 Ti также имеет большую пропускную способность памяти (1008 ГБ/с по сравнению с 717 ГБ/с у 4080), и это, безусловно, является важным фактором. Старое поколение Turing также выдержало: более новая RTX 4070 обогнала RTX 2080 Ti всего на 12%, теоретически с большей вычислительной мощностью на 8%.

Источник

Уникальность
 
Сверху Снизу