Компания Microsoft анонсировала свои новейшие виртуальные машины Azure для высокопроизводительных вычислений (HPC) на базе специального процессора AMD, который, возможно, когда-то назывался MI300C.
Виртуальные машины Azure серии HBv ориентированы на обеспечение высокой пропускной способности памяти, что является важной характеристикой для HPC; Microsoft называет ее «самым большим узким местом HPC». Ранее Microsoft использовала серверные процессоры Milan-X и Genoa-X с 3D V-Cache от AMD для обеспечения этой дополнительной пропускной способности, но для последних ВМ HBv5 Microsoft явно хотела получить что-то еще более производительное.
Специальный процессор AMD, используемый для виртуальных машин HBv5, использует память HBM3, которая обычно используется в новейших графических процессорах класса для центров обработки данных, таких как MI300X от AMD. При пропускной способности в 6,9 ТБ/с четырех чипов в одной ВМ, ВМ почти в девять раз быстрее процессоров Genoa-X, которые Microsoft предлагает в ВМ HBv4, и почти в 20 раз быстрее чипов Milan-X в ВМ HBv3.
В паре с процессором HBM3 выполняет ту же роль, что и 3D V-Cache. Однако вместо расширения пула кэша L3 он фактически добавляет массивный кэш L4 с еще большей пропускной способностью и, предположительно, гораздо худшей задержкой. Впрочем, последнее не так важно при определенных типах нагрузок.
Каждая виртуальная машина HBv5 получает четыре таких процессора AMD, и со всеми этими благами одна виртуальная машина HBv5 предлагает 450 ГБ HBM3, 352 ядра Zen 4 с тактовой частотой до 4 ГГц и удвоенную пропускную способность Infinity Fabric, доступную на обычных процессорах Epyc. SMT (гиперпоточность), однако, отключена. В виртуальных машинах также используется 800 Гбит/с InfiniBand Quantum-2 от Nvidia для коммутации сетей.
На четыре процессора приходится 352 ядра, то есть по 88 ядер на каждый, хотя, скорее всего, не все ядра процессора задействованы в ВМ. Каждый ПЗС Zen 4 имеет либо восемь, либо 16 ядер, в зависимости от того, Zen 4 или Zen 4c; пользовательский процессор использует либо 11 ПЗС Zen 4, либо шесть ПЗС Zen 4c, при этом восемь ядер на одном ПЗС отключены. Более вероятно, что процессор имеет 96 полностью функциональных ядер, восемь из которых зарезервированы для работы с виртуальной машиной, возможно, в роли оркестровщика или гипервизора.
Возможно, этот «пользовательский» процессор AMD не такой уж и пользовательский, поскольку он очень похож на прошлогодний чип MI300C, о котором ходили слухи. Ожидалось, что этот процессор будет по сути APU MI300A, но оснащенный исключительно ПЗС Zen 4 вместо графики CDNA 3, что позволит создать 96-ядерный CPU с HBM3. Тактовая частота ядер процессора MI300A составляет 3,7 ГГц, что не так уж далеко от частоты процессора, используемого в HBv5, и указывает на то, что пользовательский процессор Azure и MI300C могут быть одним и тем же.
Однако, несмотря на то, что процессор HBv5 не является специальным с технической точки зрения, это все же эксклюзивный процессор Microsoft. «Он доступен только в Azure», - сказал инженер Microsoft Гленн Локвуд на канале Bluesky, отвечая на вопрос пользователя о том, станет ли процессор AMD когда-нибудь доступен в виде обычного процессора Epyc.
По словам инженера по памяти AMD Фила Парка, если процессор HBv5 ранее был MI300C, то AMD, возможно, изначально хотела продавать его широкой публике, но не смогла найти для него рынок.
«Почему мы не увидели EPYC+HBM раньше? EPYC был ориентирован на рынки больших объемов, вот почему вы не видите EPYC с более чем 2 сокетами», - написал Парк на сайте Bluesky. «Вы не можете поменять контроллеры DDR5, добавить контроллеры/стеки HBM и на этом закончить. HBM заставляет выбирать определенные конструктивные решения (например, каждый стек HBM3 требует шестнадцати 64-битных каналов)».
«Гибкость: с HBM вы не сможете увеличить емкость или создать более дешевые версии с меньшим количеством каналов», - добавил он. «Как правило, процессорам не требуется такая большая пропускная способность».
Это объяснение согласуется с пока еще короткой историей процессоров, оснащенных HBM. Intel уже выпустила процессоры с поддержкой HBM на базе Sapphire Rapids под названием Xeon Max, которые используются в суперкомпьютере Aurora и также доступны для широкой публики.
Однако в прошлом году Intel подтвердила, что версии Xeon Max на базе Emerald Rapids не будет, и пока неясно, получит ли Granite Rapids вариант Xeon Max, что может свидетельствовать о том, что они не имели большого коммерческого успеха. Прагматичным решением для AMD, возможно, было заключить сделку с Microsoft и сосредоточить производство MI300C на Azure.
Оригинал
Уникальность