Среди опасений, высказанных в отношении проекта Stargate, в котором участвуют OpenAI, Oracle и SoftBank, были скудные подробности об инфраструктурной поддержке. Постепенно компании раскрыли свои намерения, и во вторник OpenAI и Oracle объявили о планах построить дополнительные 4,5 гигаватта (ГВт) инфраструктуры дата-центра Stargate в США, в результате чего общая запланированная мощность OpenAI превысит 5 ГВт. Интересно, что SoftBank не участвует в финансировании этого строительства, несмотря на то, что является частью проекта Stargate.
Согласно условиям плана, объявленного в январе, OpenAI, Oracle и Softbank планируют построить 20 центров обработки данных площадью 500 000 квадратных футов (46 450 квадратных метров) каждый. Однако было неясно, как они намеревались обеспечить питание центров обработки данных, поскольку, похоже, инфраструктура США не имеет достаточных резервных мощностей для питания дополнительных серверов ИИ, систем охлаждения и сетевого оборудования, используемых в центрах обработки данных ИИ, если не будет построена какая-то дополнительная инфраструктура.
Объявленные 4,5 ГВт инфраструктуры действительно относятся в первую очередь к доступности электроэнергии, которая в настоящее время является одним из ограничивающих факторов развития ИИ.
OpenAI утверждает, что расширенная инфраструктура мощностью 5 ГВт позволит ее дата-центрам питать более двух миллионов процессоров ИИ, хотя компания не раскрывает, предназначена ли эта инфраструктура для поддержки процессоров Blackwell Ultra мощностью 1,4 кВт или процессоров Rubin Ultra мощностью 3,6 кВт. Если инфраструктура мощностью 5 ГВт будет питать только графические процессоры ИИ, то она сможет питать 3,571 миллиона графических процессоров Blackwell Ultra или 1,388 миллиона графических процессоров Rubin Ultra. Однако ускорители искусственного интеллекта обычно потребляют только половину всей мощности дата-центра, без учета эффективности использования энергии (PUE), поэтому фактическое количество поддерживаемых графических процессоров будет меньше.
Новые объекты мощностью 4,5 ГВт могут быть построены в таких штатах, как Техас, Мичиган, Висконсин и Вайоминг, хотя точные места еще не определены. Это в дополнение к существующему объекту, который строится в Абилине, Техас, и который OpenAI считает объектом для проверки концепции, чтобы убедиться в своей способности развертывать инфраструктуру в больших масштабах и с высокой скоростью. OpenAI считает, что опыт, полученный в Абилине, поможет в реализации последующих объектов.
Части объекта в Абилине — Stargate I — уже запущены в эксплуатацию, поскольку Oracle в прошлом месяце приступила к установке серверных стоек на базе платформы Nvidia GB200. OpenAI начала использовать эту инфраструктуру для проведения ранних этапов обучения ИИ и задач инференции в рамках своих исследовательских инициатив нового поколения.
Оригинал
Уникальность