Генеральный партнер Andreessen Horowitz и член совета директоров Mistral Анжни «Анж» Мидха впервые заметил потрясающую производительность DeepSeek полгода назад, рассказывает он TechCrunch. Тогда DeepSeek представила Coder V2, который соперничал с GPT4-Turbo от OpenAI в специфических задачах, связанных с кодированием, согласно документу, выпущенному компанией в прошлом году.
По его словам, это поставило DeepSeek на путь выпуска улучшенных моделей каждые пару месяцев вплоть до R1. R1 - это новая модель с открытым исходным кодом, которая потрясла технологическую индустрию, предлагая производительность, соответствующую промышленным стандартам, за меньшую цену. Несмотря на распродажу акций Nvidia, Мидха говорит, что R1 не означает, что основополагающие модели ИИ перестанут тратить миллиарды на чипы GPU и строить новые центры обработки данных так быстро, как только могут.
Это значит, что они будут делать больше с теми вычислительными мощностями, которые смогут получить. Когда люди говорят: «О, Эндж, Mistral собрал миллиард долларов», - он говорит. «Значит ли DeepSeek, что все эти миллиарды долларов совершенно не нужны? Нет, на самом деле для них чрезвычайно ценно то, что они могут посмотреть на повышение эффективности DeepSeek, внедрить его, а затем вложить в него миллиард долларов». Он добавляет: «Теперь мы можем получить в 10 раз больше продукции с одного и того же компьютера».
Это не значит, что Mistral безнадежно отстает от конкурентов OpenAI и Anthropic, утверждает он. Каждый из них собрал гораздо больше миллиардов, чем Mistral. По сообщениям, OpenAI ведет переговоры о привлечении еще 40 миллиардов долларов. По его словам, Mistral остается конкурентоспособной по сравнению с ними, потому что она с открытым исходным кодом. И его логика действительно имеет под собой основания. Открытый исходный код дает компании доступ к практически бесплатному техническому труду тех, кто хочет помочь, потому что пользуется проектом.
Конкуренты с закрытым исходным кодом охраняют свои секреты и вынуждены платить за весь труд, а также за вычислительные мощности. «Вам не нужно 20 миллиардов долларов. Вам просто нужно больше вычислительных мощностей, чем любому другому приложению с открытым исходным кодом. Так что Mistral позиционируется . У них больше всего вычислительных мощностей, чем у любого другого поставщика приложений с открытым исходным кодом», - говорит Мидха о своей портфельной компании. Llama от Facebook, крупнейший западный конкурент Mistral по разработке моделей ИИ с открытым исходным кодом, также получит дополнительные инвестиции.
Генеральный директор Марк Цукерберг в среду заявил, что он по-прежнему планирует потратить «сотни миллиардов долларов» на ИИ. В том числе 60 миллиардов долларов в 2025 году на капитальные затраты, в основном на центры обработки данных. Программа совместного использования графических процессоров Oxygen компании a16z «переполнена» У Мидхи, который также является членом совета директоров компании Black Forest Labs, занимающейся созданием искусственных изображений, и производителя 3D-моделей Luma (а также ангелом в ИИ-компаниях Anthropic, ElevenLabs и других), есть еще одна причина, по которой он не видит, что голод ИИ на GPU в ближайшее время ослабнет.
Он возглавляет программу Oxygen компании a16z. Графические процессоры, особенно современные H100 от Nvidia, стали настолько дефицитным товаром, что полтора года назад венчурная компания взяла дело в свои руки. Она закупила их в большом количестве для своих портфельных компаний. Сейчас Oxygen «перегружена. Я не могу выделить достаточно средств», - смеется Мидха. Его стартапам нужны графические процессоры не только для обучения моделей ИИ, но и для запуска текущих продуктов ИИ для клиентов.
«Сейчас существует ненасытный спрос на выводы, на потребление», - объясняет он. Именно поэтому он считает, что инженерные прорывы DeepSeek не изменят Stargate. Речь идет о крупном партнерстве OpenAI с SoftBank и Oracle на сумму 500 миллиардов долларов, о котором было объявлено ранее в этом месяце, для создания центров обработки данных искусственного интеллекта. Главное изменение, которое принесет DeepSeek, - это признание национальными государствами того, что ИИ - это следующая основополагающая инфраструктура, такая же, как электричество и интернет.
Мидха хочет, чтобы они задумались о «независимости инфраструктуры», как он это называет. Хотят ли они полагаться на китайские модели с их цензурой и когтями в их данных? Или им нужны западные модели, которые следуют западным законам и этике и соблюдают соглашения НАТО? Очевидно, что он выступает за то, чтобы западные страны использовали западные модели, такие как его парижская компания Mistral. Сотни компаний разделяют эту озабоченность и уже заблокировали DeepSeek, который является одновременно сервисом потребительских приложений и моделью с открытым исходным кодом. Не все разделяют этот страх перед китайскими моделями с открытым исходным кодом.
Оригинал
Уникальность