С тех пор как китайская компания DeepSeek выпустила открытую версию своей модели рассуждений R1 в начале этой недели, многие представители технологической индустрии стали делать громкие заявления о том, чего добилась компания и что это значит для состояния ИИ. Венчурный капиталист Марк Андреессен, например, написал, что DeepSeek - это «один из самых удивительных и впечатляющих прорывов, которые я когда-либо видел».
R1, похоже, соответствует или превосходит модель o1 от OpenAI по некоторым показателям ИИ. Компания утверждает, что обучение одной из ее моделей обошлось всего в 5,6 миллиона долларов, по сравнению с сотнями миллионов долларов, которые ведущие американские компании платят за обучение своих моделей. И, похоже, ей удалось добиться этого в условиях санкций США, запрещающих продажу передовых чипов китайским компаниям.
MIT Technology Review пишет, что успех компании иллюстрирует, как санкции «заставляют такие стартапы, как DeepSeek, внедрять инновации, в которых приоритет отдается эффективности, совместному использованию ресурсов и сотрудничеству». (С другой стороны, Wall Street Journal сообщает, что Лян Вэньфэн из DeepSeek недавно сказал премьер-министру Китая, что американские экспортные ограничения по-прежнему являются узким местом).
Генеральный директор Curai Нил Хосла предложил более простое объяснение, заявив, что компания - это «государственный псиоп», который «симулирует низкую стоимость, чтобы оправдать установление низкой цены и надеется, что все перейдут на него [чтобы] нанести ущерб конкурентоспособности ИИ в США». (К его сообщению была приложена заметка сообщества, в которой указывается, что Хосла не приводит никаких доказательств этого, и что его отец Винод является инвестором OpenAI).
Тем временем журналист Хольгер Зшапиц предположил, что DeepSeek «может представлять собой самую большую угрозу для американских фондовых рынков» - если китайская компания сможет построить передовую модель по низкой цене, не имея доступа к современным чипам, это поставит под вопрос «полезность сотен миллиардов капиталовложений, вливаемых в эту отрасль».
В ответ на это генеральный директор Y Combinator Гэрри Тан заявил, что успех DeepSeek на самом деле будет полезен для ее американских конкурентов. «Если обучение моделей будет дешеветь быстрее и проще, - написал он на сайте X, - спрос на выводы (реальное применение ИИ в реальном мире) будет расти и ускоряться еще быстрее, что гарантирует, что предложение вычислительных ресурсов будет использовано».
Главный специалист по ИИ компании Meta Ян ЛеКун не стал рассматривать анонс DeepSeek через призму сравнения Китая и США. Вместо этого он считает, что реальный урок заключается в том, что «модели с открытым исходным кодом превосходят проприетарные». «DeepSeek извлекает выгоду из открытых исследований и открытого исходного кода (например, PyTorch и Llama от Meta)», - написал ЛеКун на этой неделе в LinkedIn.
«Они придумывали новые идеи и создавали их на основе чужих наработок. Поскольку их работы опубликованы и имеют открытый исходный код, каждый может извлечь из них выгоду». Похоже, что все эти споры подталкивают потребителей к тому, чтобы попробовать продукт. По состоянию на полдень воскресенья ИИ-ассистент DeepSeek занимает первое место среди бесплатных приложений в Apple App Store, опережая ChatGPT.
Оригинал
Уникальность