Дешевый китайский ИИ обрушил акции IT-гигантов: в чем подвох новой нейросети
В выходные китайские разработчики презентовали нейросеть DeepSeek-R1, работа которой в 100 раз дешевле аналогов.
Китайская IT-индустрия уложила на лопатки американских конкурентов, несмотря на ограничения на поставку чипов. Или это кратковременный эффект, и компании Ляна Вэньфэна еще далеко до культовых ChatGPT и GEMINI?
В выходные китайская компания презентовала новую нейросеть - DeepSeek-R1. Для её обучения использовалось 10 тысяч видеокарт nVidia A100 и около 50 000 менее мощных китайских ипов, процесс обошелся в 6 миллионов долларов. Это в 100 раз дешевле, чем обучение аналогов от GOOGLE и OpenAI. А именно стоимость обучения моделей сейчас - фактор, определяющий их широкое применение.
В понедельник на сенсацию отреагировал рынок. Акции IT-гигантов обвалились. Microsoft потеряла 4% капитализации, Oracle — 7%, GOOGLE - 5%, nVidia и вовсе 16%, это 600 миллиардов долларов. Получается, все? Как ни боролись США с китайским ИИ, ограничивая экспорт чипов в Поднебесную, китайцы "сделали" американский искусственный интеллект?
Все не так просто, рассказал наш эксперт, разработчик крупной компании Сергей Саморезов.
- Китайцы использовали распространенный сейчас способ - обучение модели на основе более крупной нейросети. То есть сначала вы обучаете очень большую нейросеть. Это дорого, но позволяет научить её избегать многих ошибок, глюков. Потом уже на её основе обучаете меньшую модель, это обходится в сотни раз дешевле.
Именно стоимость обучения меньшей модели DeepSeek-R1 и составила 6 миллионов долларов. Китайские разрабочики просто не включили сюда цену обучения более крупной нейросети. Отсюда и разница в 100 раз.
Конечно, выгода все равно есть. На основе крупной "дорогой" нейросети можно обучать десятки и сотни меньших моделей, каждый раз существенно экономя. Но так могут делать все.
- Китайский успех легко масштабируется, - считает Саморезов. - Если на своих слабых 50 тысяч чипах они показали такой результат, то крупные американские компании со своими возможностями по той же методике легко их превзойдут. Программный код открытый.
Так что все по-прежнему упирается в "железо", а именно в чипы. Не зря первой реакцией Трампа на китайский успех стало введение дополнительных пошлин на их экспорт.