DeepSeek вызвал истерику у Американских ИИ корпораций.????????????????Первая битва???? искусственных интеллектов Китая ???????? и США ???????? выиграна "Поднебесными" у "Исключительных" с разгромным счётом
Сегодняшняя новость настолько значима, что я не могу обойти её стороной. Расскажу вам о нескольких интересных фактов, связанных с китайской нейронной сетью DeepSeek, которая буквально встряхнула мировой технологический ландшафт.
Почему модель от DeepSeek R1 за сутки стала лидером?
Успеху DeepSeek во многом способствовала новая архитектура Multi-head Latent Attention (MLA), которая позволила сократить стоимость обучения на 90%, игнорируя 95% ненужных данных. Вопрос остаётся открытым: это гениальное упрощение или просто экономия на алгоритмах? Как бы то ни было, результат поражает, что обогнала ChatGPT по всем основным бенчмаркам. Модели серии R1 обучались математике методом проб и ошибок, как аспиранты, и в итоге достигли уровня GPT-4, но при этом оказались на 95% дешевле.
В бесплатной версии ChatGPT существует ограничение на количество запросов, которые вы можете отправить. Это число варьируется в зависимости от нескольких факторов, главным из которых является длина и сложность ответа, который вы хотите получить.
В среднем, можно рассчитывать на 20-50 запросов в час. Если вы задаете короткие и простые вопросы, такие как "Какая погода сегодня?", лимит будет ближе к 50. Однако, если вам требуется развернутый и детализированный ответ на сложный запрос, например, "Напишите эссе о влиянии искусственного интеллекта на общество", количество доступных запросов может сократиться до 20 или даже меньше.
На платформе chat.deepseek.com я тестировал работу чат-бота DeepSeek и за всё время использования не столкнулся с оплатой или ограничениями. Возможно, у DeepSeek есть скрытые лимиты, но я их не достиг, даже при активной нагрузке.
Кроме того, производительность DeepSeek приятно удивила. В отличие от многих других ИИ-чатов, которые могут замедляться в часы пик или при высокой интенсивности запросов, модель R1 работала быстро и стабильно с самого начала и до конца.
Новая модель DeepSeek R1 не только догнала, но и превзошла OpenAI по ключевым показателям, при этом оставаясь открытой и невероятно доступной по цене. Стоимость обработки миллиона токенов у DeepSeek составляет всего 0,14$ в то время, как самая дорогая модель ChatGPT за аналогичный объем - 2,5$. DeepSeek имеет окно в 128 тысяч токенов, а Chat GPT всего лишь 32 тысячи токенов, и то зависит от модели. Один токен эквивалентно равен 4 символам. Вот и делайте умножения сколько глав или какого объема текста можно написать в режиме одного окна.
ПРО ЖЕЛЕЗО и ЗАТРАТЫ
DeepSeek использует всего лишь 10 тысяч видеокарт - мощности, для сравнения модель Llama от Цукерберга использует 300 тысяч видеокарт. Для обучения были использованы старые чипы Nvidia, что также помогло значительно сократить затраты (пока СМИ не уточнили, какие именно чипы). При этом стоимость создания DeepSeek составила лишь 2% от инвестиций в OpenAI - скромные $12 миллионов, что несопоставимо меньше по сравнению с $500 млн, затраченных на GPT-5 от OpenAI. Интересный факт годовая зарплата некоторых инженеров ИИ в Кремниевой долине такая же, как стоимость разработки. По моим подсчетам, 10 тысяч видеокарт это приблизительно 100 серверных стоек, поэтому коммерческие дата-центры тоже будут набирать обороты в след за ИИ.
Что происходит на рынке сейчас?
Китайский чат-бот DeepSeek мгновенно взлетел на первое место в топе AppStore в шести странах, включая США, обогнав даже ChatGPT на его родной территории.
Акции технологических гигантов, таких как Nvidia, упали на 17%, Microsoft - почти на 5%. Американский рынок в совокупности потерял 1 триллион долларов за сутки.
DeepSeek стала первой моделью с открытым исходным кодом, доступной каждому разработчику без необходимости использования VPN с производительностью наравне с моделью o1 от OpenAI.
Китай инвестирует ¥1 трлн ($137 млрд) в развитие искусственного интеллекта в ближайшие пять лет. Это решение стало прямым ответом на амбициозный проект Stargate, бюджет которого оценивается в $500 млрд. Однако, в отличие от OpenAI, которая будет получать финансирование постепенно, китайские модели ИИ могут получить значительное преимущество благодаря единовременному вливанию средств.
Этот технологический скачок вызвал настоящую истерику среди американских корпораций. Экстренные совещания, пересмотр стратегий и миллиардные инвестиции - всё это стало реакцией на неожиданное лидерство Китая. Китай не только обошёл санкции США, но и вышел вперёд в гонке искусственного интеллекта.
Чем феномен DeepSeek полезен для маленьких компаний?
Представьте, что вы разработчик или основатель стартапа, который хочет внедрить большую языковую модель в свой продукт. На сегодняшний день модели OpenAI серии o1 или GPT занимают лидирующие позиции, но их использование через API может стать серьёзным ударом по бюджету, особенно для малых и средних компаний. В этом плане DeepSeek предлагает альтернативу с гораздо более доступными тарифами, которые могут значительно сократить расходы.
$0,14 за миллион входных токенов (если запрос попадает в кэш)
$0,55 за миллион входных токенов (если запрос проходит без кэширования)
$2,19 за миллион выходных токенов
Теперь разберём, что такое входные и выходные токены. Входные токены представляют собой части текста, которые вы отправляете в модель, будь то запрос пользователя, строка кода или любой другой текст для обработки. Выходные токены - это ответ модели, то есть тот текст, который вы получаете на ваш запрос. Для понимания: 1 токен примерно соответствует 4 символам текста, включая пробелы. Например, слово "Привет!" состоит из 2 токенов, а предложение из 50 слов будет занимать около 100-120 токенов.
Стоимость токенов напрямую влияет на то, насколько рентабельным будет использование модели, особенно при массовых запросах. Например, небольшие компании, которые обрабатывают десятки тысяч запросов в день, сталкиваются с необходимостью платить высокие суммы при использовании дорогих API. В случае с DeepSeek это может означать экономию в 10-30 раз, что делает внедрение ИИ доступным даже для стартапов с ограниченными ресурсами.
Более того, низкая стоимость входных токенов при кэшировании ($0,14) является значительным преимуществом для задач, где запросы часто повторяются. Это может быть крайне полезно для чат-ботов, онлайн-помощников или аналитических систем, работающих с повторяющимися данными. Компании могут не только снизить затраты, но и инвестировать сэкономленные средства в другие аспекты своего бизнеса - будь то маркетинг, разработка или улучшение пользовательского опыта.
DeepSeek открывает двери для малых компаний и стартапов, позволяя использовать передовые технологии без колоссальных финансовых вложений, и это делает её отличным выбором для бизнеса любого масштаба.
Вывод
Соперничество между Китаем и США в сфере развития искусственного интеллекта продолжает набирать обороты, становясь всё более захватывающим и напряжённым. DeepSeek наглядно продемонстрировала, каких результатов можно достичь, придерживаясь более открытого и прозрачного подхода. Однако остаётся неясным, что именно стоит за этой прозрачностью и доступностью модели: стратегический бизнес-ход, философская убеждённость в том, что ИИ должен быть общественным благом, или же стремление получить политическое преимущество на мировой арене.
Этот вопрос остаётся открытым, но одно можно сказать с уверенностью - что мир технологий меняется с невероятной скоростью. И те, кто сегодня кажется лидером, завтра могут оказаться в роли догоняющих.
Вот ссылка на чат-бот от DeepSeek.
(https://habr.com/ru/news/...)