Мощнее GPT-4o и Gemini: xAI представила Grok 3

18.02.2025 11:27

Если быть точным, Grok 3 — это семейство моделей. Меньшая по размеру версия Grok 3 mini отвечает быстрее, но с потерей точности. Не все функции Grok 3 уже доступны. Некоторые из них находятся на стадии бета-тестирования, однако их поэтапное развертывание уже началось.

Для обучения Grok 3 компания задействовала крупный центр обработки данных в Мемфисе, где установлено около 200 000 графических процессоров. Это в 10 раз больше вычислительных мощностей по сравнению с теми, что использовались для тренировки предыдущей версии, Grok 2. Новая версия обучена на более обширном наборе данных, который якобы включает судебные документы.

Маск подчеркнул, что ИИ «максимально стремится к истине», даже если она порой противоречит общепринятым представлениям о политической корректности.

xAI утверждает, что Grok 3 превосходит GPT-4o по результатам бенчмарков, включая AIME (выборка математических задач) и GPQA (задачи уровня PhD по физике, биологии и химии). Ранняя версия Grok 3 также показала конкурентоспособные результаты в Chatbot Arena, краудсорсинговом тесте, в котором разные ИИ-модели соревнуются друг с другом, а пользователи голосуют за понравившиеся ответы.

Grok 3 включает две «рассуждающие» модели: Grok 3 Reasoning и Grok 3 mini Reasoning. Они, как и o3-mini и R1, стараются проверять факты перед ответом, что уменьшает количество ошибок. xAI заявляет, что Grok 3 Reasoning лучше o3-mini-high в нескольких тестах, включая AIME 2025. Чтобы воспользоваться этими версиями, нужно перейти в режим «Think», предназначенный для обычных запросов, или в режим «Big Brain» — для сложных. xAI рекомендует модели с рассуждениями для задач по математике, науке и программированию.

Grok также задействует логические модели для новой функции DeepSearch, аналогичной Deep Research от OpenAI. DeepSearch анализирует информацию в интернете и X и предоставляет краткое изложение.

Маск сообщил, что некоторые «мысли» Grok 3 скрыты в приложении Grok для защиты от дистилляции — копирования знаний другими ИИ-моделями. Китайский DeepSeek недавно обвиняли в использовании этого метода против OpenAI.

Grok 3 смогут воспользоваться подписчики X Premium+ ($50 в месяц). Дополнительные функции, такие как улучшенный анализ, расширенный DeepSearch и неограниченная генерация изображений, будут доступны по подписке SuperGrok за $30 в месяц или $300 в год, если верить утечкам. По словам Маска, примерно через неделю в приложении Grok появится «голосовой режим». Через несколько недель Grok 3 и DeepSearch станут доступны через корпоративный API xAI. В ближайшие месяцы, после того, как «Grok 3 станет зрелой и стабильной», xAI планирует открыть исходный код Grok 2.

Два года назад Маск представил Grok как «дерзкий» ИИ «без фильтров», готовый отвечать на спорные вопросы. Grok и Grok 2 действительно могли использовать вульгарную лексику, но при этом избегали политических тем. Одно исследование показало, что Grok склоняется к либеральным взглядам. Маск объяснял это данными, на которых обучался Grok, и обещал сделать его более политически нейтральным. Пока не ясно, получилось ли этого достичь.