OpenAI представила модель o3-pro: мощнее, но медленнее предшественника
O3-pro — это новая версия o3 от OpenAI, модели рассуждений, представленной стартапом в этом году. В отличие от традиционных ИИ-моделей, «рассуждающие» решают задачи пошагово. Это позволяет им надёжнее работать в таких областях, как физика, математика и программирование.
У o3-pro есть доступ к ряду мощных инструментов, которые позволяют ей искать информацию в интернете, анализировать файлы, обрабатывать визуальные данные, использовать Python и персонализировать ответы с помощью памяти. Однако у модели есть и свой недостаток: ответы o3-pro обычно генерируются дольше, чем у её предшественницы, o1-pro.
Есть и другие ограничения. Временные чаты с новой моделью в ChatGPT сейчас недоступны — OpenAI решает «техническую проблему». O3-pro не умеет генерировать изображения. Кроме того, функция Canvas не поддерживается.
Вместе с тем, o3-pro демонстрирует впечатляющие результаты в популярных бенчмарках ИИ. Например, в тесте AIME 2024, который оценивает математические способности моделей, O3-pro превосходит ведущую модель Google — Gemini 2.5 Pro. Также o3-pro опережает недавно вышедшую модель Anthropic, Claude 4 Opus, в GPQA Diamond — тесте, проверяющем научные знания уровня доктора наук.
В ходе экспертных оценок o3-pro последовательно превосходила o3 во всех проверенных категориях. Это особенно касалось таких областей, как наука, образование, программирование, бизнес и помощь в написании текстов. Рецензенты отметили ясность, полноту, точность следования инструкциям и общую достоверность o3-pro.
O3-pro станет доступна для пользователей ChatGPT Pro и ChatGPT Team вместо предыдущей версии o1-pro. Корпоративные клиенты (Enterprise) и образовательные пользователи (Edu) получат доступ на неделю позже. Кроме того, модель уже интегрирована в API OpenAI для разработчиков. O3-pro оценивается в $20 за миллион входных токенов и $80 за миллион выходных токенов в API. Миллион входных токенов эквивалентен примерно 750 000 слов, что немного длиннее «Войны и мира».