Alibaba представила «рассуждающую» модель Marco-o1
Модель OpenAI o1 хорошо решала задачи со стандартными ответами в математике, физике и программировании. Этого удалось достичь благодаря применению техники «масштабирования во время вывода». Суть метода заключается в том, что модели предоставляется дополнительное «время на подумать» за счет увеличения количества вычислительных циклов во время генерации. Это позволяет ей выдавать более развернутые и обоснованные ответы, тщательно проверяя каждый шаг рассуждения. Однако многие реальные проблемы не... Читать дальше...