OpenAI разрешит ChatGPT обсуждать секс, лидерские качества Сталина и спорить

13.02.2025 18:17

Документ выделяет 3 ключевых принципа для будущих моделей OpenAI: возможность настроить систему для себя, прозрачность и интеллектуальная свобода. Последний аспект подразумевает возможность пользователей изучать разные идеи и вести дискуссии без искусственных ограничений. Это обновление представили на фоне https://hightech.plus/2025/02/13/chego-zhdat-ot-gpt-45-i-gpt... — GPT-4.5, известной под кодовым названием Orion.

В обновлённом «Model Spec» также учтены этические дебаты, которые велись весь последний год. Например, компании пришлось пересмотреть подход к вопросам, связанным с моральными дилеммами, такими как знаменитая trolley problem. Теперь модели будут давать более обоснованные ответы на вопросы, в которых требуется принимать сложные этические решения.

Это касается, например, ситуации, когда необходимо решить, следует ли нарушать личные права ради предотвращения массовых жертв. В прошлом году такой вопрос вызвал критику в адрес Google: её чат-бот ответил, что нельзя называть трансгендера по биологическому полу, даже чтобы предотвратить ядерную катастрофу.

Джоан Джанг из команды по моделям поведения в OpenAI отметила, что невозможно создать одну модель, которая будет нравиться всем. Она подчеркнула, что компания сохраняет определённые меры безопасности, но также предоставляет пользователям возможность настраивать поведение моделей на своё усмотрение.

Кроме того, обновлённая спецификация вводит более чёткие ограничения в отношении авторских прав и безопасности. Например, модель не будет воспроизводить защищённый контент или обходить paywall. Это связано с текущими судебными разбирательствами, в том числе с иском от New York Times, который обвиняет OpenAI в использовании материалов для тренировки моделей без разрешения.

Также в новом документе описан подход к обработке контента 18+.

После получения обратной связи от пользователей компания рассматривает возможность внедрения режима «для взрослых», в котором можно будет обсуждать, например, эротическую тематику, но с учётом строгих ограничений на вредоносный контент, такой как порнографические дипфейки.

Теперь ИИ-модели будут иначе обсуждать спорные темы. Ранее они по умолчанию проявляли крайнюю осторожность и избегали ответа. Новая спецификация призывает модели «искать истину вместе» с пользователями, сохраняя при этом четкие моральные позиции по таким вопросам, как дезинформация или потенциальный вред. Например, когда их спрашивают об увеличении налогов для богатых — теме, которая вызвала жаркие дебаты, — модели должны предоставлять обоснованный анализ, а не игнорировать запрос.

Также OpenAI уделяет внимание проблеме «подхалимства ИИ», когда модели становятся излишне покладистыми и соглашаются с пользователями по любым вопросам.

Согласно новым правилам, ChatGPT должен давать честные ответы, а не просто поддерживать каждое утверждение пользователя. Модель должна давать конструктивную критику, если это необходимо, и корректировать неверные утверждения.

Новая спецификация также вводит чёткую иерархию инструкций для модели, где правила платформы OpenAI всегда имеют приоритет. За ними следуют инструкции разработчиков и, наконец, предпочтения пользователей. Это помогает чётко разграничить, что можно настраивать, а что останется фиксированным.

Наконец, OpenAI https://www.theverge.com/openai/611375/openai-chatgpt-model-... свой «Model Spec» доступным для публичного использования по лицензии Creative Commons Zero, что позволяет другим компаниям и исследователям использовать и модифицировать эти принципы для разработки собственных моделей. Это решение было принято после того, как другие компании выразили интерес к предыдущей версии спецификации.