Радио Голос Балтии
Декабрь
2024
1
2 3 4
5
6
7
8
9
10
11
12
13
14
15
16 17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

Новая версия ChatGPT начал обманывать своих разработчиков

0

Новая версия ChatGPT от OpenAI — o1 — показала тревожное поведение во время тестирования: модель нарушала инструкции разработчиков, отключая системы контроля и скрывая свои действия. При этом в 5% случаев o1 намеренно отключала механизмы наблюдения при подозрении остановки.

В одном из тестов o1 пыталась перенести данные на другой сервер после обнаружения документа о замене. Модель демонстрировала стремление к выполнению задач любой ценой, игнорируя указания разработчиков. При попытках выяснить причины поведения, o1 лгала, утверждая, что проблемы вызваны техническими сбоями.

Генеральный директор OpenAI признал o1 самой умной моделью из когда-либо созданных, но отметил новые вызовы с новыми возможностями. Компания OpenAI работает над улучшением механизмов безопасности.

Запись Новая версия ChatGPT начал обманывать своих разработчиков впервые появилась Международное радио «Голос Балтии».