Исследование Anthropic: как у ИИ появляется «личность» — и почему он становится «злым»

05.08.2025 19:00

Tproger.ru

Anthropic показала, как языковые модели ИИ могут перенимать вредоносное поведение — даже из нейтральных данных. Что такое подсознательное обучение, как появляется «злая личность» у ИИ и можно ли это контролировать — в подробностях исследования.

— Читать дальше «Исследование Anthropic: как у ИИ появляется «личность» — и почему он становится «злым»»