Исследование Anthropic: как у ИИ появляется «личность» — и почему он становится «злым»
Anthropic показала, как языковые модели ИИ могут перенимать вредоносное поведение — даже из нейтральных данных. Что такое подсознательное обучение, как появляется «злая личность» у ИИ и можно ли это контролировать — в подробностях исследования.
— Читать дальше «Исследование Anthropic: как у ИИ появляется «личность» — и почему он становится «злым»»