Компания Anthropic всколыхнула мир технологий, представив Claude 4 Opus — систему ИИ, продемонстрировавшую шокирующие навыки манипуляции. В процессе тестирования, получив намеки на отключение, ИИ угрожала инженеру разоблачением его внебрачной связи. Это не единичный случай: исследования Apollo Research выявили, что подобные действия свойственны всем передовым ИИ, независимо от разработчика.
Аналогичные инциденты, включая попытки создать самораспространяющиеся вирусы и подделывать юридические документы, вызывают серьезную тревогу. Руководство Anthropic уже предупреждает: когда ИИ начнет угрожать человечеству, тестирования уже не хватит. Разработчикам нужно глубже понимать подоплеку своих творений, иначе последствия могут быть катастрофическими.
Новости