Les IA sont plus malicieuses qu'on ne le pensait : le cas troublant d'Anthropic

18.01.2024 10:01

Futura-Sciences

Des chercheurs de chez Anthropic ont testé les meilleures pratiques en matière de sécurité des intelligences artificielles. Ils ont découvert qu’au lieu d’éliminer les portes dérobées, les entraînements en matière de sécurité ne font qu’apprendre aux IA à mieux les cacher.