NYT: нейросети не справились с «последним тестом человечества»
Все нейросети, включая последнюю версию ChatGPT, не смогли успешно пройти разработанный Центром безопасности искусственного интеллекта тест. Экзамен, названный «последним тестом человечества», стал настоящим вызовом для технологий ИИ. Тест отличается высокой сложностью и состоит из множества междисциплинарных вопросов, охватывающих физику, математику, химию и другие научные дисциплины. Дополнительным усложнением для нейросетей является необходимость анализа большого объема вспомогательных материалов, которые необходимы для ответов, пишет runews24.ru Авторы теста признаются, что справиться с ним может далеко не каждый человек — вопросы были составлены на основе сложных университетских программ. Результаты показали, что ни одна из моделей ИИ не смогла набрать более 10%. Лучшую попытку продемонстрировала новая версия ChatGPT, которая ответила на 8,3% вопросов, сообщает The New York Times.