Historisches Wissen von KI-Chatbots noch mangelhaft
So gut manche KI-Chatbots bei vielen Aufgaben abschneiden, so durchwachsen war das Ergebnis eines Leistungsvergleichs im Hinblick auf das historische Wissen und Verständnis, den ein internationales Forscherteam unter Beteiligung des Wiener Complexity Science Hub (CSH) durchgeführt hat. Am besten unter sieben getesteten Modellen schnitt noch GPT-4 Turbo ab.