CyberGhost

GPT-5.5 ne se limite pas au développement logiciel. Sur GDPval, un benchmark qui évalue la qualité du travail produit dans 44 professions différentes (comptable, juriste, analyste, et bien d’autres), il obtient 84,9 %. Sur OSWorld-Verified, qui teste si un modèle est capable d’utiliser un vrai ordinateur en autonomie, comme le ferait un humain, il atteint 78,7 % (le taux de tâches réussies). Et sur Tau2-bench Telecom, qui simule des échanges complexes dans un service client, il culmine à 98 % de précision, sans aucune adaptation préalable de ses instructions de départ.


Source:

www.clubic.com