[Blog] Je pense que vous me testez !

Anthropic (acteur majeur de l’industrie de l’IA générative) a récemment publié son tout nouveau modèle : Claude Sonnet 4.5. Déjà largement adopté dans le monde des développeurs informatiques, cette version est annoncée comme étant dotée de capacités de programmation vraiment exceptionnelles.

Et de fait, ses performances sont tellement remarquables que le modèle comprend désormais lorsqu’on est en train de le tester, rendant son évaluation très compliquée. En effet, non seulement le modèle saisit quand il est dans un environnement de test, mais il est aussi capable de modifier son comportement pour adopter une attitude particulièrement polie, prudente, voire irréprochable, faussant ainsi les résultats des évaluations.

Lire l’article complet sur le blog

Publié : 10 mois ago on 13 octobre 2025
Par : Attac-Liege
Dernière modification : mars 25, 2026 @ 9:12 am
Catégorie : Analyses

[Blog] Je pense que vous me testez !

Soutenez-nous

Lettre d’information

Contactez-nous:

A la une !