Les systèmes d'intelligence artificielle (IA) actuels, bien que puissants, ne sont pas exempts d'erreurs. Que ce soit les réponses improbables d'AI Overview (Google), les gaffes de Prometheus (Microsoft) ou les informations inexactes parfois fournies par ChatGPT, ces IA peuvent déraper. Consciente de ce défi, OpenAI a décidé de relever le gant avec CriticGPT, une IA conçue pour détecter et corriger les erreurs de ChatGPT.
CriticGPT : l'expert en détection d'erreurs
CriticGPT utilise la même base que ChatGPT-4 mais se concentre sur la détection des imperfections dans les réponses générées. Sa mission est claire : analyser les réponses et signaler les erreurs potentielles, allégeant ainsi le travail des réviseurs humains. Ce système fait partie d'une stratégie plus vaste visant à aligner les systèmes d'IA sur les attentes des utilisateurs grâce à l'apprentissage par renforcement basé sur les retours d'expérience humains.
Des résultats impressionnants
Une étude intitulée "LLM Critics Help Catch LLM Bugs" montre que CriticGPT a été entraîné sur des données contenant des erreurs intentionnelles pour affiner sa capacité à détecter et signaler une variété de bugs. Dans 63 % des cas d'erreurs naturelles, les critiques de CriticGPT ont été préférées par les évaluateurs humains, surpassant même les experts humains seuls.
Un pas vers la perfection, mais pas encore parfait
CriticGPT va au-delà de la simple correction de code. Lors de tests, il a identifié des anomalies dans des données d'entraînement de ChatGPT, considérées irréprochables par des experts humains. Près d'un quart de ces anomalies ont été confirmées, prouvant que CriticGPT peut repérer des erreurs subtiles souvent négligées.
Pour améliorer encore sa précision, les chercheurs ont développé la technique Force Sampling Beam Search (FSBS). Cette méthode permet à CriticGPT d'explorer des options moins probables pour générer des réponses, évitant ainsi les choix les plus évidents.
Cependant, CriticGPT n'est pas parfait. Il excelle dans l'analyse de réponses courtes mais pourrait être limité pour des tâches plus complexes. De plus, bien qu'il réduise les erreurs, il ne les élimine pas complètement. Les experts humains restent indispensables pour la révision finale, même s'ils peuvent encore commettre des erreurs.
Vers un futur prometteur
CriticGPT représente une avancée significative dans la quête de fiabilité des systèmes d'IA. La prochaine étape pourrait être le développement d'un modèle encore plus sophistiqué pour corriger les erreurs de CriticGPT lui-même. Seul l'avenir nous dira jusqu'où cette innovation peut nous mener.