OpenAI vient de franchir une nouvelle étape dans la course à l'intelligence artificielle en dévoilant GPT-5.4, son modèle le plus puissant à ce jour. Présenté comme le fer de lance de la productivité professionnelle, son lancement laisse entrevoir un changement dans la stratégie de l'entreprise, qui cible désormais ouvertement les entreprises et les utilisateurs exigeants plutôt que le grand public.
GPT-5.4 se décline en plusieurs versions: une édition standard, une version Thinking orientée raisonnement avancé, et une version Pro taillée pour les performances maximales sur des tâches approfondies. La version Thinking, qui devient le nouveau mode par défaut dans ChatGPT, se démarque par une fonctionnalité inédite. Elle présente d'abord un plan d'action avant de générer sa réponse, vous permettant d'intervenir et de réorienter le modèle en cours de route, sans tout recommencer depuis le début. Cette capacité d'interactivité pendant sa réflexion représente un vrai renouveau. L'IA n'est plus un oracle qui rend son verdict en une fois. Elle devient un collaborateur avec lequel on peut dialoguer en temps réel.
Des performances en nette progression
Sur le plan des benchmarks, les résultats sont impressionnants. GPT-5.4 obtient des scores record sur des tests de référence comme OSWorld-Verified et WebArena Verified, qui évaluent la capacité des modèles à utiliser des ordinateurs. Il affiche également 83% sur le GDPval, un test mesurant les performances sur des tâches de travail intellectuel. Sur la création de documents comme des présentations ou des tableurs, il passe de 68,4% à 87,3% par rapport à GPT-5.2, une nette progression. L'entreprise insiste également sur sa fiabilité accrue. Les erreurs factuelles dans les réponses sont réduites de 18%, et les affirmations individuelles erronées de 33%. OpenAI revendique ainsi le titre de modèle le plus factuel de son catalogue, une ambition claire dans un secteur encore marqué par le problème des hallucinations.
La grande nouveauté: l'utilisation native d'un ordinateur
GPT-5.4 est le premier modèle d'OpenAI à intégrer nativement des capacités d'utilisation d'un ordinateur. Concrètement, il peut écrire du code pour piloter un navigateur via des bibliothèques comme Playwright, mais aussi émettre directement des commandes clavier et souris en réponse à des captures d'écran. Cette évolution le positionne au cœur de la vision agentique que l'entreprise américaine cherche à construire, soit des assistants capables d'agir de façon autonome sur plusieurs applications simultanément pour accomplir des tâches avancées.
Une stratégie commerciale assumée
Le déploiement reflète une orientation stratégique évidente. La version Thinking est réservée aux abonnés Plus, Team et Pro, tandis que la version Pro n'est accessible qu'aux plans Pro et Enterprise. Les utilisateurs gratuits sont pour l'instant laissés de côté. Côté API, le modèle supporte des fenêtres de contexte allant jusqu'à un million de tokens, un record pour OpenAI, et introduit un nouveau système appelé Tool Search qui optimise l'utilisation des outils disponibles, réduisant les coûts et la latence. Malgré tout, le prix par million de tokens d'entrée monte à 2,50 dollars contre 1,75 pour GPT-5.2.
Ce pivot vers les professionnels n'est pas anodin. Avec 25 milliards de dollars de revenus annualisés mais des déficits persistants et plus de 1 400 milliards d'engagements en infrastructure, OpenAI cherche à construire un modèle économique viable. La productivité en entreprise semble être le terrain sur lequel elle entend gagner cette bataille.


Commentaires