Romain Leclaire

Tech et Culture Numérique

OpenAI rachète Promptfoo - La sécurité des agents IA devient une priorité

IA
OpenAI rachète Promptfoo - La sécurité des agents IA devient une priorité

Il y a quelques années, Ian Webster dirigeait l'équipe d'ingénierie LLM chez Discord, où il devait garantir la sécurité de produits d'IA déployés auprès de 200 millions d'utilisateurs. Face à ce challenge, il fit un constat qui allait changer la trajectoire de sa carrière. Les outils de sécurité disponibles sur le marché étaient conçus pour une époque révolue. Les scanners de vulnérabilités traditionnels ne savaient pas raisonner face à une injection de prompt. Les analyses statiques n'avaient rien à dire sur un modèle qui promettait à un utilisateur quelque chose qu'il n'avait pas le droit de lui fournir. L'infrastructure de test pour les applications d'IA n'existait tout simplement pas.

Alors il la construisit lui-même, le soir et le week-end, sous la forme d'un projet open source. Ce projet devint Promptfoo. Aujourd'hui, OpenAI a annoncé son acquisition. Les termes financiers n'ont pas été dévoilés, mais on sait que la startup avait levé au total environ 23 millions de dollars depuis sa fondation en 2024, avec notamment un tour de table de 5 millions financé par Andreessen Horowitz et une Série A de 18,4 millions menée par Insight Partners en juillet 2025. Parmi les investisseurs figuraient des noms de poids: Tobi Lütke, PDG de Shopify, Stanislav Vishnevskiy, chef des technologies chez Discord, ou encore Frederic Kerrest, cofondateur d'Okta. Sa valorisation atteignait 86 millions de dollars au moment de cette dernière levée.

Fondée avec Michael D'Angelo, ancien vice-président engineering chez la société de vérification d'identité Smile Identity, Promptfoo comptait au moment de l'achat plus de 125 000 développeurs utilisant son framework open source, ainsi que plus de 30 entreprises du Fortune 500 ayant déployé sa plateforme en production. Sa technologie sera intégrée à OpenAI Frontier, la plateforme de gestion d'agents IA pour les entreprises lancée par la firme américaine début février.

Ce que fait concrètement Promptfoo, c'est jouer les adversaires automatisés. Plutôt que de s'appuyer sur des tests de pénétration manuels, la plateforme interagit directement avec l'application IA d'un client, via son interface ou ses API, en simulant le comportement d'utilisateurs réels ou d'attaquants. Lorsqu'une attaque réussit, le système l'enregistre, analyse pourquoi elle a fonctionné, puis affine ses tests dans une boucle de raisonnement agentique pour exposer des vulnérabilités plus complexes. Les risques ciblés sont multiples: injections de prompt, fuites de données, contournements des garde-fous, mais aussi ce que Ian Webster appelle les échecs au niveau applicatif (un agent qui promet à un utilisateur quelque chose qu'il ne peut pas tenir, qui révèle des contenus sensibles à une simple requête de service client, ou qui dérive vers des opinions politiques dans un tuteur scolaire).

C'est précisément cette dimension applicative qui fait de Promptfoo une acquisition stratégiquement cohérente pour OpenAI. Frontier est conçu pour donner aux agents IA un accès à des systèmes de production, des plateformes CRM, des entrepôts de données et des outils internes, avec des capacités d'action aux conséquences bien réelles. Parmi les premiers clients cités par l'netreprise figurent Uber, State Farm, Intuit et Thermo Fisher Scientific, des organisations pour lesquelles un agent défaillant n'est pas un inconvénient mais une responsabilité juridique et financière de premier plan.

OpenAI a pris soin de préciser que Promptfoo resterait open source sous sa licence actuelle, une promesse scrutée de près par une communauté qui compte plus de 248 contributeurs. Le projet a été adopté par des équipes dans toute l'industrie de l'IA, y compris, selon le site de Promptfoo, des équipes chez Anthropic et Google, preuve que l'outil s'était imposé comme un bien commun du développement. Cette promesse doit désormais coexister avec une intégration commerciale dans l'une des plateformes d'IA d'entreprise les plus puissantes du marché.

Ce rachat intervient dans un contexte de convergence sectorielle évidente. Anthropic a lancé Claude Code Security en février, ciblant des cas d'usage similaires. Alors que les agents IA entrent massivement en production, la question de leur sécurisation est en train de devenir l'un des principaux champs de bataille commerciaux de l'IA d'entreprise. OpenAI vient d'y placer un pion majeur. 

Commentaires