Du nouveau chez OpenAI: santé mentale, intégration web pour Codex et avancées vocales
OpenAI annonce une série de nouveautés qui promet une meilleure interaction avec ses outils d’intelligence artificielle. De la mise en place d’un filet de sécurité inédit pour les utilisateurs en détresse, à l’amélioration des flux de travail des développeurs, en passant par des capacités vocales de nouvelle génération, l’entreprise confirme sa volonté d’intégrer sa technologie de manière plus sûre dans notre quotidien.
Face à l’impact grandissant des plateformes numériques sur la santé mentale, OpenAI lance une option de sécurité spécialement conçue pour les utilisateurs adultes de ChatGPT. À partir d’aujourd’hui, toute personne de plus de 18 ans peut configurer un contact de confiance depuis les paramètres de son compte. Vous pouvez désigner un proche qui pourra être averti si les systèmes automatisés de l’IA, appuyés par une équipe de modérateurs formés, détectent des discussions liées à l’automutilation.
Cette démarche répond à un besoin statistique alarmant. L’année dernière, l’entreprise américaine a révélé que 0,07% de ses utilisateurs hebdomadaires présentaient des signes d’urgences psychiatriques comme la psychose ou la manie, tandis que 0,15% exprimaient des risques de suicide ou d’automutilation, et un autre 0,15% montrait une dépendance émotionnelle à l’IA. Sachant qu’environ 10% de la population mondiale utiliserait ChatGPT chaque semaine, cela représente près de trois millions de personnes potentiellement en danger.
Développée avec l’aide de cliniciens et d’organisations spécialisées dans la prévention du suicide, cette fonctionnalité s’inspire des alertes parentales déjà existantes sur ChatGPT ou sur des réseaux comme Instagram. Le processus est facile d’utilisation, la personne soumet les coordonnées d’un autre adulte, qui reçoit alors une invitation valable une semaine. En cas de refus, un autre individu peut être désigné.
Si le système détecte une situation préoccupante, il encourage d’abord l’utilisateur à contacter les services d’urgence ou son contact de confiance, en proposant même des amorces de conversation. Parallèlement, une équipe spécialisée évalue s’il est pertinent d’envoyer une alerte. Le cas échéant, le proche désigné est prévenu par e-mail, SMS ou notification.
Afin de préserver la vie privée, aucune transcription des discussions n’est partagée. L’alerte se contente d’expliquer la nature générale de l’inquiétude et fournit des conseils pour aborder la situation avec bienveillance. OpenAI rappelle que cet outil ajoute une couche de protection supplémentaire, mais ne remplace en aucun cas une prise en charge médicale professionnelle.
Codex s’invite directement dans votre navigateur
La programmation reste l’un des cas d’usage les plus populaires pour l’intelligence artificielle et OpenAI compte bien capitaliser sur cette tendance en lançant une extension Chrome pour sa plateforme Codex. Compatible avec les systèmes Windows et Mac, elle vient enrichir l’application macOS dévoilée en février dernier et mise à jour en avril.
L’intégration au navigateur offre de nouvelles possibilités particulièrement pratiques. L’extension permet notamment de tester des applications web, de collecter du contexte à travers différents onglets ouverts et d’utiliser les Chrome DevTools en parallèle, le tout pendant que vous effectuez d’autres tâches.
Cette approche vise à rendre Codex beaucoup plus attractif, non seulement pour les développeurs chevronnés, mais aussi pour les utilisateurs occasionnels et d’autres corps de métiers dont l’essentiel des tâches informatiques s’effectue aujourd’hui via un navigateur. À terme, l’entreprise ambitionne de fusionner Codex, son chatbot ChatGPT et son propre navigateur web, baptisé Atlas, au sein d’une seule et même application unifiée.
L’API vocale passe à la vitesse supérieure
Pour les développeurs, OpenAI a également présenté des améliorations spectaculaires de son API, axées sur l’intelligence vocale en temps réel. Ces nouveaux outils permettent de créer des applications capables de discuter, de transcrire et de traduire des conversations avec un niveau de fluidité inédit.
La pièce maîtresse de cette annonce est le modèle GPT-Realtime-2. Conçu pour générer une simulation vocale ultra-réaliste, il se démarque de son prédécesseur en intégrant des facultés de raisonnement de classe GPT-5, lui permettant de traiter des requêtes bien plus avancées.
Il est accompagné de GPT-Realtime-Translate, un outil de traduction en temps réel qui suit le rythme naturel de la conversation. Ce dernier est capable de comprendre plus de 70 langues en entrée et de restituer la parole dans 13 langues différentes. Enfin, l’outil GPT-Realtime-Whisper vient compléter l’offre en proposant une transcription vocale instantanée tout au long des interactions.
Ces modèles transforment l’audio en temps réel en une véritable interface de travail capable d’écouter, de raisonner et d’agir. Ils se destinent particulièrement aux entreprises souhaitant révolutionner leur service client, mais trouveront aussi des applications dans l’éducation, les médias, l’événementiel ou encore les plateformes de créateurs.
Consciente des risques de dérives, l’entreprise a intégré des garde-fous stricts. Des déclencheurs spécifiques permettent d’interrompre automatiquement toute conversation qui violerait les directives sur les contenus préjudiciables, limitant ainsi les risques de fraude, de spam ou de harcèlement.
L’ensemble de ces nouveautés est d’ores et déjà intégré à l’API Realtime d’OpenAI. Côté facturation, les services Translate et Whisper sont facturés à la minute, tandis que le modèle GPT-Realtime-2 repose sur un système de facturation par consommation de tokens.





