Facebook
  • Acceuil
  • Digital
  • ChatGPT dévoile une nouvelle fonctionnalité de partage d'écran dans son mode vocal avancé

ChatGPT dévoile une nouvelle fonctionnalité de partage d'écran dans son mode vocal avancé

title..

Pour pimenter la fin d’année, ChatGPT propose son propre calendrier de l’Avent. Depuis le 5 décembre et pendant 12 jours, la firme présente quotidiennement une nouveauté, aussi bien anecdotique que majeure. Jusqu’à présent, plusieurs annonces marquantes ont été faites, comme l’arrivée d’un abonnement premium et le lancement de Sora, son générateur de vidéos. Aujourd’hui, jeudi 12 décembre, c’est une fonctionnalité particulièrement attendue qui voit le jour : le partage d’écran dans le mode vocal avancé de ChatGPT.

Depuis la mise en place du modèle GPT-4 et de son mode vocal avancé en mai 2024, les utilisateurs attendaient impatiemment une nouvelle fonctionnalité annoncée par OpenAI : la possibilité de partager l’écran de son smartphone. Ce jeudi 12 décembre, l'attente prend fin avec l’arrivée de cette fonctionnalité qui promet de réinventer l’interaction avec l'intelligence artificielle.

Un mode vocal enrichi avec partage d'écran

Jusqu’ici, le mode vocal avancé permettait déjà à ChatGPT de répondre à des commandes vocales et d’effectuer des tâches via des conversations orales. Mais ce nouveau développement va bien au-delà des simples échanges verbaux. En activant le mode vocal avancé, l’utilisateur peut désormais activer un bouton vidéo qui permet de filmer l’environnement autour de lui grâce à la caméra de son smartphone. Cette fonctionnalité transforme ChatGPT en un véritable partenaire visuel, capable d’interagir avec ce que l’utilisateur voit, tout en écoutant et répondant à ses questions.

La capacité de l’IA à comprendre les éléments visuels dans une vidéo ouvre de nouvelles perspectives d'interaction. Un test réalisé par OpenAI montre l’ampleur de cette innovation : dans l'exemple présenté, ChatGPT aide un utilisateur à préparer un café en prenant en compte le matériel disponible dans son environnement. L’IA analyse les objets visibles à l’écran, comme la cafetière, les tasses, et les ingrédients, et guide l’utilisateur pas à pas dans la préparation de sa boisson.

Un pas de plus vers une IA multimodale

Cette nouveauté marque un tournant dans l’évolution des interfaces vocales et visuelles. En combinant la compréhension du langage naturel avec l’interprétation des éléments visuels, OpenAI fait un grand pas vers une intelligence artificielle véritablement multimodale, capable de s’adapter à différents contextes et d’offrir des réponses plus précises et contextualisées.

Les applications de cette nouvelle fonctionnalité sont vastes. Imaginez que vous soyez en train de cuisiner et que vous ayez besoin d’aide pour savoir si vous avez bien suivi la recette : en activant la caméra et en discutant avec l’IA, ChatGPT pourrait analyser les ingrédients et étapes de la préparation en temps réel, et ajuster ses conseils en fonction de ce que vous filmez.

Des horizons d'utilisation étendus

Au-delà des simples tâches domestiques comme la préparation de café ou la cuisine, cette avancée pourrait se révéler utile dans de nombreux domaines, de l’éducation à la formation professionnelle. Un étudiant en biologie pourrait, par exemple, filmer ses expériences de laboratoire et obtenir des conseils en direct de la part de l'IA. De même, un technicien pourrait filmer une machine en panne et obtenir un diagnostic instantané.

L'introduction de cette nouvelle fonction dans le cadre des "12 Days of OpenAI" démontre la volonté de la firme d'enrichir l’expérience utilisateur et d’explorer de nouvelles formes d'interaction avec l’intelligence artificielle.

Un avenir prometteur pour les interactions avec l’IA

Ce lancement n’est qu’une étape dans le processus d'amélioration continue de ChatGPT. Alors que de nombreuses fonctionnalités continuent de voir le jour au fil des jours, il est évident que l’ambition d'OpenAI est de faire de ChatGPT un assistant à la fois vocal, visuel et capable de comprendre le monde dans sa globalité. Une avancée qui pourrait bien redéfinir nos rapports à la technologie dans les mois et années à venir.

Avec cette nouvelle capacité de partage d'écran dans le mode vocal avancé, ChatGPT franchit une étape importante dans l’amélioration de ses interactions. En offrant à ses utilisateurs la possibilité de filmer leur environnement et d’obtenir des conseils en temps réel, OpenAI transforme l’intelligence artificielle en un véritable compagnon visuel et vocal. Cette avancée ouvre la voie à des usages multiples et variés, apportant un souffle nouveau à l’utilisation des IA dans la vie quotidienne.

Ce site, utilise des cookies afin de vous offrir une bonne expérience de navigation et d’améliorer continuellement nos services. En continuant à naviguer sur ce site, vous acceptez l’utilisation de ces cookies.