ChatGPT dévoile une nouvelle fonctionnalité de partage d'écran dans son mode vocal avancé

Pour pimenter la fin d’année, ChatGPT propose son propre calendrier de l’Avent. Depuis le 5 décembre et pendant 12 jours, la firme présente quotidiennement une nouveauté, aussi bien anecdotique que majeure. Jusqu’à présent, plusieurs annonces marquantes ont été faites, comme l’arrivée d’un abonnement premium et le lancement de Sora, son générateur de vidéos. Aujourd’hui, jeudi 12 décembre, c’est une fonctionnalité particulièrement attendue qui voit le jour : le partage d’écran dans le mode vocal avancé de ChatGPT.

Depuis la mise en place du modèle GPT-4 et de son mode vocal avancé en mai 2024, les utilisateurs attendaient impatiemment une nouvelle fonctionnalité annoncée par OpenAI : la possibilité de partager l’écran de son smartphone. Ce jeudi 12 décembre, l'attente prend fin avec l’arrivée de cette fonctionnalité qui promet de réinventer l’interaction avec l'intelligence artificielle.

Un mode vocal enrichi avec partage d'écran

Jusqu’ici, le mode vocal avancé permettait déjà à ChatGPT de répondre à des commandes vocales et d’effectuer des tâches via des conversations orales. Mais ce nouveau développement va bien au-delà des simples échanges verbaux. En activant le mode vocal avancé, l’utilisateur peut désormais activer un bouton vidéo qui permet de filmer l’environnement autour de lui grâce à la caméra de son smartphone. Cette fonctionnalité transforme ChatGPT en un véritable partenaire visuel, capable d’interagir avec ce que l’utilisateur voit, tout en écoutant et répondant à ses questions.

La capacité de l’IA à comprendre les éléments visuels dans une vidéo ouvre de nouvelles perspectives d'interaction. Un test réalisé par OpenAI montre l’ampleur de cette innovation : dans l'exemple présenté, ChatGPT aide un utilisateur à préparer un café en prenant en compte le matériel disponible dans son environnement. L’IA analyse les objets visibles à l’écran, comme la cafetière, les tasses, et les ingrédients, et guide l’utilisateur pas à pas dans la préparation de sa boisson.

Un pas de plus vers une IA multimodale

Cette nouveauté marque un tournant dans l’évolution des interfaces vocales et visuelles. En combinant la compréhension du langage naturel avec l’interprétation des éléments visuels, OpenAI fait un grand pas vers une intelligence artificielle véritablement multimodale, capable de s’adapter à différents contextes et d’offrir des réponses plus précises et contextualisées.

Les applications de cette nouvelle fonctionnalité sont vastes. Imaginez que vous soyez en train de cuisiner et que vous ayez besoin d’aide pour savoir si vous avez bien suivi la recette : en activant la caméra et en discutant avec l’IA, ChatGPT pourrait analyser les ingrédients et étapes de la préparation en temps réel, et ajuster ses conseils en fonction de ce que vous filmez.

Des horizons d'utilisation étendus

Au-delà des simples tâches domestiques comme la préparation de café ou la cuisine, cette avancée pourrait se révéler utile dans de nombreux domaines, de l’éducation à la formation professionnelle. Un étudiant en biologie pourrait, par exemple, filmer ses expériences de laboratoire et obtenir des conseils en direct de la part de l'IA. De même, un technicien pourrait filmer une machine en panne et obtenir un diagnostic instantané.

L'introduction de cette nouvelle fonction dans le cadre des "12 Days of OpenAI" démontre la volonté de la firme d'enrichir l’expérience utilisateur et d’explorer de nouvelles formes d'interaction avec l’intelligence artificielle.

Un avenir prometteur pour les interactions avec l’IA

Ce lancement n’est qu’une étape dans le processus d'amélioration continue de ChatGPT. Alors que de nombreuses fonctionnalités continuent de voir le jour au fil des jours, il est évident que l’ambition d'OpenAI est de faire de ChatGPT un assistant à la fois vocal, visuel et capable de comprendre le monde dans sa globalité. Une avancée qui pourrait bien redéfinir nos rapports à la technologie dans les mois et années à venir.

Avec cette nouvelle capacité de partage d'écran dans le mode vocal avancé, ChatGPT franchit une étape importante dans l’amélioration de ses interactions. En offrant à ses utilisateurs la possibilité de filmer leur environnement et d’obtenir des conseils en temps réel, OpenAI transforme l’intelligence artificielle en un véritable compagnon visuel et vocal. Cette avancée ouvre la voie à des usages multiples et variés, apportant un souffle nouveau à l’utilisation des IA dans la vie quotidienne.

ChatGPT dévoile une nouvelle fonctionnalité de partage d'écran dans son mode vocal avancé

Un mode vocal enrichi avec partage d'écran

Un pas de plus vers une IA multimodale

Des horizons d'utilisation étendus

Un avenir prometteur pour les interactions avec l’IA

Dernièrs sujets

Les Impériales Week 2025: The Paradigm Shift – Business. People. Tech

Gitex Africa Morocco 2024

Dernièrs vidéos

O Boticário et AlmapBBDO brisent le silence sur le harcèlement familial à Noël

2M dévoile sa programmation Spéciale CAN 2025

Uber Eats USA frappe fort avec une nouvelle série de films absurdes

TBWA\NEBOKO et la Staatsloterij célèbrent la bienveillance à travers une animation magique

Un vinyle de glace pour entendre la voix des glaciers qui disparaissent

Sage Africa Tour : Casablanca met en lumière les ambitions numériques du Royaume

Soletanche Bachy mise sur le rétro gaming pour séduire une nouvelle génération d’ingénieurs

Quand les gravats écrivent au Père Noël

THE MOROCCAN ID

BREAKING BOUNDERIES

MOROCCO TOMORRO

Voir les derniers numéros

Plus d'articles

Ella AI : la nouvelle arme technologique de Tecno pour réinventer le football mobile

L’IA au service de la magie de Noël chez Olga Lee

Marché publicitaire : une croissance plus forte que prévu selon WPP Media

TECNO célèbre la jeunesse africaine avec “Power Your Moment” pour la CAN 2025

Pages

Magazine

ChatGPT dévoile une nouvelle fonctionnalité de partage d'écran dans son mode vocal avancé

Un mode vocal enrichi avec partage d'écran

Un pas de plus vers une IA multimodale

Des horizons d'utilisation étendus

Un avenir prometteur pour les interactions avec l’IA

Dernièrs sujets

Dernièrs vidéos

Glossaire

THE MOROCCAN ID

BREAKING BOUNDERIES

MOROCCO TOMORRO

Voir les derniers numéros

Plus d'articles