OpenAI continue de faire des vagues dans le domaine de l'intelligence artificielle avec le dévoilement de Voice Engine, un outil innovant capable de recréer des voix humaines. Cette annonce intervient peu de temps après la présentation de Sora, une IA capable de créer des vidéos à partir de simples textes.
Développé sur une période d'environ deux ans, Voice Engine permet aux utilisateurs de télécharger un échantillon audio de 15 secondes pour générer une reproduction synthétique de cette voix. OpenAI affirme que cet outil peut produire des voix naturelles qui sont remarquablement similaires à celles de l'orateur d'origine. Il est intéressant de noter qu'un modèle de petite taille avec un seul échantillon de voix peut créer des voix émotionnelles et réalistes.
Voice Engine repose sur le même modèle qui alimente les capacités de vocalisation de ChatGPT, ainsi que les voix prédéfinies disponibles dans l'API de synthèse vocale d'OpenAI. Déjà utilisé par Spotify pour doubler des podcasts dans différentes langues, cet outil suscite un vif intérêt pour ses multiples applications potentielles, notamment l'aide à la lecture, la traduction de contenu et le soutien aux personnes souffrant de troubles de la parole.
OpenAI a mis en ligne plusieurs extraits audio démontrant les capacités de Voice Engine, notamment sa capacité à s'exprimer dans différentes langues tout en préservant l'accent du locuteur d'origine. Cependant, cette technologie soulève également des préoccupations quant à son utilisation malveillante, notamment dans le domaine politique. OpenAI reconnaît ces risques et s'engage à travailler avec divers partenaires pour atténuer les éventuelles conséquences néfastes de cette technologie.
Bien que Voice Engine ne soit pas encore prêt pour une disponibilité publique, OpenAI continue de repousser les limites de l'intelligence artificielle et de démontrer le potentiel révolutionnaire de ses innovations.