IBM, leader de l’intelligence artificielle pour entreprises[1], annonce plusieurs nouvelles fonctionnalités au sein d’IBM Watson conçues pour aider les organisations à identifier, comprendre et analyser certains des aspects les plus difficiles de la langue anglaise, pour une meilleure compréhension du langage.
Cela représente la première commercialisation des nouvelles technologies du Traitement Automatique du Langage Naturel (TALN) de Project Debater d’IBM Research, le seul système d’IA capable de débattre avec des humains sur des sujets complexes. Parmi celles-ci, une nouvelle fonction d’analyse des sentiments a été définie pour identifier et analyser les différents discours et expressions familières. Par exemple, des expressions telles que « à peine utile » ont posé quelques défis au système d’IA car elles sont difficiles à repérer par les algorithmes. Ainsi, grâce à l’analyse avancée des sentiments, les entreprises peuvent désormais commencer à analyser ces données linguistiques avec les API Watson Cette nouvelle technologie permettra une meilleure compréhension des documents commerciaux tels que les PDF et les contrats, afin de les ajouter à ses modèles d’IA.
« Le langage est un outil informatif tout comme il permet d’exprimer une pensée ou une opinion » déclare Rob Thomas, directeur général d’IBM Data and AI. « C’est pourquoi nous intégrons la technologie de Project Debater dans Watson – pour permettre aux entreprises d’identifier, d’analyser et de comprendre davantage le langage humain, grâce au TALN, ce qui transformera la façon dont elles utilisent leur capital intellectuel, aujourd’hui codifié au sein des données ».
Aujourd’hui IBM annonce l’intégration des technologies de Project Debater à Watson, en mettant l’accent sur l’amélioration de la capacité des clients à exploiter le langage naturel :
A. Analyse - Analyse avancée du sentiment. IBM a amélioré l'analyse des sentiments afin de pouvoir mieux identifier et comprendre les combinaisons de mots compliqués comme les idiomes (phrases et expressions) et les soi-disant "changeurs de sentiments", c’est-à-dire des combinaisons de mots qui, ensemble, prennent un nouveau sens, comme "à peine utile". Cette technologie sera intégrée dans le logiciel Watson Natural Language Understanding ce mois-ci. De plus, IBM annonce une nouvelle technologie de classification qui permettra à ses clients de créer des modèles d’IA pouvant plus facilement classer les clauses qui figurent dans les documents commerciaux. Basée sur la technologie de classification de Project Debater, cette nouvelle fonctionnalité peut apprendre à effectuer de nouvelles classifications bien plus rapidement, et ce, à partir de quelques centaines d’échantillons seulement. Elle sera ajoutée à Watson Discovery plus tard dans l’année.
B. Brèves - Récapitulation. Cette technologie tire des données textuelles de diverses sources pour fournir aux utilisateurs un résumé de ce qui est dit et écrit sur un sujet particulier. Une première version de « générateur de résumé »a été utilisée cette année au GRAMMYS pour analyser plus de 18 millions d'articles, de blogs et de bios afin de partager des informations sur des centaines d'artistes et de célébrités du GRAMMY. Les données ont ensuite été intégrées en direct au flux du tapis rouge, aux vidéos et photos à la demande sur www.grammy.com pour donner aux fans plus d’informations sur les principaux sujets de la soirée. Elles seront ajoutées à IBM Watson Natural Language Understanding plus tard dans l'année.
C. Regroupement - Regroupement avancé de sujets. S'appuyant sur les connaissances acquises dans le cadre du projet Debater, de nouvelles techniques de regroupement de sujets permettront aux utilisateurs de "regrouper" les données entrantes afin de créer des "sujets" d'informations connexes qui pourront ensuite être analysés. Cette technique, qui sera intégrée à Watson Discovery dans le courant de l'année, permettra également aux experts en la matière de personnaliser et d'affiner les sujets afin de refléter le langage utilisé par les entreprises ou des industries spécifiques – comme l’assurance, la santé et l’industrie.
IBM est depuis longtemps le leader du TALN et développe des technologies qui permettent aux systèmes informatiques d’apprendre, d’analyser et de comprendre le langage humain – y compris les sentiments, les dialectes, les intonations et bien plus encore – avec une précision et une rapidité qui ne cessent de croître. IBM commercialise sa technologie de TALN – provenant d’IBM Research – par le biais de fonctionnalités Watson, tels que Watson Discovery pour la recherche en entreprise, Watson Assistant pour les agents virtuels, ou encore Watson Natural Language Understanding pour l’analyse de sentiments avancés.