ASR, NLU, NLP, TTS... The terminology of Artificial Intelligence simplified
Oct 3, 2019
Quand les humains communiquent entre eux, cela tourne souvent au dialogue de sourds, alors que dire des échanges entre humains et bots ; à fortiori lorsque le bot est un agent conversationnel ! Pour que tout un chacun y retrouve son latin, petit lexique des termes les plus récurrents, s’agissant d’intelligence artificielle (IA)…
L’« ASR », ou « Automatic Speech Recognition »
Le « logiciel de reconnaissance de la parole » permet à un utilisateur (via Google, par exemple) d’émettre une requête vocale. Le logiciel transforme alors cette requête en texte après avoir analysé le contexte. Cette analyse du contexte est tout l’enjeu de l’ASR car la prononciation d’un phonème peut avoir plusieurs sens.
Exemple : Si je dis, en anglais : « for the time » … Fais-je référence au « tea time » ou à l’heure : « forty times » ? C’est à ce moment que l’IA entre en piste pour trouver le vrai sens de ma question, en fonction du contexte…
Le « NLU » ou « Natural Language Understanding »
Le « traitement automatique du langage naturel » permet de décrypter puis d’analyser des messages pour en définir un sens et en extraire des informations structurées. Il est au service, par exemple, d’assistants vocaux qui vont analyser une demande grâce au sens des mots et d’un annotateur de confiance.
Exemple : « Je veux prendre un avion de Marseille à Paris le 30 juin ». Le logiciel détecte tout d’abord l’intention : « prendre un avion », puis les entités suivantes : Marseille – Paris – 30 juin. Grâce à l’analyse sémantique de ces éléments, il comprend la requête et y répond…
Le « NLP » ou « Natural Language Processing »
Cette technologie permet d’analyser, de comprendre le langage humain et de générer des interactions, en transformant de la data brute en conversation intelligente. La plupart des techniques de traitement naturel du langage reposent sur le Deep Learning.
Le « TTS » ou « Text To Speech »
Le synthétiseur vocal lit instantanément et précisément n’importe quel texte avec une voix nette et naturelle. Le logiciel permet de sélectionner une langue et un type de voix, suivant une multitude de choix…
Le « DM » ou « Dialog Manager »
Un gestionnaire de dialogue est un logiciel qui décide d’actions à réaliser en s’appuyant sur « l’arbre de décisions » défini lors de la construction du bot. Il valide ainsi les actions les unes après les autres, après avoir analysé le contexte avec les serveurs et en historisant les conversations précédentes…
La « NLG » ou « Natural language generation »
La NLG est un logiciel qui assure une production automatisée de contenus. Ce type de technologie peut être mis, par exemple, au service de salles de rédactions, ou de marques, permettant d’exploiter des sommes importantes de données pour produire des contenus de qualité, à moindre coûts et partageables immédiatement.
MAJ de l’article : 24 Janvier 2022