Vous êtes ici
Real Humans revu par les chercheurs (1)
Surdoués, les hubots (human robots) de la série télévisée Real Humans ? Pas beaucoup plus que leurs cousins déjà vus sur grand écran. Question langage par exemple, cette pipelette de C-3PO ergotait déjà avec R2-D2 dans les « Star Wars » des années 1970, le machiavélique HAL 9000 s’exprimait parfaitement dans « 2001, l’Odyssée de l’espace » (1968), et l’éloquent David, garçon-robot de 11 ans, se révélait d’une troublante humanité dans « A. I. » (2001).
Mais depuis ces classiques, notre technologie galopante a fait du chemin. Du coup, les hubots nous interpellent davantage que leurs prédécesseurs de fiction. Sans doute à cause de leur apparente proximité avec notre monde réel, déjà peuplé de volubiles machines à la langue bien pendue.
Il est en effet devenu banal de communiquer avec son ordinateur ou son smartphone grâce aux assistants personnels intelligents, comme le fameux Siri d’Apple et d’autres applications parlantes. On finirait par croire que Real Humans, c’est pour demain… Ce n’est pas l’avis de Maxime Amblard, spécialisé en informatique linguistique. Ce chercheur du Laboratoire lorrain de recherche en informatique et ses applications1 a répondu à nos questions.
Dans Real Humans, les hubots s’expriment pratiquement comme vous et moi. Et ils comprennent presque tout ! Et dans la réalité, où en est-on ?
Maxime Amblard : Encore bien loin de tout ça ! Il reste de nombreuses étapes à franchir pour dialoguer de manière fluide avec une intelligence artificielle. La discipline qui y travaille le plus associe des linguistes et des informaticiens, c’est le traitement automatique des langues (TAL). Il consiste notamment à modéliser le langage en représentations abstraites (de type mathématiques). C’est grâce à lui que Siri, le célèbre assistant personnel intelligent d’Apple, décode vos demandes quand vous lui parlez et vous répond ensuite de vive voix.
Cela semble plutôt bien marcher… Qu’est-ce que les hubots ont de plus ?
M. A. : Les hubots transmettent des émotions quand ils parlent, alors que Siri ou n’importe quelle autre machine parlante manquent de toute subtilité… Mais ce n’est pas le problème le plus urgent à régler ! Les systèmes utilisés aujourd’hui, dans les tablettes ou smartphones, sont efficaces uniquement parce qu’ils évoluent dans un univers restreint et ne proposent qu’un nombre réduit d’interactions : on leur parle pour leur demander d’afficher un mail, de chercher un contact, etc. Pour comprendre et répondre, ils sont assez bons en syntaxeFermerLa syntaxe, ce sont les différentes règles, notamment de la grammaire, qui relient entre eux les mots d’une phrase.. Mais ils manquent encore beaucoup d’efficacité dans d’autres domaines de la linguistique.
langage ne posent
pas de problème
à un humain doté
de sens commun.
Mais pour
un système automatique,
ces difficultés
sont énormes…
Dans quel domaine de la linguistique nos systèmes sont-ils encore trop peu performants ?
M. A. : L’un des domaines à améliorer est la sémantique. Elle correspond à l'étude du langage du point de vue du sens, de la signification. Elle détermine entre autres la façon dont un mot est interprété en fonction de ses voisins et des autres phrases. Un système parlant doit aussi interpréter les mots en fonction de ce qu’il « sait » de notre monde. Par exemple, « la pièce est dans le porte-monnaie » et « le porte-monnaie est dans la pièce » contiennent les mêmes mots, avec les mêmes relations syntaxiques. Et pourtant, le sens de « pièce » est très différent dans les deux cas : dans le premier, il s'agit d’une pièce de monnaie, et dans le second, d'un espace dans un appartement. Ces ambiguïtés de langage ne posent pas de problème à un humain doté de sens commun. Mais pour un système automatique, ce sont des difficultés énormes…
Mais il existe des bases de données qui peuvent offrir aux robots cette indispensable connaissance du monde, non ?
M. A. : Oui, ce sont des ontologies, sommes d’informations et de concepts capables de décrire toute chose. Certaines sont très avancées, mais elles concernent des domaines très pointus. Par exemple, il existe des ontologies qui décrivent très précisément les avions, des sièges aux manettes de pilotage, jusqu’aux clapets qui tiennent votre gobelet ! Elles sont utilisées dans ce qu’on appelle les « systèmes d’extraction d’information », afin de trouver rapidement une information très précise dans une énorme notice technique. Très utiles aux constructeurs d’avions, leur intérêt commercial permet de drainer les financements nécessaires à leur coût astronomique (on parle de millions d’euros). Mais imaginez le coût pour décrire la totalité de notre monde à des robots ! Je ne sais pas si un tel projet attirerait assez de financements.
Et si ces ontologies décrivant aux robots absolument toute chose de notre monde existaient…
M. A. : Il faudrait ensuite trouver le moyen de les faires interagir toutes ensembles. Cela pose des problèmes que la recherche n’a pas encore résolus. Pire : cette quantité de données serait gigantesque. Donc pour l’exploiter, un système informatique aurait sans doute besoin de temps de calcul assez longs… Alors que les hubots comprennent ce qu’on leur dit et répondent en temps réel !
À quelle vitesse les systèmes actuels de traitement des langues réagissent-ils ?
M. A. : Certains obtiennent des performances remarquables, en dessous de la seconde ! Je parle ici des approches numériques. Elles sont fondées sur les probabilités. Par exemple, en fonction des voitures qui sont déjà passées à un coin de rue (13 blanches, 10 noires, 8 rouges, etc.), elles calculent la probabilité que la prochaine qui passera soit blanche, ou noire, ou rouge, etc. Au final, elles peuvent « prédire » la couleur de la prochaine voiture qui passera. Elles peuvent de la même façon « prédire » la signification d’un mot dans une phrase. Siri et presque tous les systèmes utilisés par le grand public, notamment les traducteurs automatiques, reposent sur ce type d’approche numérique. Elles sont rapides mais manquent de fiabilité. Si vous avez déjà utilisé Google traductionFermerGoogle traduction est un logiciel de traduction d’une langue à une autre., cela saute aux yeux… On est loin de la rhétorique parfaite des hubots !
Existe-t-il des approches plus fiables ?
M. A. : Oui, les approches symboliques sont plus fiables, car elles sont plus précises. Elles reposent sur un ensemble de règles pré-programmées. Leur grande force est qu'elles sont capables de rendre finement compte de propriétés linguistiques complexes. Elles sont à l’origine des premiers correcteurs automatiques d’orthographe de nos ordinateurs. Mais elles sont assez lentes… Par exemple, il leur faut une dizaine de secondes pour analyser une phrase standard d'article de journal.
Le défi est de les rendre à la fois rapides et fiables.
Les approches numériques sont donc rapides, tandis que les approches symboliques sont précises. Comment bénéficier des avantages des deux ?
M. A. : En les utilisant ensemble. Par exemple, les hôpitaux suisses testent des traducteurs automatiques des langues pour comprendre les patients étrangers. La précision est capitale vu l’enjeu qu’aurait une erreur sur la santé des personnes. Une approche symbolique semble donc s’imposer… Mais aux urgences, il faut aussi obtenir les informations très vite. On peut donc décider d’utiliser une approche numérique pour choisir les meilleures réponses parmi toutes celles fournies par la première approche. Cela fonctionne par couche : on alterne les approches pour obtenir le meilleur des deux. On utilise déjà cette stratégie dans la plupart des systèmes de traitement des langues pour améliorer un peu les résultats.
Ne peut-on pas simplement utiliser les deux approches en même temps ?
M. A. : Ce n’est pas simple du tout ! Un des grands défis de la recherche réside justement dans l’hybridation des deux méthodes. Mais elles sont radicalement différentes. Cela revient à essayer de faire un seul puzzle avec des pièces tirées dans deux boîtes différentes…
Bref, je suppose que je n’aurai pas une agréable conversation avec un hubot de sitôt…
M. A. : En effet… On pourrait vous mettre un système comme Siri sur un robot. Il parlerait mal mais se ferait comprendre. En revanche, il ne comprendrait pas grand chose à votre quotidien et à vos discussions. Il serait submergé par les ambiguïtés de langage dont nous avons parlé au début de cet entretien et qui sont susceptibles de se glisser absolument partout. Parler et comprendre une langue, pour une machine, cela revient surtout à gérer toutes les ambiguïtés grâce aux fameuses méthodes évoquées plus haut (numériques et symboliques). Si nous savions les utiliser pour construire un hubot parlant comme dans Real Humans, alors nous disposerions déjà de traducteurs automatiques de qualité parfaite. Or ce n’est pas du tout le cas…
Pour en savoir plus lire l’article de Maxime Amblard : Real Humans : des machines qui parlent comme des hommes, ou presque...
Lire aussi le 2e volet de notre série d’articles : Real Humans revu par les chercheurs (2)
Sur le même sujet : Les androïdes de la saga Alien sont-ils pour 2093 ?
- 1. Unité CNRS/Univ. de Lorraine/Inria.
Mots-clés
Partager cet article
Auteur
Journaliste scientifique, autrice jeunesse et directrice de collection (une vingtaine de livres publiés chez Fleurus, Mango et Millepages).
Formation initiale : DEA de mécanique des fluides + diplômes en journalisme à Paris 7 et au CFPJ.
Plus récemment : des masterclass et des stages en écriture...
Commentaires
Je ne savais pas qu'il
Geoffroy Planquart le 15 Mai 2014 à 16h2801010011 01110101 01110000
Marc Lenjaille le 11 Juin 2014 à 10h2101101101 01100101 01110010
editeur le 11 Juin 2014 à 16h4201001010011001010010000001100
editeur le 13 Juin 2014 à 16h36Les robots n'ont quasiment
berlherm le 28 Juin 2014 à 11h39Connectez-vous, rejoignez la communauté
du journal CNRS