Sections

Real Humans revu par les chercheurs (1)

Real Humans revu par les chercheurs (1)

15.05.2014, par
Real Humans, saison 2
Qu'est ce qui est réel dans la série Real Humans ? Quand nos robots seront-ils aussi doués ? CNRS le journal fait le point dans une série d'articles. Aujourd'hui : le langage.

Surdoués, les hubots (human robots) de la série télévisée Real Humans ? Pas beaucoup plus que leurs cousins déjà vus sur grand écran. Question langage par exemple, cette pipelette de C-3PO ergotait déjà avec R2-D2 dans les « Star Wars » des années 1970, le machiavélique HAL 9000 s’exprimait parfaitement dans « 2001, l’Odyssée de l’espace » (1968), et l’éloquent David, garçon-robot de 11 ans, se révélait d’une troublante humanité dans « A. I. » (2001).

Mais depuis ces classiques, notre technologie galopante a fait du chemin. Du coup, les hubots nous interpellent davantage que leurs prédécesseurs de fiction. Sans doute à cause de leur apparente proximité avec notre monde réel, déjà peuplé de volubiles machines à la langue bien pendue.

Il est en effet devenu banal de communiquer avec son ordinateur ou son smartphone grâce aux assistants personnels intelligents, comme le fameux Siri d’Apple et d’autres applications parlantes. On finirait par croire que Real Humans, c’est pour demain… Ce n’est pas l’avis de Maxime Amblard, spécialisé en informatique linguistique. Ce chercheur du Laboratoire lorrain de recherche en informatique et ses applications1 a répondu à nos questions.

 

Dans Real Humans, les hubots s’expriment pratiquement comme vous et moi. Et ils comprennent presque tout ! Et dans la réalité, où en est-on ?
Maxime Amblard : Encore bien loin de tout ça ! Il reste de nombreuses étapes à franchir pour dialoguer de manière fluide avec une intelligence artificielle. La discipline qui y travaille le plus associe des linguistes et des informaticiens, c’est le traitement automatique des langues (TAL). Il consiste notamment à modéliser le langage en représentations abstraites (de type mathématiques). C’est grâce à lui que Siri, le célèbre assistant personnel intelligent d’Apple, décode vos demandes quand vous lui parlez et vous répond ensuite de vive voix.

Cela semble plutôt bien marcher… Qu’est-ce que les hubots ont de plus ?
M. A. : Les hubots transmettent des émotions quand ils parlent, alors que Siri ou n’importe quelle autre machine parlante manquent de toute subtilité… Mais ce n’est pas le problème le plus urgent à régler ! Les systèmes utilisés aujourd’hui, dans les tablettes ou smartphones, sont efficaces uniquement parce qu’ils évoluent dans un univers restreint et ne proposent qu’un nombre réduit d’interactions : on leur parle pour leur demander d’afficher un mail, de chercher un contact, etc. Pour comprendre et répondre, ils sont assez bons en syntaxeFermerLa syntaxe, ce sont les différentes règles, notamment de la grammaire, qui relient entre eux les mots d’une phrase.. Mais ils manquent encore beaucoup d’efficacité dans d’autres domaines de la linguistique.

Les ambiguïtés de
langage ne posent
pas de problème
à un humain doté
de sens commun.
Mais pour
un système automatique,
ces difficultés
sont énormes…

Dans quel domaine de la linguistique nos systèmes sont-ils encore trop peu performants ?
M. A. : L’un des domaines à améliorer est la sémantique. Elle correspond à l'étude du langage du point de vue du sens, de la signification. Elle détermine entre autres la façon dont un mot est interprété en fonction de ses voisins et des autres phrases. Un système parlant doit aussi interpréter les mots en fonction de ce qu’il « sait » de notre monde. Par exemple, « la pièce est dans le porte-monnaie » et « le porte-monnaie est dans la pièce » contiennent les mêmes mots, avec les mêmes relations syntaxiques. Et pourtant, le sens de « pièce » est très différent dans les deux cas : dans le premier, il s'agit d’une pièce de monnaie, et dans le second, d'un espace dans un appartement. Ces ambiguïtés de langage ne posent pas de problème à un humain doté de sens commun. Mais pour un système automatique, ce sont des difficultés énormes…

Mais il existe des bases de données qui peuvent offrir aux robots cette indispensable connaissance du monde, non ?
M.
 A. : Oui, ce sont des ontologies, sommes d’informations et de concepts capables de décrire toute chose. Certaines sont très avancées, mais elles concernent des domaines très pointus. Par exemple, il existe des ontologies qui décrivent très précisément les avions, des sièges aux manettes de pilotage, jusqu’aux clapets qui tiennent votre gobelet ! Elles sont utilisées dans ce qu’on appelle les « systèmes d’extraction d’information », afin de trouver rapidement une information très précise dans une énorme notice technique. Très utiles aux constructeurs d’avions, leur intérêt commercial permet de drainer les financements nécessaires à leur coût astronomique (on parle de millions d’euros). Mais imaginez le coût pour décrire la totalité de notre monde à des robots ! Je ne sais pas si un tel projet attirerait assez de financements.

Et si ces ontologies décrivant aux robots absolument toute chose de notre monde existaient…
M. A. : Il faudrait ensuite trouver le moyen de les faires interagir toutes ensembles. Cela pose des problèmes que la recherche n’a pas encore résolus. Pire : cette quantité de données serait gigantesque. Donc pour l’exploiter, un système informatique aurait sans doute besoin de temps de calcul assez longs… Alors que les hubots comprennent ce qu’on leur dit et répondent en temps réel !

À quelle vitesse les systèmes actuels de traitement des langues réagissent-ils ?
M. A. : Certains obtiennent des performances remarquables, en dessous de la seconde ! Je parle ici des approches numériques. Elles sont fondées sur les probabilités. Par exemple, en fonction des voitures qui sont déjà passées à un coin de rue (13 blanches, 10 noires, 8 rouges, etc.), elles calculent la probabilité que la prochaine qui passera soit blanche, ou noire, ou rouge, etc. Au final, elles peuvent « prédire » la couleur de la prochaine voiture qui passera. Elles peuvent de la même façon « prédire » la signification d’un mot dans une phrase. Siri et presque tous les systèmes utilisés par le grand public, notamment les traducteurs automatiques, reposent sur ce type d’approche numérique. Elles sont rapides mais manquent de fiabilité. Si vous avez déjà utilisé Google traductionFermerGoogle traduction est un logiciel de traduction d’une langue à une autre., cela saute aux yeux… On est loin de la rhétorique parfaite des hubots !

Existe-t-il des approches plus fiables ?
M. A. : Oui, les approches symboliques sont plus fiables, car elles sont plus précises. Elles reposent sur un ensemble de règles pré-programmées. Leur grande force est qu'elles sont capables de rendre finement compte de propriétés linguistiques complexes. Elles sont à l’origine des premiers correcteurs automatiques d’orthographe de nos ordinateurs. Mais elles sont assez lentes… Par exemple, il leur faut une dizaine de secondes pour analyser une phrase standard d'article de journal.

Les hôpitaux suisses testent des traducteurs automatiques.
Le défi est de les rendre à la fois rapides et fiables.

Les approches numériques sont donc rapides, tandis que les approches symboliques sont précises. Comment bénéficier des avantages des deux ?
M.
 A. : En les utilisant ensemble. Par exemple, les hôpitaux suisses testent des traducteurs automatiques des langues pour comprendre les patients étrangers. La précision est capitale vu l’enjeu qu’aurait une erreur sur la santé des personnes. Une approche symbolique semble donc s’imposer… Mais aux urgences, il faut aussi obtenir les informations très vite. On peut donc décider d’utiliser une approche numérique pour choisir les meilleures réponses parmi toutes celles fournies par la première approche. Cela fonctionne par couche : on alterne les approches pour obtenir le meilleur des deux. On utilise déjà cette stratégie dans la plupart des systèmes de traitement des langues pour améliorer un peu les résultats.

Ne peut-on pas simplement utiliser les deux approches en même temps ?
M. A. : Ce n’est pas simple du tout ! Un des grands défis de la recherche réside justement dans l’hybridation des deux méthodes. Mais elles sont radicalement différentes. Cela revient à essayer de faire un seul puzzle avec des pièces tirées dans deux boîtes différentes…

Bref, je suppose que je n’aurai pas une agréable conversation avec un hubot de sitôt…
M. A. : En effet… On pourrait vous mettre un système comme Siri sur un robot. Il parlerait mal mais se ferait comprendre. En revanche, il ne comprendrait pas grand chose à votre quotidien et à vos discussions. Il serait submergé par les ambiguïtés de langage dont nous avons parlé au début de cet entretien et qui sont susceptibles de se glisser absolument partout. Parler et comprendre une langue, pour une machine, cela revient surtout à gérer toutes les ambiguïtés grâce aux fameuses méthodes évoquées plus haut (numériques et symboliques). Si nous savions les utiliser pour construire un hubot parlant comme dans Real Humans, alors nous disposerions déjà de traducteurs automatiques de qualité parfaite. Or ce n’est pas du tout le cas…

Pour en savoir plus lire l’article de Maxime Amblard : Real Humans : des machines qui parlent comme des hommes, ou presque...
Lire aussi le deuxième volet de notre série d’articles : Real Humans revu par les chercheurs (2)
 

Notes
  • 1. Unité CNRS/Univ. de Lorraine/Inria.
Aller plus loin

Auteur

Charline Zeitoun

Journaliste scientifique, auteur jeunesse et directrice de collection depuis quinze ans, Charline Zeitoun est actuellement Chef de rubrique à CNRS Le journal. Ses sujets de prédilection sont ceux de la rubrique Société, surtout quand ils se trouvent au croisement avec d'autres disciplines scientifiques. Et le cinéma, le cinéma, le cinéma !

Elle a été rédactrice à Science & Vie...

Commentaires

5 commentaires

01010011 01110101 01110000 01100101 01110010 00100000 01100001 01110010 01110100 01101001 01100011 01101100 01100101 00100000 00100001 00100000 01010110 01101001 01110110 01100101 01101101 01100101 01101110 01110100 00100000 01101100 01100101 00100000 01110011 01110101 01101001 01110110 01100001 01101110 01110100 00101110

01000011 01100001 00100000 01111001 00100000 01100101 01110011 01110100 00100000 01101001 01101100 00100000 01100101 01110011 01110100 00100000 01100101 01101110 00100000 01101100 01101001 01100111 01101110 01100101 00100000 00100001!

Les robots n'ont quasiment aucune limite de taille, pas de limite de temps, peu de limites de puissance. Les robots peuvent afficher leur pensée en temps réel. Etc. La question que je n'ai pas entendue dans « Real humans » est celle du libre arbitre tel qu'il est revendiqué par les humains. À la place du robot, je demanderai à mon créateur de m'expliquer ce qu'est le libre arbitre et de m'installer cette fonction dans le cerveau, ce qui clorait la question de l'intelligence où qu'elle se manifeste. Et puisqu'on est au CNRS je demande (officiellement) que le CNRS me dise scientifiquement, rationnellement ce qu'est le libre arbitre, sa définition, ses mécanismes, ses propriétés, son utilité... J'aimerais également savoir (officiellement) si la Justice a demandé officiellement au CNRS de réaliser une recherche approfondie de ce qu'est cette fonction mentale extraordinaire qui me permet (divin miracle !) de faire tourner les particules élémentaires dans le sens désiré (puisque j'en suis la somme !). Ceci est évidemment extrêmement important, capital, puisque des tas de gens sont enfermés avec ou sans libre arbitre, alors qu'ils ont été mis au monde de force dans le potager social, et sont punis d'exister et éduquer sans l'avoir demandé. Le doute profitant à l'accusé, tant que le libre arbitre n'a pas été démontré, il n'existe pas, et personne n'est responsable. Bien entendu, on peut se protéger des fauteurs de troubles, mais pas en les enfermant dans des « cellules-chiottes », c'est ce qui doit gêner aux entournures les législateurs. Alors chers chercheurs du CNRS, avez-vous réalisé cette recherche fabuleuse sur le libre arbitre qui transformera le monde humain ? Si vous ne la faites pas, c'est de la non-assistance à personne en danger (et du sadisme!).
Pour laisser votre avis sur cet article
Connectez-vous, rejoignez la communauté
du journal CNRS