Donner du sens à la science

Miracles et mirages du crowdsourcing

Miracles et mirages du crowdsourcing

07.05.2015, par
D’un côté, la foule participe à la science en fournissant données et observations. De l’autre, des travailleurs sont exploités sur la plateforme de microworking du géant du Web Amazon. L’informaticienne Karën Fort analyse les deux faces du phénomène « crowdsourcing ».

Une fois par mois, retrouvez sur notre site les Inédits du CNRS, des analyses scientifiques originales publiées en partenariat avec Libération.

Le crowdsourcing est une idée généreuse : la foule produit, bénévolement, pour la foule. Le site Wikipédia en est l’exemple phare, avec plus de 30 millions d’articles en 241 langues1 et plus de 800 000 vues par heure pour sa version française. Encore plus fort, 11 095 extraits de déclarations d’intérêts de nos parlementaires ont été saisis l’été 2014 en moins d’une semaine par près de 8 000 personnes via une interface fournie par Regards citoyens ! Bien entendu, les productions de la foule ne sont pas toujours parfaites, que ce soit par malveillance ou par incompétence, ces applications comprennent donc des stratégies de vérification, toujours par la foule, pour limiter les abus et obtenir la meilleure qualité possible. Le principe fondamental est celui de la Do-ocratie, du « pouvoir du faire » : si vous n’êtes pas content du résultat, contribuez et changez-le !

Le crowdsourcing, une histoire ancienne

S’il a pris un essor inédit avec l’avènement du Web 2.0, qui permet aux internautes d’interagir avec les pages qu’ils visitent, le crowdsourcing n’est pas une invention récente. Depuis longtemps, on fait appel à chacun, notamment pour aider la recherche. Mes collègues du Muséum national d’histoire naturelle ont ainsi trouvé des « instructions pour les voyageurs et les employés des colonies », pour qu’ils fassent « connaître les résultats de leurs propres expériences, afin d’en profiter et d’en faire profiter le monde savant », dont la première édition date de 1824 ! C’est ce qu’on appelle « la science participative ou citoyenne », qui peut prendre des formes variées. Vous pouvez aller observer les petits animaux présents autour de vous et transmettre vos données aux scientifiques sur Vigie-Nature, ou vous prendre pour un zombi et annoter des corpus pour le traitement automatique des langues sur Zombilingo.

C’est pour nous, chercheurs, l’occasion de faire tomber certaines barrières entre la recherche et le public et de remettre en cause la sacro-sainte expertise : le participant devient peu à peu expert, non pas du domaine de recherche, mais de la tâche qui lui est confiée. C’est surtout un moyen de récolter des données que nous ne pourrions pas obtenir autrement, faute de moyens.
 

Le Turc mécanique est un automate supposé jouer aux échecs mais en réalité un humain s'y cachait. Le nom de la plateforme Amazon Mechanical Turk s'inspire de ce célèbre canular du XVIIIe s.
Le Turc mécanique est un automate supposé jouer aux échecs mais en réalité un humain s'y cachait. Le nom de la plateforme Amazon Mechanical Turk s'inspire de ce célèbre canular du XVIIIe s.

Un concept détourné par Amazon

Une autre forme de crowdsourcing est apparue récemment, le microworking crowdsourcing, ou « travail myriadisé parcellisé » : les participants réalisent de petites tâches pour une rémunération, encore plus petite. La première et la plus grande des plateformes de travail parcellisé appartient, ce n’est pas une surprise, à Amazon, un employeur peu connu pour son respect des travailleurs ou des règles fiscales. Le géant du Web a eu l’idée de créer une plateforme de travail parcellisé pour ses propres besoins de production de données et l’a ouverte à d’autres demandeurs en 2005, moyennant 10 % des transactions réalisées. Amazon Mechanical Turk (AMT) était né. Dans cet univers hors frontières, des demandeurs (requesters) proposent des microtâches (HIT ou Human Intelligence Tasks : « tâches pour l’intelligence humaine » !), à des travailleurs (turkers), en échange d’une microrémunération. C’est l’intelligence artificielle.

Amazon
Mechanical Turk
est, pour la grande
majorité des
turkers, un moyen
de subsistance,
et non un hobby.

Le mythe prend forme : AMT permettrait de faire réaliser des tâches rapidement et pour très peu cher, avec une bonne qualité de résultat, par des gens pour lesquels il s’agit d’un hobby. La réalité, décrite par plusieurs travaux de recherche, est plus proche de la mine de charbon que de la mine d’or. Si la plateforme permet de produire des données relativement rapidement, et pour très peu cher, la qualité n’est satisfaisante que pour des tâches très simples (retranscription de parole…) et se dégrade largement pour les tâches plus complexes, comme le résumé.

Il faut ajouter à cela le fait qu’il n’existe aucun moyen sûr de vérifier que les turkers maîtrisent bien la langue qu’ils disent maîtriser. Surtout, AMT est, pour la grande majorité des turkers, un moyen de subsistance, et non un hobby. Avec des tâches payées entre 0 et 0,25 dollar (en moyenne environ 0,05 dollar), le salaire horaire moyen est de moins de 2 dollars.
 

Amazon mechanical turk
Copie d'écran de l'interface Amazon Mechanical Turk. Les turkers y réalisent des microtâches en échange d’une microrémunération.
Amazon mechanical turk
Copie d'écran de l'interface Amazon Mechanical Turk. Les turkers y réalisent des microtâches en échange d’une microrémunération.

Un générateur de misère sociale

Au-delà de l’indécence des salaires, il n’existe aucun lien entre le requester et les turkers. Ces derniers n’ont aucune couverture sociale, aucun droit, pas même l’assurance d’être payés : les requesters ont le droit de ne pas payer un turker s’ils estiment qu’il a mal fait son travail, sans avoir à le justifier : le rêve du Medef enfin réalisé ! AMT ne fournit, à l’inverse, aucun moyen pour les turkers d’évaluer un requester ou de le bannir. Leur relation est donc totalement déséquilibrée. Les turkers doivent à tout prix préserver leur réputation, ce qui induit un travail caché important : pour se former, ils font des tâches sans être « déclarés », donc sans être payés. Ils sont à l’affût des « bons » HIT (un peu rémunérateurs et intéressants), parfois en se relayant en famille, et ont les mêmes problèmes que tous les employés à temps partiel subi : il leur est très difficile de trouver le temps de chercher un autre travail, bien que la plupart en souhaitent un. Enfin, les turkers sont considérés comme des travailleurs indépendants par Amazon, les États voient donc leur échapper les cotisations sociales qui leur sont dues. Une goutte d’eau dans ce qui leur échappe.

Les turkers n’ont
aucune couverture
sociale, aucun
droit, pas même
l’assurance
d’être payés.

Jusqu’ici, la France était un peu préservée d’AMT, mais voici qu’une entreprise française (que je ne citerai pas pour ne pas lui faire de publicité) vient de naître qui en reprend les grandes lignes, jouant avec les limites de ce qu’il reste du droit du travail français. D’une idée généreuse au service du plus grand nombre, ils n’ont retenu que les profits à tirer.

La convivialité, l’échange, le partage ne sont pas des valeurs désuètes. Elles sont au cœur du crowdsourcing, du logiciel libre, des fablabs (ateliers ouverts de fabrication où se sont notamment développées les imprimantes en 3D). Elles sont porteuses d’innovations et de liberté. Les sites Web d’AMT, comme de son équivalent français, sont attractifs, mais ils cachent des générateurs de misère sociale. Faut-il le rappeler : l’exploitation des plus faibles est tout sauf une innovation !

Notes
  • 1. Chiffre de décembre 2014 (source : Wikipédia).