Vous êtes ici
Les données des réseaux sociaux mobilisées contre le Covid-19
Vous êtes professeur à l’université Paris Dauphine et membre du Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision1. Dans le cadre de la lutte contre la pandémie de Covid-19, Facebook et l’université Paris sciences et lettres (PSL) ont signé un accord donnant accès aux chercheurs de l’établissement francilien à des données d’utilisateurs du réseau social. De quoi s’agit-il ?
Jamal Atif2 : Au travers de son programme « data for good », Facebook met à disposition des chercheurs un ensemble de données de mobilité des utilisateurs de son réseau social. Ils rejoignent ainsi une démarche similaire à Google qui a ouvert des données issues de Google Map. Avec cet accord, l’université PSL, avec ses partenaires, dont le CNRS, très mobilisés sur le Covid-19, devient la première université française à avoir accès à ces données.
De quelles données s’agit-il précisément ?
J. A. : Je voudrais d’abord souligner qu’il s’agit de données agrégées à des échelles spatiales qui ne compromettent pas la vie privée des utilisateurs, point sur lequel nous sommes très exigeants. Typiquement, il s’agit d’informations statistiques sur le déplacement des personnes. On peut voir cela comme un graphe dynamique où des nœuds correspondant à des zones géographiques (Iris3, département, région) sont reliés par des arcs qui portent des informations sur les flux de personnes, celles-ci pouvant éventuellement être qualifiées.
Quelle est l’utilité de ces données ?
J. A. : D’où qu’elles proviennent (Facebook, Google Map, opérateurs téléphoniques, entreprises de géomarketing…), ces données de mobilité sont précieuses pour construire des modèles prédictifs ancrés spatialement qui, en complément de modèles plus globaux, permettent de comprendre la dynamique de la pandémie et d’évaluer les politiques sanitaires. À l’évidence, dans une période critique telle que celle que nous traversons, disposer de ces données dans le strict respect des droits individuels, est un atout supplémentaire pour faire face au Covid-19.
À quel niveau se situe l’effort de recherche ?
J. A. : Précisons que nous ne sommes pas dans une démarche de recherche classique visant à la production de connaissances sous la forme d’articles scientifiques. Dans le cadre de la crise en cours, notre ambition est de nous rendre utiles comme spécialistes du numérique en cherchant à produire, à partir d’un corpus de connaissances établies, des outils pour éclairer la décision publique.
Nos travaux étant en cours, mais également pour des raisons de confidentialité, il m’est difficile d’être plus précis. Cela étant, il est relativement clair que le déconfinement à court terme et la prévention d’un redémarrage de la pandémie à moyen terme sont des problématiques sur lesquelles nous pouvons apporter quelque chose. J’ai évoqué précédemment des modèles spatialisés construits à partir des données de mobilités. C’est une piste que nous poursuivons. D’autres modèles et algorithmes sont à l’étude.
Par ailleurs, s’agissant de données dynamiques, d’un très gros volume et hétérogènes, des questions se posent sur la manière de les gérer, en particulier de les agréger de manière cohérente. La problématique de l’anonymisation et de préservation de la vie privée est également l’objet de recherches actives. Enfin, les données sont souvent entachées de divers « bruits » et biais du fait de nombreux facteurs : représentativité des utilisateurs d’applications, protocoles de remonté des données sanitaires, transformations des données par divers algorithmes, etc. Ainsi, la quantification des incertitudes qui en résultent est un enjeu capital. Toutes ces questions sont cruciales dans le contexte actuel tout en alimentant aussi des problématiques de recherche à long terme.
Il y a quelques jours, le ministre de la Santé, Olivier Véran, et le secrétaire d’État au Numérique, Cédric O, ont annoncé avoir confié à un groupe de chercheurs et de développeurs du public et du privé, sous l’égide de l’Institut national de recherche en sciences et technologies du numérique (Inria), le développement d’une application de « contact tracing », ou suivi de contacts, dans la perspective du déconfinement. Y a-t-il un lien entre cette annonce et vos travaux ?
J. A. : Comme leur nom l’indique, les applications de traçage de contact permettent de tracer les contacts entre propriétaires de smartphones, en exploitant la technologie Bluetooth. L'intérêt de cette approche est d’informer une personne si elle a été exposée à la maladie, et lui suggérer une stratégie adaptée. Différents protocoles existent, mais il me semble qu’il reste des verrous technologiques à lever, notamment sur l’inférence de la distance entre personnes à partir des informations Bluetooth. Je fais confiance au consortium PEPP-PT (initiales en anglais de Traçage de proximité paneuropéen préservant la confidentialité, Ndlr) pour trouver les bonnes solutions. Outre le volet technologique, il reste à convaincre les citoyens du bien-fondé de l’utilisation de ce type d’applications. Par ailleurs, depuis l’annonce des ministres, Google et Apple ont déclaré, et c’est une première remarquable, travailler ensemble pour mettre à disposition des États l’infrastructure logicielle pour déployer ce type d’application.
À l’heure actuelle, il n’y a aucun lien entre cette annonce et nos travaux. Les données de traçage en soi ne permettent pas de localiser les individus. Cela étant, si une large proportion de la population consentait à partager ses données de mobilité, cela permettrait de construire des modèles individualisés, nonobstant les verrous scientifiques et technologiques à lever du point de vue des algorithmes et de la préservation de la vie privée. Quoi qu’il en soit, cela ne serait acceptable qu’avec le consentement des citoyens. ♦
- 1. Unité CNRS/Université Paris-Dauphine
- 2. Jamal Atif est professeur à l’université Paris-Dauphine, membre du Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision (Lamsade - CNRS/Université Paris-Dauphine) et chargé de mission Science des données et intelligence artificielle à l’Institut des sciences de l'information et de leurs interactions (INS2I) du CNRS.
- 3. Pour Ilots regroupés pour l'information statistique.
Mots-clés
Partager cet article
Auteur
Né en 1974, Mathieu Grousson est journaliste scientifique. Diplômé de l’École supérieure de journalisme de Lille, il est également docteur en physique.
Commentaires
Connectez-vous, rejoignez la communauté
du journal CNRS