Donner du sens à la science

Comment mieux prédire les épidémies

Comment mieux prédire les épidémies

15.02.2016, par
Mis à jour le 04.03.2020
Pour mieux combattre les virus, il est crucial d'affiner les modèles de propagation d’épidémies à toutes les échelles. Et cela passe parfois par une cour d’école, comme nous l’expliquait en 2016 Alain Barrat, physicien spécialiste des réseaux complexes.

Malgré les progrès de la médecine et de la santé publique au cours du XXe siècle, les maladies infectieuses continuent de tuer des millions de personnes chaque année. Il est donc crucial de mieux comprendre comment ces maladies se propagent, afin de définir des mesures efficaces pour les combattre.

Utiliser les réseaux sociaux

Concernant la prédiction, on a beaucoup entendu parler des réseaux sociaux et de leur utilité pour prédire l’évolution des épidémies, en particulier de la grippe saisonnière. De façon plus générale, les données décrivant le comportement humain à différentes échelles sont cruciales pour nourrir les modèles qui décrivent la propagation des maladies infectieuses. Le logiciel Gleam, par exemple, se base sur des données détaillées de densités de population et de flux de voyageurs entre zones géographiques pour prédire l’évolution d’une possible épidémie au niveau mondial. Il a été utilisé, en coordination avec l’Organisation mondiale de la santé, pendant la crise d'Ebola, afin d’évaluer en temps réel le risque d’importation de cas dans différents pays. Allié à des données venant de Twitter, il est aussi utilisé dans Fluoutlook.org, pour prédire la progression de la grippe saisonnière.

Ces modèles décrivent des propagations à moyenne ou grande échelle, et reposent donc sur des données précises concernant la mobilité des individus à ces échelles. Et pourtant, ils se fondent sur une hypothèse relativement simpliste sur les contacts au sein d’une population, appelée « mélange homogène » : à savoir, que tous les individus peuvent a priori avoir des contacts entre eux. Cette hypothèse est utilisée pour deux raisons : d’une part, la nécessité d’avoir des modèles simples dont les résultats peuvent être facilement interprétés et la difficulté de mettre en place des modèles intégrant plusieurs échelles de description ; d’autre part, la difficulté d’obtenir des données réelles qui décrivent les contacts au sein d’une population. La bonne nouvelle, c'est que ce second obstacle pourrait bientôt disparaître.

Réseau des contacts mesurés dans un lycée. Chaque point représente un individu et un lien signifie qu’il y a eu contact entre les personnes lors de la campagne de mesure. Les différentes couleurs correspondent aux différentes classes.
Réseau des contacts mesurés dans un lycée. Chaque point représente un individu et un lien signifie qu’il y a eu contact entre les personnes lors de la campagne de mesure. Les différentes couleurs correspondent aux différentes classes.

Aujourd'hui, une grande partie des données concernant les contacts entre personnes vient de questionnaires, parfois administrés à grande échelle et assez coûteux. Mais depuis quelques années, de nouvelles procédures ont vu le jour : plusieurs groupes de recherche ont en effet mis au point des infrastructures basées sur des petits capteurs radio qui interagissent à faible distance et peuvent détecter la proximité et les contacts en face-à-face des individus qui les portent. Parmi les pionniers de ce système, la collaboration franco-italienne SocioPatterns1 l’a utilisé pour capter des données dans des contextes très différents et dans plusieurs pays.

Une qualification plus fine des contacts

Dans une série de publications scientifiques, les membres de SocioPatterns ont décrit les nombreux résultats qu’ils ont obtenus à partir des données collectées. Leur analyse a permis de déterminer que ces réseaux sont en général structurés de façon très différente d’un « mélange homogène ». Par exemple, les élèves d’une école primaire passent environ trois fois plus de temps en contact avec des élèves de la même classe qu’avec des élèves d’autres classes ; dans un hôpital, les infirmiers ont beaucoup de contacts entre eux et avec les patients, mais les contacts médecins-patients et patients-patients sont rares. Les moments de la journée où les contacts ont lieu diffèrent aussi selon les contextes : ils sont répartis sur toute la journée dans les bureaux, tandis qu'ils sont très majoritairement limités aux pauses dans les établissements scolaires, et qu'ils dépendent de l’organisation du travail et des visites dans les hôpitaux.

On ne peut pas
traiter tous les contacts comme
équivalents ; certains
sont beaucoup
plus longs
que d’autres.

Malgré ces différences, des caractéristiques communes à tous les contextes sont observées, en particulier concernant leur durée : la majorité des contacts sont brefs (moins de 2 minutes), mais un nombre non négligeable de contacts sont beaucoup plus longs que la moyenne. Or l’hypothèse généralement admise est que la probabilité de transmission de maladies est proportionnelle à la durée des contacts. Certains contacts sont donc beaucoup plus importants que d’autres et on ne peut pas les traiter comme tous équivalents. Plus surprenant, en ce qui concerne la durée des contacts, la similarité des statistiques observées dans différents contextes et à des périodes différentes indique qu’il est possible d’utiliser les mesures faites dans un contexte pour produire une modélisation fiable dans un autre.

Badge (capteur portable sans fil) utilisé pour mesurer les contacts entre individus.
Badge (capteur portable sans fil) utilisé pour mesurer les contacts entre individus.

Des interactions sous-estimées

L’utilisation jointe de capteurs et de questionnaires a également permis de mettre en évidence des différences importantes entre les données collectées par ces deux méthodes : une grande partie des contacts brefs ne sont pas rapportés dans les questionnaires, mais les contacts suffisamment longs le sont tous ; de plus, le nombre de contacts tend à être sous-estimé, tandis que leurs durées sont surestimées. Ces différences peuvent avoir un impact significatif sur les modèles et montrent le besoin pour les chercheurs qui modélisent de bien connaître la source des données utilisées et leurs biais éventuels.

Notre travail en milieu scolaire nous a permis de proposer des stratégies de lutte en cas d’épidémie.

Ces données, intéressantes en elles-mêmes, ont un intérêt tout particulier dans les modèles de propragation des maladies infectieuses. Pour cela, il faut comprendre quelles sont les caractéristiques des contacts les plus importantes à mesurer et quel est le niveau de détail nécessaire. Par exemple, l’information précise sur les moments exacts où une personne est en contact avec une autre est très liée à un contexte et un moment donnés — donc peu utile pour une modélisation générale des contacts. En revanche, comparer le nombre de contacts extra- et intra-classes est pertinent pour comprendre comment contenir un foyer dans une école. Nous avons de plus montré que de telles informations peuvent même être extrapolées à partir de données incomplètes2.

Grâce à des badges RFID, on peut mesurer la durée de contact entre tous les élèves d’une école au cours d’une journée. Des données essentielles pour prédire l'évolution d'une épidémie.
Grâce à des badges RFID, on peut mesurer la durée de contact entre tous les élèves d’une école au cours d’une journée. Des données essentielles pour prédire l'évolution d'une épidémie.

Notre travail dans des établissements scolaires a permis de proposer et d’évaluer des stratégies de lutte en cas d’épidémie : bien que la fermeture d’écoles soit considérée comme un moyen efficace de limitation de la propagation, il s’agit d’une mesure coûteuse. Puisque les contacts ont lieu majoritairement dans les classes, nous avons proposé de fermer seulement les classes où des cas de maladie sont détectés. Cela a presque la même efficacité que la fermeture de l’école entière, pour un coût beaucoup plus faible3.

Des modèles à affiner

Ce type d’analyse n’en est qu’à ses débuts. Il faut continuer à collecter les données dans des contextes différents et à les rendre accessibles à la communauté scientifique. Il reste de nombreuses pistes à explorer, comme le développement de méthodes permettant de trouver des structures dans les données (groupes ayant plus de contacts que d’autres, séquences de contacts temporellement corrélées) : de telles méthodes, même si elles semblent très théoriques, peuvent avoir des applications cruciales en termes de santé publique.

Enrichir ces données avec d’autres aspects du comportement humain (comme l’hygiène des mains) ou des prélèvements microbiologiques permettraient également de mieux comprendre les facteurs déterminants des événements de transmission. Pour affiner et rendre les prédictions plus fiables, un autre enjeu consiste à créer des modèles multi-échelles, qui couplent les différents types de données (structure des contacts entre individus au niveau d’un bâtiment, mobilité à l’échelle d’une ville et entre villes), en ne retenant à chaque échelle et pour chaque type de données que les caractéristiques pertinentes. Mais nous pourrions aller encore plus loin, en intégrant par exemple la réaction des individus au fait qu’une épidémie est en cours, ce qui pourrait entraîner une diminution spontanée de leurs contacts ou de leur mobilité. On le voit : ce champ, encore très ouvert, ne pourra progresser qu'en intégrant des compétences diverses, venues aussi bien de l’épidémiologie, de la moédlisation, que des sciences sociales.

Réseau formé par les contacts entre membres du personnel d’un service hospitalier (en orange, les médecins ; en violet, les infirmiers ; en jaune, les aides-soignants ; en vert, les agents de service). Les liens verts indiquent que les soignants se sont correctement lavé les mains entre leur dernier contact avec un patient et leur contact avec un autre soignant ; les liens rouges indiquent qu’ils ne l’ont pas fait.
Réseau formé par les contacts entre membres du personnel d’un service hospitalier (en orange, les médecins ; en violet, les infirmiers ; en jaune, les aides-soignants ; en vert, les agents de service). Les liens verts indiquent que les soignants se sont correctement lavé les mains entre leur dernier contact avec un patient et leur contact avec un autre soignant ; les liens rouges indiquent qu’ils ne l’ont pas fait.

Les points de vue, les opinions et les analyses publiés dans cette rubrique n’engagent que leur auteur. Ils ne sauraient constituer une quelconque position du CNRS.

Notes
  • 1. SocioPatterns est une collaboration entre les scientifiques de l’ISI Foundation (Italy), du Centre de physique théorique (France), du Laboratoire de physique de l’ENS Lyon (France) et de Bitmanufaktur (Allemagne).
  • 2. « Compensating for population sampling in simulations of epidemic spread on temporal contact networks, » M. Génois et al., Nat. Comm., 2015, vol. 6 : 8860.
  • 3. Mitigation of infectious disease at school : targeted class closure vs school closure, » V. Gemmetto et al., BMC Infectious Diseases, 2014, vol. 14 : 695.