Donner du sens à la science

Big Data, la déferlante des octets

Big Data, Centre de données, stockage de données
Un des centres de données de Google, à Council Bluffs (Iowa) qui s'étend sur 10 000 m².
dossier
Paru le 22.01.2014
Mis à jour le 29.03.2017

Big Data, la déferlante des octets

D’Internet aux grands instruments de recherche, le volume mondial des données numériques ne cesse d’augmenter. À l’occasion de la sortie de l’ouvrage collectif «Les Big Data à découvert» chez CNRS Éditions, replongez dans notre dossier consacré aux recherches menées sur ce phénomène.

Édito par Mokrane Bouzeghoub

Les sciences et technologies du numérique connaissent actuellement un changement d’échelle majeur par la taille et la complexité des données qu’elles manipulent. L’information est devenue un objet monnayable, négociable, et une cible d’investissements. Des dizaines de programmes, à travers le monde, sont lancés sur les Big Data, l’Open Data, la numérisation du patrimoine et les gisements de données scientifiques. Du déluge des données est née la science des données. Ses champs d’application sont nombreux. Parmi ceux-ci, on trouve les domaines de la santé (suivi de la propagation d’épidémies, aide au diagnostic, surveillance post-opératoire, etc.), de la gestion de crise (catastrophes naturelles ou nucléaires), des transports (analyse de flux,), de l’environnement (prévisions météorologiques, contrôle de la pollution), mais aussi de l’éducation (stratégies de « jeux sérieux », etc.). Les principaux verrous scientifiques concernent le traitement et l’analyse à grande échelle, la sémantique des données, l’hétérogénéité des sources et la surcharge informationnelle générée par les moteurs de recherche qui donnent des réponses pléthoriques, mais souvent peu pertinentes. À cette liste, Il faut ajouter des verrous sociétaux comme le contrôle des réseaux sociaux et les règles de vie dans le cyberespace, la réglementation sur l’hébergement des données, la certification des protocoles de diffusion et de protection des contenus, l’amélioration de la confiance numérique, la protection des données privées et la préservation des données pour les générations futures. La Mission interdisciplinarité (MI) du CNRS a lancé en 2012 un grand programme sur la gestion, l’analyse et l’exploitation des très grandes masses de données scientifiques (le défi Mastodons). Son objectif majeur est de favoriser l’émergence d’une communauté scientifique interdisciplinaire autour de la science des données, susceptible de rivaliser avec les grands laboratoires internationaux et de produire des solutions originales.

Article
Alors qu’on assiste à une explosion du volume des données produites par la recherche, la question de leur archivage est devenue cruciale, tant pour pérenniser notre héritage scientifique que pour permettre...
Point de vue
Les algorithmes sont de plus en plus présents dans notre vie quotidienne et dans les processus de décision. Or, à l’ère...
Article
À l’occasion du colloque « Modélisation : succès et limites », le chercheur Frédéric Alexandre nous éclaire sur les...
Point de vue
Grandes consommatrices d’énergie, les technologies de l’information ont un coût environnemental qui n'a rien de virtuel. Spécialistes en informatique, Jean-Marc Pierson et Laurent Lefèvre nous expliquent...
Article
Une récente loi prévoit d’ouvrir l’accès aux données de santé des assurés sociaux. Une occasion pour certains d'étudier les maladies, leur évolution et l'efficacité des traitements, et pour d'...
Article
Smartphones, drones, capteurs de température ou de mouvement... D’ici à 2020, 50 milliards d’appareils seront connectés...
Point de vue
Nos téléphones portables, ordinateurs, cartes bancaires ou de fidélité collectent chaque jour de nombreuses...
Article
Combinant les avancées du séquençage à haut débit et du big data, la métagénomique a bouleversé notre vision du monde microscopique en dévoilant l'incroyable biodiversité des écosystèmes microbiens, qu...
Article
Réseaux sociaux, clouds, appareils nomades, grands instruments scientifiques… Depuis quelques années, les nouvelles technologies produisent des masses de données numériques qu’il faut trier, analyser, stocker...
Infographie
La puissance de calcul est devenue un enjeu stratégique majeur pour les États. Voici quelques enseignements tirés du...
Vidéo

Pour la première fois au monde, des chercheurs ont calculé la façon dont la matière a évolué dans la totalité de l’...

Article
Une analyse des enjeux que soulève l’avènement du numérique dans le domaine des sciences humaines et sociales, en compagnie du sociologue Michel Wieviorka.
Article
Produire des flots de données ne sert pas à grand-chose si l’on ne peut pas les stocker quelque part. Partout dans le monde fleurissent des datacenters de plus en plus gros tandis que les chercheurs inventent...
Article
Comment trier et analyser les masses de données numériques que notre société en général, et la science en particulier,...