Les entreprises et les gouvernements doivent maintenant travailler activement pour faire tourner le moteur de l'innovation à partir du Big data.
La révolution des données d'aujourd'hui n'est pas seulement due à l'abondance croissante des données ; elle est alimentée par des technologies fondamentales qui changent la façon dont nous recueillons, stockons, analysons et transformons les données. Ensemble, ces facteurs nous permettent de glaner des informations puissantes au cœur des données et ainsi d'acquérir de nouvelles connaissances, de découvrir de nouveaux liens et de faire de nouvelles prédictions.
1. Collecte des données
Tout au long de l'histoire, nous avons toujours recueilli des données et les avons utilisées pour faire progresser la société. Mais souvent, les données étaient trop rares. Aujourd'hui, nous avons la chance de pouvoir exploiter davantage de données du monde qui nous entoure - des données dotées d'une plus grande signification, rassemblées sous des formes plus utiles et produisant des résultats plus délibérés. Les données sont passées d'une ressource autrefois rare à une ressource de plus en plus abondante, vitale et renouvelable.
Cette évolution n'a pas été rendue possible par notre capacité à consolider et à exploiter les informations personnelles, mais plutôt par notre capacité à connecter toute une série d'appareils et de capteurs à l'internet, ce qui génère aujourd'hui une multitude de nouvelles données qui croissent à un rythme exponentiel. En conséquence, les données sont produites partout - par les capteurs utilisés le long des routes pour mesurer la circulation, par la musique et les films numériques que nous créons, par les satellites qui nous survolent, par les capteurs et les systèmes qui contrôlent nos usines et nos marchés financiers, et par les outils que nous utilisons pour concevoir numériquement la prochaine nouveauté. Ces informations se développent plus rapidement, circulent plus loin et sont de plus en plus importantes.
On estime déjà que 2,5 quintillions d'octets de données sont générés chaque jour. Nos esprits de l'ère analogique ont du mal à envisager l'énormité de ces données. Pour donner un ordre d'idée, l'année dernière, le monde a créé suffisamment de données numériques pour que l'on puisse s'en rendre compte, pour remplir une pile de DVD qui s'étendrait de la Terre à la Lune et vice-versa. Et le rythme auquel nous créons des données s'accélère également. Le volume des données commerciales dans le monde, toutes entreprises confondues, double aujourd'hui tous les 1,2 ans. D'où vient tout cela ? Voici quelques exemples de sources, parmi beaucoup d'autres :
+ L'information numérique dans les hôpitaux, provenant principalement de l'imagerie clinique, devrait atteindre 665 téraoctets par jour d'ici 2015, ce qui permettra de trouver des traitements et de sauver des vies.
+ Les compagnies aériennes transcontinentales modernes sont tellement équipées de capteurs connectés sur leurs moteurs, leurs volets et leur train d'atterrissage qu'elles peuvent générer un demi-téraoctet de données par vol pour améliorer les performances de vol , réduire les turbulences, améliorer la sécurité et identifier les défauts éventuels des moteurs 2 000 fois plus vite qu'auparavant. Cela vous donne une idée de l'énorme quantité de données utiles générées par les seuls avions commerciaux.
+ Les satellites météorologiques, les observatoires météorologiques, les radars et d'autres capteurs saisissent plus de 2,25 milliards de points de données météorologiques 15 fois par heure, soit 20 téraoctets par jour, ce qui permet d'établir des prévisions météorologiques plus précises dans le monde entier.
+ Les bourses financières génèrent quatre à cinq téraoctets de données par jour, utilisées pour des analyses en temps réel et pour repérer les activités commerciales problématiques, tout en contribuant à la croissance des entreprises et à la prospérité de l'économie.
+ Des capteurs télématiques installés dans des dizaines de milliers de véhicules de livraison permettent de suivre les performances des moteurs, d'améliorer les itinéraires et d'anticiper les problèmes. Les données des capteurs des véhicules combinées à l'analyse des données cartographiques ont permis aux entreprises d'économiser du carburant et de réduire les émissions, ce qui équivaut à retirer des milliers de voitures de la circulation pendant un an.
+ Le Grand collisionneur de hadrons du CERN, l'Organisation européenne pour la recherche nucléaire, génère 40 téraoctets de données à chaque seconde de chaque expérience, ce qui permet de mieux comprendre les secrets les plus profonds du fonctionnement de l'univers. De même, le Large Synoptic Survey Telescope du Chili génère 30 téraoctets de données sur notre univers en observant le ciel chaque nuit.
+ Le séquençage d'un seul génome d'ADN peut générer 200 gigaoctets de données. Le coût du séquençage de l'ADN étant en chute libre, les scientifiques construisent des bases de données massives contenant des centaines de milliers de ces séquences afin de trouver les différences et les similitudes qui permettent de réaliser des percées médicales et de sauver des vies.
Ce n'est pas seulement la quantité de données qui augmente de façon exponentielle, mais aussi la façon dont elles sont produites. Avec l'augmentation du nombre d'appareils qui relient l'internet au monde qui nous entoure, créant ainsi un "internet des objets", une multitude de capteurs créent chaque jour des formes de données entièrement nouvelles. La prochaine grande innovation pourrait être basée sur de nombreuses petites choses, car on estime que 50 milliards d'appareils dotés de puissants capteurs seront connectés à l'internet d'ici à 2026.
Ces appareils créeront des données en mesurant, par exemple, l'humidité du sol, les performances des moteurs, l'efficacité des systèmes énergétiques et la localisation des crises d'asthme. En tant qu'êtres humains, nous n'utilisons que cinq sens pour comprendre le monde qui nous entoure. Bientôt, les appareils connectés de la planète détecteront toute une série de caractéristiques du monde physique afin de nous aider à mieux comprendre et à améliorer le monde qui nous entoure - et, ce faisant, produiront des exaoctets de nouvelles données utiles.