Le Big data, un nouvel eldorado ?

Chaque jour, chacun d’entre nous génère et sauvegarde perpétuellement, volontairement ou non, une importante quantité de données. Cette dernière ne cesse de croitre du fait de l’apparition de nouvelles sources comme les réseaux sociaux, les tablettes tactiles, les Smartphones, les téléviseurs connectés, etc. Analyser et traiter ces données est devenu impossible avec les systèmes actuels. Défini par IBM comme « un large volume de données que l’on ne peut plus travailler avec des outils traditionnels », le Big Data promet de révolutionner le futur.

 

Les « big » chiffres du Big Data
Les chiffres du Big Data sont vertigineux ! Chaque jour, 2,5 exaoctets de données sont générées à travers le monde. Un exaoctet, soit 1018 octets, représente 4000 fois le contenu de la bibliothèque du Congrès américaine. Depuis 2010, la barre du zetaoctet (1021 octets) par an a été franchie. Chaque année, le volume d’information produit augmente de 60% !

A titre d’exemple, un Boeing produit 20 téraoctets (1012octets)/heure de données, 250 milliards d’emails sont envoyés par jour (dont 80% de spam), 72h de vidéos sont déposées par minute sur YouTube.

 

Les 3V du Big Data
Le Big Data ne se résume pas au problème de la quantité des données mais constitue une famille d’outils répondant à une triple problématique (la règle des 3V) :

  • Le Volume de données important qu’il faut stocker et traiter ;
  • La grande Variété d’informations, provenant de sources variées (images, vidéos, audio, géolocalisation, réseaux sociaux, supports mobiles, etc.) et pas toujours structurées ;
  • La Vélocité : le traitement des données, en dépit de leur démultiplication, doit continuer à s’effectuer dans des contraintes de temps très réduites, voire en temps réel. Il est essentiel d’exploiter les données avant leur dépréciation.

 

3v big data

 

Des acteurs déjà bien positionnés sur le créneau
Confrontées au besoin d’analyser d’importants volumes de données, les entreprises comme Google (en développant Map Reduce en 2004) ou Yahoo (principale contributeur au projet Hadoop autour duquel s’articule la majorité des offres) ont été parmi les premières à créer de nouvelles technologies permettant de traiter très rapidement ce type d’informations. Aujourd’hui, des acteurs historiques sont également présents sur ce créneau : IBM, Oracle, Microsoft… Le 14 novembre 2013, Orange a officiellement lancé son offre Big Data, Fluxvision à destination des entreprises et collectivités.

 

 

Les Technologies du Big Data
Face à la démultiplication des données qui peuvent être publiques, géo-démographiques ou relever de la propriété des consommateurs, différentes solutions peuvent entrer en jeu :

  • les bases de données NoSQL (à l’instar de MongoDB, Cassandra ou Redis) : considérées comme plus performantes que le traditionnel SQL, elles permettent de mettre en place des systèmes de stockage pour l’analyse massive de données.
  • Les infrastructures de serveurs (comme le framework Hadoop) : ils permettent de distribuer les traitements sur des dizaines, des centaines, voire des milliers de nœuds.
  • Le stockage des données en mémoire qui permet d’accélérer les temps de traitement des requêtes.

Si ces technologies s’adressent de prime abord aux grandes entreprises, elles sont de plus en plus accessibles aux PME. Aux Etats-Unis, la plupart des start-ups ont intégré le Big Data dans le développement de leur business. En France, la situation évolue plus lentement mais devrait accélérer avec l’arrivée de nouvelles solutions moins coûteuses : Google propose un outil (BigQuery) capable d’analyser 500 Go de données par cinq machines et pendant cinq heures pour un montant d’environ 200 euros. Selon l’enquête One Poll commanditée par Teradata, 26% des entreprises françaises questionnées ont actuellement un projet de Big Data en cours et 23% envisagent d’en avoir un dans les années à venir.

 

 

La révolution Big Data
Le déluge informationnel est un marché prometteur qui est en train de créer de nouvelles opportunités pour les entreprises de secteurs différents, mais pas seulement. Les applications du Big Data sont nombreuses, même si beaucoup ne sont encore qu’au stade théorique.

Actuellement, ce sont surtout les entreprises qui s’intéressent au traitement volumineux des données. En effet, elles y voient un formidable outil d’analyse de leurs clients afin de servir à des actions de marketing personnalisé. Aux Etats-Unis, certaines enseignes textiles utilisent le Big Data pour jouer sur l’élasticité des prix : chaque soir le magasin peut adapter les prix indiqués sur des étiquettes électroniques en fonction de l’écoulement des stocks. Ainsi, le Big Data permet de pratiquer un marketing ultra individualisé, comportemental et de développer le géo-marketing. En analysant le comportement des consommateurs, en identifiant les prospects, les tendances, les prévisions de vente, les entreprises obtiennent des connaissances sur les habitudes de consommation, les attentes, et peuvent donc, à terme, anticiper et proposer des réponses adaptées aux consommateurs. Pour ces raisons, le Big Data constitue un réel atout marketing et commercial dans un monde consumériste.

Au niveau de la logistique, le Big Data va servir aux entreprises dans l’optimisation de la gestion de leurs inventaires, de la logistique et des négociations avec les fournisseurs.

Par ailleurs, lors de la réélection de Barack Obama, l’analyse de Big Data a joué un rôle important dans l’étude des opinions de la population (le gouvernement américain possède six des dix plus puissants supercalculateurs de la planète).

empreinte big data

Plus surprenant, le Big Data est également utilisé dans la prédiction des crimes. Le logiciel PredPol (predictive policing) a été conçu pour prédire où et quand un crime va se produire grâce à l’analyse d’une base de données recensant les infractions passées et donc d’aiguiller la police. En 2011, les villes de Santa Cruz en Californie et Los Angeles ont utilisé ce logiciel. Le nombre de cambriolages a diminué de 19% à Santa Cruz. A Los Angeles, les agressions ont chuté de 33% et les crimes violents de 21%. A l’avenir, il pourrait également être utilisé pour des visées médicales. En collectant des informations sur les habitudes alimentaires et les différents problèmes de santé d’une personne, l’ordinateur pourrait prédire à quel moment interviendra une éventuelle attaque cardiaque. Egalement, cela permettrait de faciliter le calcul intensif de données gigantesques comme les séquences de l’ADN humain.

Les Big Data créent donc une sorte d’intelligence artificielle pouvant permettre de progresser et d’accroître la performance dans des domaines aussi variés que le commerce, l’analyse d’opinions politiques, la génomique, la lutte contre la criminalité ou la sécurité. Néanmoins, dans certains pays, comme en France, les lois imposent une anonymisation des données personnelles : le croisement des informations sur les internautes ne peut donc se faire sur une personne mais sur une catégorie d’utilisateurs. Par ailleurs, le Big Data est confronté à une seconde limite, celle des compétences : il manque en effet de nombreux data analystes.

Les 1er et 2 avril prochain se tiendra à Paris la quatrième édition du salon Big Data.

Charlène EVENO

5 Responses to Le Big data, un nouvel eldorado ?

  1. Pingback: Le Big data, un nouvel eldorado ? | Cellie | An...

  2. Pingback: Le Big data, un nouvel eldorado ? | Cellie...

  3. Pingback: Le Big data, un nouvel eldorado ? | Veille...

  4. Pingback: Le Big data, un nouvel eldorado ? | VinaLor

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *


Le contenu des commentaires doit respecter les lois et les réglementations en vigueur. Cellie se réserve le droit de supprimer tout commentaire illicite, propos raciste, diffamatoire ou injurieux, divulguant des informations relatives à la vie privée d’une personne, utilisant des œuvres protégées par les droits d’auteur, ainsi que tout commentaire promotionnel ou contenant des propos agressifs. Les points de vue et les propos contenus dans les articles de Cellie sont sous la responsabilité unique de leurs auteurs respectifs.