Glossaire:Big Data

De iconomie
Aller à : navigation, rechercher

L'expression "Big Data" désigne le fait qu'une grande quantité de données de toute nature s'est accumulée, en particulier à l'occasion des utilisations de l'Internet.

Cette expression, ainsi que quelques autres comme "entrepôt de données" (datawarehouse) ou "data lake", suggère cependant une approche quantitative qui incite à ignorer les exigences de la qualité des données.

Elle a par ailleurs encouragé une focalisation sur l'analyse des corrélations, censée apporter la connaissance sans qu'il soit nécessaire de poser des hypothèses concernant la causalité[1]. Or on connaît de nombreux exemples de corrélations qui ne signifient rien (spurious correlations) car elles sont dues au hasard.

Il n'est en réalité possible de tirer parti de la masse de données que fournit le Big Data qu'à condition de passer par une étape d'analyse de la qualité des données en évaluant d'une part les concepts qui les définissent, d'autre part l'exactitude des observations dont elles résultent. Isabelle Boydens a décrit les difficultés que l'on rencontre lorsque l'on entreprend d'interpréter le contenu d'une grande base de données[2].

Références

  1. "In a big data world we won't have to be fixed on causality; instead we can discover patterns and correlations in the data that offer us novel and invaluable insights" (Viktor Mayer-Schonberger et Kenneth Niel Cukier, Big Data, Mariner Books, 2014).
  2. Informatique, normes et temps, Bruylant, Bruxelles 1999

Direction.png Voir aussi : Corrélation et causalité (Big Data)
Définition dans le JargonF