Glossaire:donnée

De iconomie
Aller à : navigation, rechercher

Une "donnée" est le résultat d'une observation opérée sur un être réel, ou d'un calcul réalisé sur diverses observations.

Derrière le mot « donnée » se trouve un piège. Il suggère que les « données » ont été données par la nature comme s’il s’agissait d’une matière première. Des expressions comme « big data », « data lake » ou « entrepôt de données » suggèrent qu’il suffirait de les déverser dans un stockage pour pouvoir les utiliser à sa guise.

Mais les données ne sont pas une matière première : elles ont été produites et avant d’être produites elles avaient été choisies[1].

Les choix qui définissent les données d’une entreprise se font en trois étapes :

  1. d’abord elle choisit, dans l’immensité du monde réel, d’observer quelques "populations" : clients, équipements, produits, agents, etc. ;
  2. ensuite elle choisit les quelques attributs qu’il lui convient d’observer parmi les attributs innombrables des "individus" de ces populations ;
  3. enfin elle choisit la façon dont les observations seront codées : périodicité, unité de mesure, nomenclature pour les données qualitatives.

Ces choix doivent répondre aux besoins de l’entreprise, à sa relation avec les êtres qu’elle observe, aux exigences de l’action dans la situation qui est la sienne : ils sont soumis à un critère de pertinence.

Il faut aussi que l’observation soit exacte, c’est-à-dire capable d’alimenter un raisonnement exact. L’exactitude n’est pas la même chose que la précision : souvent un ordre de grandeur pourra suffire alors qu’un excès de précision serait fallacieux (il ne convient pas de mesurer la taille d’un être humain au micron près).

Certaines données sont enfin calculées en soumettant le résultat des observations à un algorithme : c’est ainsi que l’on obtient des indicateurs de gestion, le résultat d’une entreprise, le taux de croissance du PIB, etc. La qualité des données calculées dépend d’une part de celle des observations qui alimentent le calcul, d’autre part de celle de l’algorithme.

Références

  1. Andrea Jones-Rooy, I’m a data scientist who is skeptical about data, Quartz, 24 juillet 2019.

Direction.png Voir aussi : qualité des données et information
Définition dans le JargonF