Les données non structurées en question

Ces deux expressions – données structurées et données non structurées – sont aujourd’hui  répandues et acceptées. C’est la première et principale façon de caractériser les données dans la société de l’information, dans les entreprises et leurs directions des systèmes d’information (DSI) mais aussi, de plus en plus, pour les responsables métiers, pour les juristes et pour les professionnels de l’information.

On parle aussi d' »informations structurées » versus « informations non structurées » mais il semble que cette appellation perde du terrain face aux données, sans doute parce que le mot information porte davantage sur le sens et que le mot donnée porte davantage sur la forme; peut-être aussi parce que le mot information en anglais ne prend pas le pluriel).

Même les métadonnées (les données sur les données) sont réparties entre métadonnées structurées et métadonnées non structurées (cf la norme d’archivage électronique MoReq).

Le sens est clair:

Données structurées: informations (mots, signes, chiffres…) contrôlées par des référentiels et présentées dans des cases (les champs d’une base de données) qui permettent leur interprétation et leur traitement par des machines.

Données non structurées: le reste, tout ce qui n’est pas organisé en base de données, c’est-à-dire la bureautique, la messagerie, les images, les vidéos, etc.

Vérification faite cependant, il n’y a pas tant de définitions que cela dans les glossaires informatiques, juridiques ou d’archivage. A noter aussi que certains sites définissent les données structurées, d’autres les données non structurées et quelques-uns les deux. Voir le petit recueil de définitions en ligne en fin d’article.

Je voudrais faire sur ces expressions trois remarques:

La première est que parler de données structurées ou non structurées est d’abord un point de vue d’informaticien…

Lire la suite


Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *