Retour à l'accueil
accueil renseignements diffusion
Recherche
avancée
 Numéro 67, Avril 2008 
Le monde caché des métadonnées Version Imprimable  Version imprimable


Pierre-Julien Guay  (Vitrine Technologie-Éducation)

Étrange paradoxe de l’ère de l’information : celle-ci circule en telle quantité que nos ordinateurs et nos réseaux en sont réduits à se transmettre, en plus, des métadonnées, c’est-à-dire de l’information sur ces informations.

Tout bien considéré, cette idée n’est pas nouvelle. Après tout, quand on consulte un catalogue de bibliothèque, on trouve là de l’information décrivant un élément de la collection avec le nom du volume, le nom de l’auteur et la cote qui permettra de repérer le document sur les rayons. Cette information est codifiée à l’aide de normes fixées dans des systèmes de classification comme Dewey ou par des spécifications telles que le MARC 21 (Machine-readable cataloging), par exemple. Nos ordinateurs eux-mêmes ne pourraient pas fonctionner sans les métadonnées que sont le nom de fichier, le format, la taille du fichier ainsi que les dates de création et de dernière modification.

Nous aurions certainement moins de plaisir à écouter de la musique sur nos baladeurs si nous ne pouvions choisir en fonction du titre, de l’artiste, du genre musical ou de l’album. Toutes ces informations sont aussi décrites à l’aide de métadonnées, cette fois selon la spécification ID3v1. Aux fichiers musicaux, on peut ajouter des informations sur la date de publication, la piste sur le disque d’origine, les paroles de chanson et une illustration de couverture.

Plusieurs systèmes d’exploitation considèrent maintenant les métadonnées au moment de la recherche de fichiers. Ainsi, une requête peut résulter en une liste d’images, de fichiers musicaux et de documents correspondant aux critères de recherche – par exemple, pour le mot «Japon».


Une image ou mille mots?

Vous êtes probablement déjà un grand producteur de métadonnées à votre insu. En effet, tous les utilisateurs d’applications de partage de vidéos (YouTube) et de photographies (Flickr, par exemple) sont invités à décrire leur contribution à l’aide de mots-clés qui faciliteront le repérage. En transférant vos photos numériques à l’ordinateur, vous transmettez aussi des renseignements associés à une prise de vue : utilisation du flash ou non, ouverture et vitesse d’obturation au minimum. Il est possible d’aller beaucoup plus loin avec la norme IPTC (International Press Telecommunications Council), qui permet d’ajouter le nom de l’auteur de la photographie, une légende et de l’information de copyright.

La spécification EXIF (Exchangeable Image File Format) permet aussi le géoréférencement sous forme de données GPS (longitude, latitude, altitude, direction). L’intérêt? Vous pourrez associer vos photos à Google Earth, par exemple, si vous détenez un compte.

On peut aussi spécifier la ville, la province, le pays et ajouter des mots clés pour décrire la photographie. On se heurte ici à un problème de taille, car l’information textuelle est nécessairement associée à une langue. Or, si la langue utilisée n’est pas connue, vous pouvez, dans la recherche, passer facilement à côté de documents fort pertinents, mais tout à fait invisibles.

Photoshop supporte également la spécification DICOM (Digital Imaging and Communications in Medecine), qui permet d’associer à des images médicales l’information sur le patient, le dossier, le médecin traitant, l’équipement utilisé et son fabricant.


Des métadonnées d’office

Nos logiciels quotidiens enregistrent également une quantité impressionnante de métadonnées. Microsoft Office enregistre le nom du dernier auteur d’un document et l’entreprise où il travaille, le moment où le document a été imprimé, mais aussi des notes de révision ou de versions précédentes, le texte masqué et les commentaires.

La suite libre OpenOffice n’est pas en reste et enregistre des informations sur la langue du document, le cycle et la durée d’édition, le nombre de pages, de tables, de dessins et d’objets incorporés. Les documents en format PDF peuvent contenir le même type de métadonnées. Qu’arrive-t-il lorsque vous placez ce type de document en ligne? Souhaitez-vous vraiment que le nom de votre ordinateur, celui du disque ou du serveur utilisé pour l’enregistrement du fichier soient aussi diffusés dans le cyberespace? Sinon, un peu de lecture s’impose peut-être.


Dans le cyberespace

Aussi bien l’avouer, sans les métadonnées, le Web serait un fouillis inextricable. Pour commencer, chaque fichier en format HTML contient un minimum de métadonnées, ne serait-ce que le titre de la page et le format d’encodage.

Plus connu comme flux d’information, RSS est aussi une spécification de métadonnées qui peut contenir de l’information sur les droits d’auteur, voire une description détaillée en Dublin Core, une norme ISO comprenant une quinzaine de descripteurs normalisés. Par exemple, pour optimiser le repérage et l’utilisation des ressources en ligne, les épisodes de baladodiffusion de La Vitrine Technologie-Éducation sont soigneusement décrits à l’aide d’un résumé, d’une illustration, de la spécification de la durée, des droits d’auteur et de la taille des fichiers.


Applications en éducation

Si, depuis peu, les acteurs de l’éducation entendent si souvent parler de normes, c’est parce qu’on découvre tout le potentiel des métadonnées pour référencer et faciliter le repérage de ressources d’enseignement et d’apprentissage. L’ennui, c’est qu’on met souvent l’accent sur les aspects techniques et franchement peu intéressants. Le défi, c’est d’arriver à ce que les métadonnées liées à l’éducation soient utilisées de façon aussi transparente que pour les appareils numériques et les fichiers musicaux… et qu’on n’en parle plus!

Ce virage est déjà largement entrepris par les organismes partenaires TIC du réseau collégial. Si vous visitez régulièrement les sites de La Vitrine Technologie-Éducation et de Profweb et appréciez la pertinence des informations et du contenu, c’est en grande partie grâce aux métadonnées invisibles qui assurent la synchronisation, le partage et la transmission d’information. Et si vous lisez cet article sur le site du Clic, il y a de grandes chances que ce soient les métadonnées qui vous y aient conduits!

Creative Commons License Cette création est mise à disposition sous un contrat Creative Commons. Dernières mises à jour : 10/04/2015