Metadonnee

ï»ż
Metadonnee

Métadonnée

Page d'aide sur l'homonymie Pour l’article homonyme, voir MĂ©tadonnĂ©e (audio)

Une mĂ©tadonnĂ©e (mot composĂ© du prĂ©fixe grec meta, indiquant l'auto-rĂ©fĂ©rence ; le mot signifie donc proprement « donnĂ©e de/Ă  propos de donnĂ©e Â») est une donnĂ©e servant Ă  dĂ©finir ou dĂ©crire une autre donnĂ©e quel que soit son support (papier ou Ă©lectronique).

Les métadonnées sont à la base des techniques du web sémantique.

Sommaire

Historique

Tous les établissements qui ont à gérer de l'information, bibliothÚques, archives ou médiathÚques ont déjà une longue pratique dans la codification du signalement ou des contenus des documents qu'ils manipulent. Avant l'arrivée de l'informatique on utilisait des fiches cartonnées dont la structure a été normalisée en 1954 sous la référence ISBD (International standard bibliographic description).

Ces descriptions ont ensuite été informatisées sous la forme de notices bibliographiques et normalisées (voir par exemple les formats MARC en 1965 utilisant la norme ISO 2709 dont la conception a démarré en 1960). Elles facilitent la gestion interne des ressources documentaires et, cÎté usagers, permettent d'optimiser la recherche et la localisation des documents.

Les bibliothĂšques numĂ©riques ont eu recours aux mĂȘmes dispositifs pour gĂ©rer et localiser des documents Ă©lectroniques. Dans les applications distribuĂ©es, on a rapidement normalisĂ© l'Ă©change d'Ă©lĂ©ments de donnĂ©es extraits de ces notices et en 1988, la BibliothĂšque du CongrĂšs, aux États-Unis, proposait un protocole pour la recherche d'information (Z39.50) qui fut revu en 1992.

Le terme mĂ©tadonnĂ©e (en anglais : metadata) est apparu dans le cadre de la description de ressources sur Internet dans les annĂ©es 1990 et s'est ensuite gĂ©nĂ©ralisĂ©.

Généralisation

Les langages de balisage de type GML, puis SGML et HTML, ont introduit une rupture dans la nature des mĂ©tadonnĂ©es. Auparavant la distinction entre les fiches, les notices, d'une part, et les contenus, d'autre part, Ă©tait quasiment absolue. Cette nouvelle structuration de l'information permit d'introduire des mĂ©tadonnĂ©es dans les documents eux-mĂȘmes. Les CommunautĂ©s europĂ©ennes adoptĂšrent le langage SGML dĂšs 1984.

La notion de mĂ©tadonnĂ©es utilisables par les ordinateurs fut proposĂ©e assez tĂŽt dans l'histoire du Web, dĂšs 1994, par son inventeur Tim Berners-Lee, lors de la confĂ©rence WWW 94 oĂč fut annoncĂ©e la crĂ©ation du W3C. Les mĂ©tadonnĂ©es sont en effet au cƓur de l'architecture Web[1].

En 1995, les métadonnées firent l'objet d'un atelier à Dublin (Ohio), pour les méthodes de recherche d'information. En parallÚle, la bibliothÚque du CongrÚs proposait une 3e version du protocole Z39.50.

En 1999, le W3C dĂ©finit le cadre permettant de crĂ©er un rĂ©seau de mĂ©tadonnĂ©es acceptant le langage XML : Resource Description Framework (RDF).

Le tronc commun de métadonnées Dublin Core a été adopté par l'Union européenne en 2002.

Une notion qui concerne tous les organismes

Description

Les notices contiennent des informations sur la source du document (titre, auteur, date, sujet, éditeur, etc.), la nature du document (monographie, périodique, etc.), son contenu informationnel (descripteurs, mots-clés, résumé) et sa localisation physique (la cote).

Pour un document numĂ©rique, ces notices s'appellent des mĂ©tadonnĂ©es et sont contenues dans le document lui-mĂȘme. Les mĂ©tadonnĂ©es sont aussi utilisĂ©es pour d'autres types de ressources informatiques contenant des images ou du son (cd-rom, dvd-rom).

Les mĂ©tadonnĂ©es sont, dans le cadre du Web sĂ©mantique, des donnĂ©es signifiantes qui permettent de faciliter l'accĂšs au contenu informationnel d'une ressource informatique, une notice de contenu intĂ©grĂ©e en quelque sorte (dans l'en-tĂȘte des documents HTML cĂŽtĂ© code source ou en tant que fichier XML autonome par exemple).

Au moins quinze Ă©lĂ©ments, rĂ©partis autour de trois domaines, permettent d'identifier et de dĂ©crire les ressources documentaires :

Les métadonnées sont un élément essentiel de l'architecture Web.

Toutefois, limiter les mĂ©tadonnĂ©es aux ressources numĂ©riques de types documents, sons et images, serait une erreur : dans les bases de donnĂ©es relationnelles, les mĂ©tadonnĂ©es incluent le nom de chaque table et le type de chaque colonne dans la table.

Une notion essentielle à l'interopérabilité

Article dĂ©taillĂ© : InteropĂ©rabilitĂ© informatique.

Les métadonnées correspondent à des marqueurs que l'on introduit dans les fichiers ou dans des langages de programmation appropriés, les langages de marquage XML.

Les marqueurs ont pour effet d'améliorer l'efficacité des recherches d'information par rapport aux recherches plein texte.

RDF (Resource Description Framework) crée les conditions d'interopérabilité, avec des réseaux de métadonnées, et l'utilisation du langage XML.

Les ressources numériques balisées transportent avec elles leurs propres métadonnées lorsqu'elles sont téléchargées, copiées, répliquées ou transmises par des messageries électroniques.

Ceci s'applique à tous les types de ressources numériques (texte, son, image, multimédia).

Les métadonnées sont ainsi l'un des principaux éléments de l'étiquetage avec les tags, surtout dans le Web 2.0.

Le potentiel des mĂ©tadonnĂ©es est beaucoup plus important, car elles peuvent faire interopĂ©rer les ressources informatiques, dans la mesure oĂč elles ont Ă©tĂ© paramĂ©trĂ©es et structurĂ©es dans des dictionnaires de donnĂ©es (ou registres de mĂ©tadonnĂ©es). On peut alors faire communiquer les bases de donnĂ©es classiques, utilisĂ©es dans les progiciels de gestion intĂ©grĂ©s) et les donnĂ©es non structurĂ©es (documents, images, manipulĂ©s en gestion des connaissances...).

Tous les secteurs de l'Ă©conomie peuvent ĂȘtre concernĂ©s

Pour un ensemble de raisons, tant historiques que juridiques, on n'a pas encore pris conscience, en Europe, de la sensibilité de la gestion des métadonnées pour les processus de décision dans les entreprises.

MĂȘme aux États-Unis, cette prise de conscience a Ă©tĂ© difficile, la technicitĂ© du sujet cachant son caractĂšre stratĂ©gique. [2]

L'expert américain Robert Steele a bien compris l'importance des métadonnées dans les sources ouvertes.

Les mĂ©tadonnĂ©es concernent tous les secteurs de l'Ă©conomie Ă  travers la gestion de contenu, puisque tous les organismes gĂšrent des ressources documentaires sous forme Ă©lectronique :

Dans l'économie du savoir, il est important de protéger le patrimoine informationnel constitué par les ressources documentaires, car les documents électroniques contiennent souvent des données confidentielles.

La circulation de documents sous forme électronique entre différents types d'organismes rend la protection du patrimoine informationnel complexe.

Différence de perception entre l'Amérique et l'Europe

Selon Robert Steele, expert américain en sources ouvertes, qui intervient à Bruxelles, les métadonnées sont appelées à jouer un rÎle de plus en plus important pour la représentation avancée de contexte dans les modÚles de contrÎle d'accÚs et les langages de ressources Web actives[3].

En Amérique

Un certain nombre d'équipes impliquées dans la sémantique sur le web ont organisé un atelier à Dublin (Ohio) en 1995 sur les métadonnées, en définissant le standard Dublin Core.

DiffĂ©rents dĂ©partements du gouvernement fĂ©dĂ©ral (DoD, ...) se sont dotĂ©s de registres de mĂ©tadonnĂ©es, qui permettent de dĂ©finir un champ commun de partage de connaissances entre des organisations travaillant sur des sujets de souverainetĂ© : dĂ©fense, justice, environnement...[4]. La BibliothĂšque du CongrĂšs, situĂ©e Ă  Washington, joue un rĂŽle moteur dans la dĂ©finition des mĂ©tadonnĂ©es aux États-Unis.

Les standards de mĂ©tadonnĂ©es sont l'un des trois Ă©lĂ©ments clĂ©s de la stratĂ©gie donnĂ©es en rĂ©seau centrĂ© (Net-Centric Data Strategy) du dĂ©partement de la dĂ©fense des États-Unis, avec les communautĂ©s d'intĂ©rĂȘt et les services d'entreprise GIG.

Le gouvernement canadien doit se conformer au Dublin Core depuis octobre 2001.[5] Le gouvernement canadien a édicté des lignes directrices pour décrire les métadonnées utilisées dans les ressources Web.[6]

Dans l'Union européenne

Au Royaume-Uni, l'UKOLN (United Kingdom Office for Library and Information Networking) est l'organisme le plus avancĂ© sur la gestion de l'information numĂ©rique (mĂ©tadonnĂ©es et interopĂ©rabilitĂ©). Il dĂ©veloppe des projets pour la recherche et dĂ©veloppement financĂ©s par l'Union europĂ©enne. Il a une influence sur la rĂ©glementation, l'« awareness Â», la recherche et dĂ©veloppement, les techniques Web. Le gouvernement britannique a dĂ©fini un standard de mĂ©tadonnĂ©es pour le e-gouvernement (e-GMS)

En France, par manque d'information ou de formation Ă  ce propos, relativement peu de webmestres intĂšgrent des mĂ©tadonnĂ©es aux contenus numĂ©riques qu'ils publient. La raison est probablement que les mĂ©tadonnĂ©es n'ont pas de valeur juridique normative au niveau europĂ©en et dans les États membres (en particulier en France), puisqu'il n'y a pas d'obligation lĂ©gale ni de standard officiel. Les webmestres introduisent au coup par coup des mĂ©taĂ©lĂ©ments (meta tags, balises meta) dans les pages web.

Des organismes comme le Commissariat à l'énergie atomique et le CNES (membres de l'association ARISTOTE) emploient des métadonnées pour l'archivage à long terme, en utilisant les recommandations de l'OAIS.

La CORES Resolution (standards interoperability forum Resolution on Metadata Element Identifiers 12-12-2002) a adopté en 2002 les Identifiants de Ressource Uniformes (Uniform Resource Identifiers, URI) pour l'accÚs aux ressources Web, en s'appuyant sur des standards de métadonnées.

« Nos standards de mĂ©tadonnĂ©es ont des Ă©lĂ©ments - unitĂ©s signifiantes - qui peuvent ĂȘtre comparĂ©s et mis en correspondance avec des Ă©lĂ©ments d'autres standards Â».

Ce groupe de projet a travaillĂ© pour la Commission europĂ©enne. Il est composĂ© de personnes appartenant Ă  :

NASA taxonomy - Metadata.

Les classifications étant structurées, il est plus aisé de gérer la traçabilité, d'agréger les données, et de protéger le patrimoine informationnel.

Les métadonnées sont ainsi un élément essentiel du chantier de gestion de contenu en ingénierie des connaissances.

MĂ©tadonnĂ©es et traçabilitĂ© : gestion de la preuve

La gestion des documents d'archives doit pouvoir s'appuyer sur des données cohérentes le long du cycle de vie des données. Il existe donc des normes de gestion des documents d'archives (ISO 15489), et une norme particuliÚre sur les métadonnées (ISO).

MĂ©tadonnĂ©es et agrĂ©gation des donnĂ©es : gouvernance

Dans le domaine de la gouvernance en gĂ©nĂ©ral (gouvernement, administrations, entreprises, les mĂ©tadonnĂ©es stockĂ©es dans des mĂ©tadictionnaires (ou repository ; rĂ©fĂ©rentiels) sont utilisĂ©es comme « donnĂ©es sur les donnĂ©es Â», ou donnĂ©es de rĂ©fĂ©rence.

Les mĂ©tadonnĂ©es permettent de dĂ©crire les donnĂ©es utilisĂ©es dans les analyses et prises de dĂ©cisions :

Les mĂ©tadonnĂ©es facilitent les analyses croisĂ©es dans la gouvernance d'entreprise :

Cadre de référence

Des travaux internationaux convergent pour utiliser « intelligemment Â» avec le Web les mĂ©tadonnĂ©es avec des moteurs de recherche en dĂ©crivant les ressources numĂ©riques ou physiques et en Ă©tablissant des relations avec d'autres ressources.

Mise en Ɠuvre d'un registre de mĂ©tadonnĂ©es

Article dĂ©taillĂ© : Registre de mĂ©tadonnĂ©es.

Le pilotage d'organisations complexes (administrations centrales et locales, pÎles de compétitivité, ...) nécessite d'employer des informations d'autorité, qui sont contenues dans des référentiels de métadonnées appelés registres de métadonnées.

Un registre de mĂ©tadonnĂ©es est un « SystĂšme de gestion des mĂ©tadonnĂ©es, c'est-Ă -dire un systĂšme formel qui fournit l'information d'autoritĂ© sur la sĂ©mantique et la structure de chaque Ă©lĂ©ment. Pour chaque Ă©lĂ©ment, le registre en donne la dĂ©finition, les qualificatifs qui lui sont associĂ©s, ainsi que les correspondances avec des Ă©quivalents dans d'autres langues ou d'autres schĂ©mas. Â»

La norme ISO/CEI 11179, dont l'application est fortement conseillĂ©e par le gouvernement amĂ©ricain, inclut les recommandations pour la mise en Ɠuvre d'un registre de mĂ©tadonnĂ©es. La partie 6 contient des recommandations organisationnelles. Par exemple, il faut mettre en place, au niveau adĂ©quat, l'organisation qui convient (architectes de donnĂ©es, rĂ©seau de correspondants, ...).

RĂ©fĂ©rentiels de mĂ©tadonnĂ©es gĂ©nĂ©raux : Dublin Core

Article dĂ©taillĂ© : Dublin Core.

Ce rĂ©fĂ©rentiel trouve son origine aux États-Unis (1995) et a Ă©tĂ© adoptĂ© par plus de huit gouvernements.

Le « Dublin Core Â» est la principale initiative visant Ă  la convergence des Ă©lĂ©ments de mĂ©tadonnĂ©es Ă  utiliser.

C'est un schéma de métadonnées générique qui peut servir de base à des registres de métadonnées.

Le Dublin Core pousse à une normalisation dans l'Union européenne, via les données employées dans les systÚmes d'information. La Commission européenne emploie donc des métadonnées dans ses livres blancs, sur des sujets pouvant toucher à la souveraineté.

Le programme IDABC de la Commission européenne (3e phase du programme IDA), concernant les services d'e-Gouvernement, s'appuie largement sur les métadonnées du Dublin Core. Il a donné naissance au projet MIReG, qui vise à développer un framework de métadonnées, concernant les extensions du Dublin Core aux informations gouvernementales, qui soit basé sur les recommandations nationales sur les métadonnées des informations du secteur public.

La directive INSPIRE (2007) incite les États membres et la CommunautĂ© europĂ©enne Ă  mettre en place des organisations publiques (services de jeux de donnĂ©es), chargĂ©es de crĂ©er et de mettre Ă  jour les mĂ©tadonnĂ©es (registres de mĂ©tadonnĂ©es), au moins pour ce qui concerne les informations gĂ©ographiques. Elle devrait faire Ă©voluer le cadre lĂ©gislatif.[7]

Il existe un projet de traduction française de la norme internationale Dublin Core (voir site Web de Artist, 16 octobre 2006), mais aucun organisme ne semble prendre la responsabilité ou le leadership.

Métadonnées et structuration des données

Métadonnées et contenu des pages web

Le contenu des pages web est structuré à l'aide de balises meta, en langage HTML. Les différentes balises employées permettent de structurer les informations selon différents thÚmes (mots-clés, description, auteur, titre, sujet...).

MĂ©tadonnĂ©es et validation des documents : DSDL

Le langage XML a été conçu pour faire circuler de l'information porteuse de sémantique sur la Toile. Cette circulation permet de valider progressivement les informations pour en faire de la connaissance partagée entre des communautés de pratique. Partant du DTD de SGML, l'échelle de validation des Document Schema Definition Languages (DSDL) a été mise au point afin de valider les documents électroniques. Dans le cas d'XML, l'emploi de schémas XML permet de faire passer les documents XML du stade "well-formed" au stade "valid".

Les outils qui participent à cette validation progressive sont les moteurs de recherche, dont l'optimisation s'appuie largement sur les éléments méta du langage HTML employé pour les pages web, les moteurs de rÚgle, et les moteurs d'orchestration.

Dans ce processus global, les liens (type d'élément link dans HTML) mettent à jour en permanence les liens entre pages web pour "optimiser" la connaissance.

Par exemple, dans le commerce électronique, à partir d'une organisation en registre de métadonnées, l'utilisation conjointe du registre ebXML et du registre d'annuaires UDDI permet d'organiser une orchestration (en interne aux entreprises) et une chorégraphie (en externe aux entreprises).

MĂ©tadonnĂ©es et classification : schĂ©mas de classification

Les mĂ©tadonnĂ©es permettent de structurer des classifications. On trouve des exemples de taxonomies employant des mĂ©tadonnĂ©es :

Le « Dublin Core Â» comprend 15 Ă©lĂ©ments de description :

Chaque élément de description a plusieurs raffinements possibles (version qualifiée).

L'utilisation de ce rĂ©fĂ©rentiel doit impĂ©rativement ĂȘtre accompagnĂ©e d'une organisation en registre de mĂ©tadonnĂ©es. Avant toute mise en Ɠuvre de ce rĂ©fĂ©rentiel, il faut ĂȘtre conscient de son caractĂšre sensible sur le plan de la protection du patrimoine informationnel et des contraintes organisationnelles qui y sont liĂ©es. C'est la raison pour laquelle le gouvernement amĂ©ricain conseille fortement de s'appuyer sur les recommandations de la norme ISO/CEI 11179 (partie 6 sur l'enregistrement).

Le moteur de recherche Google s'appuie sur le Dublin Core. La programmation network-centric utilise les métadonnées du Dublin Core.

Le systĂšme de publication d'OpenWeb (PrĂ©sentation des mĂ©tadonnĂ©es « Dublin Core Â») est basĂ© sur ce tronc commun.

La norme ISO 15836:2003 est la transposition normative de ce référentiel en version non qualifiée. Elle est utilisée par plus de huit gouvernements dans le monde. En France, on l'emploie dans la Gestion électronique des documents (GED) ou dans les SystÚmes d'archivage électronique (SAE).

Il n'existe pas de traduction officielle, complÚte, et unique du référentiel Dublin Core en français. Il existe plusieurs guides d'utilisation en français.

Voir : Projet de traduction française de la norme internationale de mĂ©tadonnĂ©es Dublin Core.

Il existe d'autres rĂ©fĂ©rentiels de mĂ©tadonnĂ©es :

  • Le standard 5015.2 du dĂ©partement de la dĂ©fense pour le records management,
  • Open Document Management API (ODMA), trĂšs orientĂ© sur les documents Ă©lectroniques,
  • X500 Green Pages.

Autres référentiels de métadonnées

BibliothĂšques

L'initiative la plus ancienne pour définir des troncs communs d'éléments standardisés de métadonnées remonte aux années 1960, avec le standard MARC développé par la bibliothÚque du CongrÚs.

Le schéma MODS, développé par la BibliothÚque du CongrÚs, est un compromis entre la complexité de MARC et la simplicité du Dublin Core.

Archivage Ă  long terme

L'archivage à long terme se fait selon le modÚle OAIS, avec le schéma XML METS (Metadata Encoding and Transmission Standard). Il est utilisé par le Commissariat à l'énergie atomique et le CNES.

Presse

L'IPTC recommande l'utilisation d'un référentiel international de métadonnées spécifique à la presse, IPTC Core.

Cadre gĂ©nĂ©ral : Web sĂ©mantique, RDF

Article dĂ©taillĂ© : Web sĂ©mantique.

Les mĂ©tadonnĂ©es trouvent leur pleine utilisation dans le Web sĂ©mantique. Celui-ci repose :

  • sur les standards gĂ©nĂ©raux du Web :
  • sur des standards propres au Web sĂ©mantique :
    • Resource Description Framework (RDF) : ce cadre de rĂ©fĂ©rence comporte des modĂšles de graphe destinĂ©s Ă  dĂ©crire de façon formelle les ressources Web et leurs mĂ©tadonnĂ©es, de façon Ă  permettre le traitement automatique de telles descriptions. RDF a Ă©tĂ© dĂ©fini en 1999 par le W3C, c'est le rĂ©fĂ©rentiel de base du Web sĂ©mantique.
    • Les mĂ©tadonnĂ©es peuvent Ă©galement ĂȘtre utilisĂ©es dans des extensions de RDF : RDF Schema et OWL.

Formats

Normalisation

Article dĂ©taillĂ© : Norme de mĂ©tadonnĂ©es.

La quasi-totalité des normes sur les métadonnées ne sont disponibles qu'en anglais. Les seules normes qui soient disponibles en langue française sont celle sur le Dublin Core (qui en réalité est trÚs courte), et surtout la norme ISO 21127 sur le patrimoine culturel immatériel.

La normalisation est importante sur diffĂ©rents aspects : la recherche d'information, la structuration d'ontologies dans le web sĂ©mantique, et la dĂ©finition de rĂšgles mĂ©tier.

METS (Metadata Encoding and Transmission Standard) est un schéma XML développé à l'initiative de la Digital Library Federation (DLF), et autorisant la création et la description intégrale (données descriptives, administratives et structurelles) d'objets numériques textuels ou graphiques.

Les normes sur les registres de métadonnées (ISO 11179, complétée par deux autres normes, Dublin Core) définissent les concepts et l'organisation.

En plus de ces normes gĂ©nĂ©rales, il existe des normes particuliĂšres Ă  certains domaines :

Risques

Risques liés aux métadonnées

Les métadonnées sont utiles à l'interopérabilité, mais leur emploi sans précaution présente des risques.

Voir : Content Security Risks sur le site metadatarisk.org

Le plus grand risque serait d'ignorer l'importance des métadonnées, et de ne pas percevoir qu'elles sont largement utilisées dans beaucoup de systÚmes informatiques.

Utilisation par les langages informatiques

Les mĂ©tadonnĂ©es peuvent ĂȘtre utilisĂ©es dans les langages de marquage : SGML, HTML, XHTML.

XML, et ses langages dĂ©rivĂ©s :

Le langage SKOS, en cours de développement au W3C pour utilisation dans la Communauté européenne, prévoit d'employer des métadonnées dans le cadre RDF en environnement web sémantique.

Le langage Java accepte également les métadonnées.

Voir : Liste des JSR sur l'interopĂ©rabilitĂ© informatique

Génération des métadonnées

Les mĂ©tadonnĂ©es peuvent ĂȘtre introduites de façon manuelle, mais aussi semi-automatique, ou automatique.

Voir :

Critiques

Bien que la majoritĂ© des informaticiens voient les mĂ©tadonnĂ©es comme une opportunitĂ© pour une meilleure interopĂ©rabilitĂ©, certaines critiques font remarquer que :

  • Les mĂ©tadonnĂ©es sont trop chĂšres et consommatrices de temps. L'argument est que les entreprises ne produiront pas de mĂ©tadonnĂ©es sans qu'il y ait un besoin, car cela coĂ»te de l'argent, et les particuliers ne produiront pas de mĂ©tadonnĂ©es complexes parce que leur crĂ©ation prend beaucoup de temps.
  • Les mĂ©tadonnĂ©es sont trop complexes. Les particuliers ne crĂ©eront pas de mĂ©tadonnĂ©es parce que les formats existants, spĂ©cialement MPEG-7, sont trop compliquĂ©s. Tant qu'il n'y aura pas d'outil automatique pour crĂ©er les mĂ©tadonnĂ©es, on n'en crĂ©era pas.
  • Les mĂ©tadonnĂ©es sont subjectives et dĂ©pendent du contexte. Deux personnes associeront probablement des mĂ©tadonnĂ©es diffĂ©rentes Ă  la mĂȘme ressource en raison de leurs points de vue diffĂ©rents. De plus, les mĂ©tadonnĂ©es peuvent ĂȘtre mal interprĂȘtĂ©es du fait qu'elles dĂ©pendent du contexte. Par exemple, la recherche sur "art post-moderne" peut manquer un certain Ă©lĂ©ment parce l'expression n'Ă©tait pas en usage au moment oĂč cette Ɠuvre d'art a Ă©tĂ© crĂ©Ă©e, ou bien la recherche sur les "photos prises Ă  1:00" peut produire des rĂ©sultats confus Ă  cause des diffĂ©rences de temps local.
  • Il n'y a pas de fin aux mĂ©tadonnĂ©es. Par exemple, lorsqu'on annote un match de football avec des mĂ©tadonnĂ©es, on peut dĂ©crire tous les joueurs et leurs actions et s'arrĂȘter lĂ . On peut aussi dĂ©crire la publicitĂ© en arriĂšre-plan et les vĂȘtements que portent les joueurs. On peut aussi dĂ©crire chaque supporter dans les tribunes et les vĂȘtements qu'il porte. Toutes ces mĂ©tadonnĂ©es peuvent ĂȘtre intĂ©ressantes d'une façon ou d'une autre — comme les spectateurs, les sponsors ou une unitĂ© de la police spĂ©cialisĂ©e dans la lutte contre le terrorisme — et mĂȘme pour une simple ressource, la quantitĂ© possible de mĂ©tadonnĂ©es peut ĂȘtre gigantesque.
  • Les mĂ©tadonnĂ©es sont inutiles. Beaucoup de moteurs de recherche permettent aujourd'hui de trouver du texte trĂšs efficacement. D'autres techniques pour rechercher des images, de la vidĂ©o et de la musique deviendront de plus en plus puissantes dans l'avenir. Ainsi, on n'a pas vraiment besoin des mĂ©tadonnĂ©es.
  • Pour les documents multilingues, il faut encore traduire les mĂ©tadonnĂ©es, ce qui accroĂźt la complexitĂ© et les risques. Il faudrait en outre traduire les normes sur les mĂ©tadonnĂ©es dans les principales langues.

Utilisations par types de ressources

Audio

Pour un fichier audio numĂ©rique, les mĂ©tadonnĂ©es peuvent ĂȘtre utilisĂ© pour nommer, dĂ©crire, cataloguer et indiquer la propriĂ©tĂ© ou le droit d'auteur.

Pages Web

Le langage HTML permet de structurer la nature et le contenu des pages Web. C'est l'utilisation la plus classique.

Bases de données relationnelles

Les bases de données relationnelles utilisent aussi des métadonnées dans les tables.

C'est dans la phase d'alignement stratégique des projets de systÚme d'information, en particulier d'urbanisation, que l'on est amené à étudier comment les données de sécurité se positionnent dans l'architecture de données des systÚmes d'information.

SystĂšmes de fichiers Unix

Les systÚmes de fichiers disposent de quelques informations de base sur les fichiers, qui sont à ce titre des métadonnées. Les principales sont le nom du fichier, sa taille, la date de création et de derniÚre modification.

Dans les systĂšmes UNIX, les droits d'accĂšs (en lecture, Ă©criture et exĂ©cution selon l'utilisateur, le groupe, ou les autres) sont des mĂ©tadonnĂ©es sensibles. Ces droits d'accĂšs sont dĂ©crits dans ce que l'on appelle les inodes (contraction d'index-node, nƓud d'index).

Il semblerait que l'avenir de la localisation, de la lecture-repérage et de la collecte d'information dans les systÚmes de fichiers passe par l'utilisation massive des métadonnées.

Certains systÚmes de fichiers en cours de développement comme la version 4 de ReiserFS ou WinFS ont pour objectif de rendre la recherche des fichiers plus simple et plus intuitive, et les métadonnées permettent d'y arriver. Tous les fichiers seront donc pourvus de métadonnées permettant de savoir ce qu'ils contiennent.

Le principe n'est pas nouveau : le BeOS file system (BFS) Ă©tait notamment rĂ©putĂ© pour son support des mĂ©tadonnĂ©es. Le ressource fork du systĂšme de fichiers utilisĂ© par les anciennes version de Mac OS permettait Ă©galement ce type de gestion.

Fichiers bureautiques

Des formats de fichiers tels que PDF, Word, Excel, ou OpenOffice.org utilisent des mĂ©tadonnĂ©es. Elles sont visibles et peuvent ĂȘtre complĂ©tĂ©es Ă  partir du menu Fichier > propriĂ©tĂ©s du document dans l'interface des applications correspondantes.

Le format de document OpenDocument (ou ODF), ouvert, contient des métadonnées dans le fichier meta.xml. Ce format a été recommandé par Bernard Carayon [8] et a été adopté par l'Union européenne.

Contenus multimédia

  • MPEG-7 est une norme de description de contenu qui intĂšgre des mĂ©tadonnĂ©es
  • MPEG-21
  • MXF


Fichiers graphiques

Chaque format d'image numĂ©rique implĂ©mente une façon spĂ©cifique de stocker les mĂ©tadonnĂ©es, mais il existe certaines normes communes Ă  plusieurs types, par exemple :

  • le standard EXIF est utilisable Ă  la fois dans les fichiers JPEG ou TIFF,
  • le standard XMP est intĂ©grable Ă  une douzaine de types de fichier diffĂ©rents (JPEG, JPEG 2000, TIFF, GIF, PNG, etc.).
  • DIG35, et JPX.

Son

Les formats de son numĂ©rique intĂšgrent des mĂ©tadonnĂ©es :

  • Dolby Digital EX
  • Dolby E

etc.

Presse

Les technologies applicables sont PRISM, NewsML, et NITF.

Voir aussi : IPEG

Fichiers MP3

Les métadonnées sont utilisées par le format MP3 dans les tags ID3. On peut en effet y insérer des informations comme le nom de la chanson, de l'interprÚte, ou encore la date de sortie.

Utilisations par types d'applications

Logiciels libres

Les logiciels libres utilisent comme tous les logiciels des métadonnées. Par exemple, le systÚme de gestion intégrée des documents du gouvernement du Québec emploie des métadonnées avec des composants d'indexation et de stockage.

Voir : Services gouvernementaux du QuĂ©bec, fonctions de base en gestion documentaire

En France, dans le Cadre Commun d'InteropĂ©rabilitĂ© du RĂ©fĂ©rentiel GĂ©nĂ©ral d'InteropĂ©rabilitĂ© du programme d'e-Gouvernement ADELE, les technologies du logiciel libre sont reprĂ©sentĂ©es par l'intermĂ©diaire de Zope, qui a des capacitĂ©s Ă  interopĂ©rer via le langage DTML (Dynamic Template Markup Language). Ce langage emploie lui-mĂȘme des mĂ©tadonnĂ©es.

Voir : Zope - Configuring the Metadata Tool

Gestion des brevets

Les droits de propriĂ©tĂ© intellectuelle sont l'un des Ă©lements du Dublin Core. Les donnĂ©es sur les brevets peuvent ĂȘtre indexĂ©es dans des applications de gestion des brevets ou gestion des actifs novateurs (IPAM, Intellectual Property Asset Management, ou IAM), en utilisant des mĂ©tadonnĂ©es.

Voir : Intellectual assets--Corporate value moves from top minds to bottom linesa price on (what's in) your head

Progiciels de gestion intégrés

Les grands progiciels de gestion intégrés (SAP, Oracle Corporation, ...) ont des fonctions permettant de gérer les métadonnées. On les appelle quelquefois gestion des données de référence ou Master Data Management (MDM).

Gestion de contenu, GED

Les applications progicielles de gestion des connaissances ont, dans la gestion de contenu, des fonctions permettant de gérer les métadonnées.

À ce titre, elles sont essentielles pour la gestion de la preuve (voir supra).

La norme SCORM d'apprentissage en ligne utilise le schĂ©ma de description de ressources d’enseignement et d’apprentissage Learning Object Metadata.

Les outils de gestion électronique des documents peuvent également utiliser des métadonnées pour le classement des documents (voir Classement des documents par type dans la GED).

Interfaces de programmation (API)

Les mĂ©tadonnĂ©es peuvent ĂȘtre employĂ©es dans les spĂ©cifications J2EE du langage de programmation Java, en particulier dans les interfaces de programmation (API).

Elles font l'objet de formats d'interface : JMI (Java Metadata Interface), spĂ©cifique au langage Java.

XMI (XML Metadata Interchange) est un standard d'échanges de métadonnées UML.

Moteurs de recherche

Les moteurs de recherche peuvent s'appuyer sur des métadonnées pour améliorer les recherches d'information par rapport aux recherches plein texte. Dans les années 1995-1999, on utilisait beaucoup des métaéléments HTML pour optimiser les premiers moteurs de recherche, mais on s'est rendu compte qu'ils n'étaient pas toujours fiables.

Services Web

Les services Web (architecture SOA) manipulent de grandes quantités de métadonnées. L'organisation WS-I (Web Services Interoperability) a développé une série de profils pour faire évoluer les futures normes impliquées dans l'interopérabilité des services Web.

Voir : Web Services Specifications : Registry And Metadata, 28/12/2006.

Les mĂ©tadonnĂ©es servent Ă  plusieurs choses : elles dĂ©crivent les formats de message que le service prend en charge, et les modĂšles d'Ă©change de messages valides pour un service, grĂące Ă  la spĂ©cification WSDL. Les mĂ©tadonnĂ©es dĂ©crivent aussi les capacitĂ©s et les exigences d'un service, grĂące Ă  la spĂ©cification WS-Policy. Cette derniĂšre forme de mĂ©tadonnĂ©e se nomme la « stratĂ©gie Â» d'un service. Parmi les spĂ©cifications qu'utilisent les services web pour les mĂ©tadonnĂ©es, outre WSDL et WS-Policy, il faut citer WS-Security et WS-MetadataExchange.[9]

Informatique décisionnelle

Les métadonnées permettent d'effectuer des analyses multidimensionnelles, dans les applications de gestion des ressources humaines, finances, gestion de la relation client.

À ce titre, elles sont un Ă©lĂ©ment essentiel de la gouvernance d'entreprise (voir supra).

Commerce Ă©lectronique

Le projet Interoperability of Data in E-Commerce Systems ou INDECS (compatibilité des données dans les systÚmes de commerce électronique) emploie des métadonnées.

Monétique

Les standards en monétique et en systÚmes de paiements par cartes de crédit comportent des métadonnées (exemple).

SystĂšmes d'exploitation

Les métadonnées sont utilisées dans le dernier systÚme d'exploitation Microsoft Windows Vista, dont les conditions de sécurité sont controversées.

Voir : Gartner s'inquiĂšte des mĂ©tadonnĂ©es dans Windows Vista

Messageries Ă©lectroniques

Les courriels gérés par les messageries électroniques peuvent véhiculer des métadonnées. Jason R. Baron a fait une étude dans le cadre de l'IEEE en 1999 sur l'archivage des courriels de l'administration américaine.

Voir :

SystÚmes de gestion de rÚgles métier

Les SGRM définissent des rÚgles métier en employant des métadonnées.

Syndication de contenu Web

Les balises de syndication RSS contiennent des métadonnées.

Authentification unique

Lors du rapprochement de deux organisations différentes, il est nécessaire d'harmoniser les rÚgles d'authentification unique entre les deux organisations. Ceci se fait généralement par l'échange des métadonnées qui permettent d'authetifier les individus concernés.

Métadonnées dynamiques et contexte

L'utilisation de métadonnées dynamiques permet de mieux interpréter le contexte.

Voir :

Les métadonnées sont employées dans les stratégies réseau centré.

Domaines d'application

BibliothÚque numérique

Fonctions régaliennes

Gouvernement et finances :

DĂ©fense :

DĂ©veloppement durable :

SĂ©curitĂ© intĂ©rieure :

Justice :

Environnement, Ă©cologie, agriculture

Sur l'environnement, voir aussi : Liste de registres du projet XMDR

L'Agence de protection de l'environnement des États-Unis (EPA) a dĂ©fini un langage informatique Ă  base de mĂ©tadonnĂ©es : Ecological metadata language.

Commerce Ă©lectronique

Données géospatiales

Autres domaines

Recherche

Le site du Centre pour la communication scientifique directe (CCSD) donne les spĂ©cifications des mĂ©tadonnĂ©es pour le rĂ©fĂ©rentiel des publications du CNRS :

Agriculture

GĂ©ologie

Commerce international

Santé

Marine et océanographie

etc.

Organismes francophones ayant des compétences sur les métadonnées

Liste non exhaustive :

Notes

  1. ↑ Metadata architecture, par Tim Berners-Lee
  2. ↑ Voir http://www.tdan.com/i008fe01.htm SELECTING THE "RIGHT" META DATA TO MANAGE Robert S. Seiner - TDAN.com & KIK Consulting Services
  3. ↑ Communication de Robert Steele sur le rĂŽle des mĂ©tadonnĂ©es.
  4. ↑ Le responsable du chantier DRM (data reference model) du projet FEA du gouvernement fĂ©dĂ©ral, Michael Daconta, est l'ancien responsable du centre d'excellence sur les mĂ©tadonnĂ©es du Department of Homeland Security
  5. ↑ Norme des mĂ©tadonnĂ©es du Gouvernement canadien en direct
  6. ↑ MĂ©tadonnĂ©es pour dĂ©crire les mĂ©tadonnĂ©es du gouvernement du Canada
  7. ↑ La directive 2003/98/CE fournit un cadre pour la rĂ©utilisation des informations du secteur public. Les conditions d'application de la directive sont fonction des États membres et des organismes de secteur public.
  8. ↑ Rapport Ă  armes Ă©gales de Bernard Carayon, 2006
  9. ↑ Introduction Ă  l'architecture de services Web et ses spĂ©cifications WS-*, Luis Felipe Cabrera, Christopher Kurt, Don Box, Microsoft, octobre 2004.

Bibliographie

Les Clés du SuccÚs en Gestion des Métadonnées, Un Livre Blanc d'Alan Perkins de ASG

Voir aussi

Architecture web et interopérabilité

Référentiels

Recherches d'information

Autres applications

Union européenne

Liens externes

  • Portail des sciences de l’information et des bibliothĂšques Portail des sciences de l’information et des bibliothĂšques
  • Portail de l’informatique Portail de l’informatique
Ce document provient de « M%C3%A9tadonn%C3%A9e ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Metadonnee de Wikipédia en français (auteurs)

Regardez d'autres dictionnaires:

  • MĂ©tadonnĂ©e —  Pour l’article homonyme, voir MĂ©tadonnĂ©e (audio).  Une mĂ©tadonnĂ©e (mot composĂ© du prĂ©fixe grec meta, indiquant l auto rĂ©fĂ©rence ; le mot signifie donc proprement « donnĂ©e de/Ă  propos de donnĂ©e Â») est une donnĂ©e servant Ă  
   WikipĂ©dia en Français

  • mĂ©tadonnĂ©e — ● n. f. â–șBASDON Information sur une information. Exemple type: le catalogue d une bibliothĂšque est un ensemble de mĂ©tadonnĂ©es. Les mĂ©tadonnĂ©es sont cruciales pour le fonctionnement et la maintenance d un datawarehouse. On devrait aussi en trouver 
   Dictionnaire d'informatique francophone

  • mĂ©tadonnĂ©e —  n.f. Inf. DonnĂ©e auxiliaire 
   Le dictionnaire des mots absents des autres dictionnaires

  • MĂ©tadonnĂ©e (audio) —  Pour l’article homonyme, voir MĂ©tadonnĂ©e.  Les mĂ©tadonnĂ©es ou metadata, intĂ©grĂ©es dans un fichier audio ou audiovisuel numĂ©rique, sont des informations supplĂ©mentaires. Elles foisonnent avec l apparition du son multicanal, de la HD TV… 
   WikipĂ©dia en Français

  • Createur (metadonnee) — CrĂ©ateur (mĂ©tadonnĂ©e) Dans les mĂ©tadonnĂ©es, le crĂ©ateur du document (en anglais creator) est le nom de la personne, de l organisation ou du service Ă  l origine de la rĂ©daction du document. Le crĂ©ateur est le 2e Ă©lĂ©ment du standard Dublin Core.… 
   WikipĂ©dia en Français

  • CrĂ©ateur (MĂ©tadonnĂ©e) — Dans les mĂ©tadonnĂ©es, le crĂ©ateur du document (en anglais creator) est le nom de la personne, de l organisation ou du service Ă  l origine de la rĂ©daction du document. Le crĂ©ateur est le 2e Ă©lĂ©ment du standard Dublin Core. Normes associĂ©es L… 
   WikipĂ©dia en Français

  • CrĂ©ateur (mĂ©tadonnĂ©e) — Dans les mĂ©tadonnĂ©es, le crĂ©ateur du document (en anglais creator) est le nom de la personne, de l organisation ou du service Ă  l origine de la rĂ©daction du document. Le crĂ©ateur est le 2e Ă©lĂ©ment du standard Dublin Core. Normes associĂ©es L… 
   WikipĂ©dia en Français

  • Couverture (MĂ©tadonnĂ©e) — Pour les articles homonymes, voir Couverture. Dans les mĂ©tadonnĂ©es, la couverture, ou portĂ©e d un document, inclut un domaine gĂ©ographique, un laps de temps, ou une juridiction (nom d une entitĂ© administrative). La couverture (en anglais… 
   WikipĂ©dia en Français

  • Couverture (metadonnee) — Couverture (mĂ©tadonnĂ©e) Pour les articles homonymes, voir Couverture. Dans les mĂ©tadonnĂ©es, la couverture, ou portĂ©e d un document, inclut un domaine gĂ©ographique, un laps de temps, ou une juridiction (nom d une entitĂ© administrative). La… 
   WikipĂ©dia en Français

  • Date (MĂ©tadonnĂ©e) — Dans les mĂ©tadonnĂ©es, la date est un Ă©lĂ©ment utilisĂ© pour spĂ©cifier un jour calendaire dans le calendrier grĂ©gorien. Beaucoup de standards de reprĂ©sentation de donnĂ©es comme XML, XML Schema, Web Ontology Language spĂ©cifient que l on doit utiliser 
   WikipĂ©dia en Français


Share the article and excerpts

Direct link

 Do a right-click on the link above
and select “Copy Link”

We are using cookies for the best presentation of our site. Continuing to use this site, you agree with this.