17 novembre 2009

Linked Data, ou comment publier les données sur le Web

Linked Data est une branche du web sémantique qui décrit méthode pour connecter et partager des données accessibles sur le web. Bien entendu, c'est encore Tim Berners-Lee qui est à l'origine de ce concept dans un avis personnel Linked Data - Design Issues .


Source: LinkedData.org

La méthode consiste à appliquer quatres principes recommandées par Tim Berners-Lee pour publier et interconnecter des données structurées sur le Web:
  1. identifier les données à l'aide des bonnes vieilles URIs (identifiants)
  2. utiliser le protocole HTTP pour les URIs
  3. décrire les données avec des informations utiles en utilisant les standards comme RDF
  4. lier les données vers des données externes (comme faire des liens externes dans des documents)
Sur le web (d'aujourd'hui) d'hier, on ne trouvait "que" des documents qui liaient à d'autres documents qui eux même, faisaient référence à d'autres documents. Tout cela, je le rappelle, grâce aux URIs et au protocole HTTP.

Maintenant, voilà qu'on se met à parler de Linked Data, une style de publication pour créer un web de données, qui sont décrites par des données qui renvoient vers d'autres données, qui se trouvent ailleurs, sur le Web.

Le web sémantique est alors un immense espace de données interconnectées et échangeables. On parle aussi de web de données, terme qui me parait plus expressif que de parler de sémantique.

Pour illustrer ces propos, prenons une données, identifiée par une URI sur le protocole HTTP, décrite par des métadonnées et qui renvoie vers d'autres donnée. C'est une donnée qui rempli les quatres principes de Berners-Lee, on peut donc la qualifier de Linked Data.

La carte de visite électronique de Tim Berners-Lee est une donnée de ce type accessible par l'URI suivante:

http://www.w3.org/People/Berners-Lee/card#i

On utilise maintenant DISCO, un navigateur (RDF) de Linked Data qui permet de surfer de donnée en donnée interconnectées.

Rendez vous sur DISCO et entrez y l'adresse (le nom) de la carte de visite de Berners-Lee. On voit apparaitre tout un tas de données la décrivant et la reliant vers d'autres données. Un clic sur une donnée permet donc d'accéder à sa description et ses liens vers d'autres données. Cliquez sur n'importe quelle autre donnée pour mieux comprendre leur lien.

Une parenthèse sur la colonne des propriétés des données (knows). Il s'agit des termes qui sortent d'ontologies. Nous aurons l'occasion d'y revenir... La bibliothèque ferme maintenant...

Aucun commentaire:

Enregistrer un commentaire