reliures.bnf.fr

Reliures de la Bibliothèque nationale de France

Web sémantique

Contexte

Depuis 2011, la Bibliothèque nationale de France est entrée dans une démarche d’ouverture des données, avec l’exposition, sur le « Web de données », de données brutes, sur le site data.bnf.fr. Elle répond ainsi à sa mission de diffusion de son patrimoine le plus largement possible et par les moyens techniques les plus modernes.

L’ouverture des données, dans la perspective du « Web sémantique » ou « Web de données » (linked data), est définie par le W3C. Le « Web sémantique » permet aux données disponibles d’être plus facilement utilisables et interprétables automatiquement par des machines. S’appuyant sur ces technologies, le « Web de données » (Linked Data) permet de sortir les données de leurs silos, pour les publier sur le Web et les relier entre elles pour constituer un réseau global d'informations.

Pour en savoir plus sur le web sémantique, ainsi que sur son application dans les projets de la BnF : http://data.bnf.fr/semanticweb

Ces outils sont une opportunité pour l’intégration des bibliothèques et la valorisation de leurs ressources sur le Web. A la BnF, ils permettent d’articuler les différentes bases comme BnF Catalogue général, BnF Archives et manuscrits, la bibliothèque numérique Gallica, et de se lier automatiquement à des données extérieures. En fournissant des données structurées et exploitables par des machines, ces techniques permettent de sortir des ressources, rares et de bonnes qualité, jusque-là cachées dans le « Web profond », afin de les rendre visibles sur le Web.

La BnF étend cette expérience au site reliures.bnf.fr en diffusant ses données en RDF (Resource Description Framework).

Pour l’utilisateur il s’agit de trouver facilement ou de découvrir les informations et les ressources associées de la BnF, numériques ou non, sur le Web. Les données d’une base spécialisée comme celle des reliures sont liées avec des données complémentaires, permettant notamment de les contextualiser ou de les comparer.

Par exemple, depuis une page de reliures.bnf.fr, l’internaute peut naviguer vers Gallica et voir une reliure numérisée, ou encore vers data.bnf.fr, pour retrouver les autres documents associés à un ancien possesseur de reliure.

Récupérer et utiliser les données de reliures.bnf.fr

Vous pouvez récupérer les données de reliures.bnf.fr :

Les données du site reliures.bnf.fr sont disponibles sous Licence ouverte de l’État, permettant leur libre utilisation, sous réserve de la mention de la source : « Bibliothèque nationale de France ».

Identifiants pérennes :

La BnF fournit des identifiants qu’elle attribue selon le mécanisme ARK (Archival resource key) pour les descriptions de reliures, et les descriptions de relieurs et possesseurs (personnes et organisations).

A partir de ces ARK, les URI sont constituées sur le modèle : http://reliures.bnf.fr/ark. Les URL sont construits sur le même modèle.

Modèle de données

Modèle de données RDF du site reliures.bnf.fr :

modele RDF

modele RDF2

Le modèle de données de reliures.bnf.fr s’appuie sur le modèle bibliographique modèle FRBR (Functional requirements for Bibliographic Records) élaboré par l’IFLA.

Nous avons distingué :

  • l’exemplaire du livre : la reliure est décrite à ce niveau. Cet exemplaire a une histoire : il a des destinataires ou des commanditaires, des anciens possesseurs, une date d’entrée à la bibliothèque et un état de conservation. Il correspond au niveau « item » du modèle FRBR.
  • le texte publié ou manuscrit, contenu dans la reliure, qui correspond au niveau « manifestation » du modèle FRBR.
  • les personnes et organisations : par exemple relieurs et ateliers, anciens possesseurs, commanditaires, destinataires de la reliure.
  • les sources bibliographiques qui ont permis la rédaction de la description scientifique de la reliure. Elles sont traitées comme « manifestations ».

Ce modèle est en relation avec le modèle de data.bnf.fr.

Choix des ontologies et des vocabulaires

Ontologies :

Nous avons choisi d’utiliser les vocabulaires et ontologies existantes, dans la mesure du possible :

Pour la description de personnes et des organisations :

Pour la description de livres et des relations avec les personnes et organisations :

Les éléments spécifiques à la description de reliures sont décrits avec des propriétés propres à la BnF, et déclarées dans l’ontologie « bnf-onto ».

Vocabulaires :

Pour décrire les rôles des personnes ou organisations sur un livre (relieur, ancien possesseur par exemple), nous utilisons:

Données embarquées dans le HTML : Schema.org

Les pages de reliures.bnf.fr sont ouvertes sur le Web, et accessibles directement par les internautes depuis les moteurs de recherche.

C'est pourquoi, outre les méthodes traditionnelles d'indexation de la page d'accueil, nous avons choisi d'embarquer des balises de Schema.org.

Créé à l’initiative des moteurs Google, Yahoo et Bing, il fournit un vocabulaire pour ajouter de l'information au contenu HTML avec un format de microdonnées, favorisant l’indexation des sites.

Nous utilisons :

dans les pages de description des reliures :

  • itemscope="itemscope" itemtype="http://schema.org/Book"
  • itemprop="image" : lien vers le lot d’image Gallica
  • itemprop="name" : titre de la reliure
  • itemprop="description" : description de la reliure

dans les pages de description des personnes :

  • itemscope="itemscope" itemtype=http://schema.org/Person
  • itemprop="name" : nom principal de la personne
  • itemprop="description" : occupations principales de la personne dans le cadre du site reliures.bnf.fr
  • itemprop="nationality" : nationalité
  • itemprop="birthDate" : naissance
  • itemprop="deathDate" : mort
  • itemprop="biographie" : notes sur la personne
  • itemprop="memberOf" : signaler un atelier dirigé par un relieur ou dont un relieur est membre
  • Itemprop="homeLocation" : localisation de la personne

dans les pages de description des organisations :

  • itemscope="itemscope" itemtype="http://schema.org/Organization"
  • itemprop="foundingDate" : date de création de l'organisation
  • itemprop="description" : note sur l’organisation
  • itemprop="name" : nom de l'organisation
  • itemprop="location" : localisation de l’organisation
  • itemprop="Member" : signaler un relieur membre d’un atelier

Logiciel utilisé : CubicWeb

CubicWeb est une plateforme open source de développement d'applications Web sémantique, publiée sous la licence LGPL.

Ce logiciel permet notamment :

  • d’extraire et intégrer des données de sources hétérogènes et dans des formats variés (TEI, CSV, MARC, Dublin Core),
  • de les fusionner, de les aligner et les regrouper dans une base SQL,
  • de générer les pages souhaitées sous n’importe quel format, en l’occurrence : HTML, RDF-XML ou PDF.

Il s’appuie sur le langage de requête RQL (Relation Query Language), similaire au langage SPARQL du W3C’s, et sur le langage Python

Pour en savoir plus :

logo cubicWeb