Informations sur la dernière version des données en RDF
Le projet data.bnf.fr s'inscrit dans une démarche d'ouverture des données sur le web, y compris hors de la communauté des bibliothèques.
Afin d’encourager la réutilisation des données brutes, cette ouverture a deux aspects :
Les outils du web de données répondent à des problèmes anciens des bibliothèques, en particulier autour de la gestion de formats divers et de l’échange de données.
Ils offrent une présence nouvelle de ces ressources sur le web en les rendant plus facilement accessibles et réutilisables et en les liant à des ressources complémentaires.
Le projet data.bnf.fr utilise des données produites dans des formats divers, notamment Intermarc pour les catalogues de livres, XML-EAD pour les inventaires d'archives, et Dublin Core pour la bibliothèque numérique.
Ces données sont modélisées, et regroupées par des traitements automatiques et publiées selon les standards du web sémantique.
Data.bnf.fr et Gallica ont reçu le Stanford Prize for Innovation in Research Libraries (SPIRL). Voir le rapport complet.
En savoir plus sur data.bnf.fr.
CubicWeb est une plateforme open source de développement d'applications web sémantique, publiée sous la licence LGPL.
Les données sont disponibles sur ce site, selon plusieurs syntaxes de RDF (Resource description framework), soit RDF-XML, RDF-N3, et RDF-NT, ainsi qu’en JSON.
Vous pouvez les récupérer et les interroger :
Un dump de l'intégralité des données RDF est également disponible sur notre serveur FTP : hôte : echanges.bnf.fr, port : 21
login : databnf, mot de passe : databnf
et via HTTP: dump rdf complet (rdf/xml)
Des dumps par types de données sont également disponibles :
La licence d'utilisation de ces données est disponible ici.
Dernière mise à jour : avril 2015
Les données de data.bnf.fr sont liées (alignées) aux pages équivalentes dans d’autres répertoires de données.
Les sujets RAMEAU sont alignés avec :
Un alignement a été réalisé entre le référentiel RAMEAU et les principaux domaines de la classification Dewey (http://dewey.info).
Les données sur les auteurs sont aussi liées à :
La BnF identifie les descriptions bibliographiques et les notices d’autorité ainsi que les documents numériques avec des identifiants ARK.
Les notices géographiques sont alignées avec les référentiels RAMEAU de la BnF, Geonames et le référentiel INSEE.
L'identifiant ARK (Archival Resource Key) est construit de la façon suivante (exemple sur une notice du catalogue général):
L’identifiant de la notice est aussi utilisé pour lier les différentes notices du catalogue général et éventuellement les différentes bases de la BnF entre elles.
Exemple :
La notice http://catalogue.bnf.fr/ark:/12148/cb30625225, est liée à la notice de Victor Hugo
100 $311907966 $w.0..b.....$aHugo$mVictor$d1802-1885$40070
Dans data.bnf.fr, les URI des unités documentaires sont établis à partir de l’identifiant ARK des notices d’autorité du catalogue général. Ils identifient les concepts décrits dans la classe skos:Concept de notre modèle.
Exemple :Afin de faciliter l’indexation des pages par les moteurs de recherche, les URL comprennent des libellés explicites.
L’URL des pages œuvre, auteur, thème est formée suivant le principe :
http://data.bnf.fr/ID/libellé
Un mécanisme de redirection HTTP depuis les identifiants simples et les identifiants ARK vers les URL a été mis en place :
Le système de négociation de contenu est le suivant : http://data.bnf.fr/11907966/victor_hugo/ retourne une représentation du document générique qui est fonction de la négociation de contenu et donc des en-têtes de la requête HTTP. Dans la réponse, l'en-tête « Content-location » est positionné à « data »/ « id-pivot »/description-lisible/ « lang ». « extension-mime »
On peut avoir par exemple :
http://data.bnf.fr/11907966/victor_hugo/fr.html
http://data.bnf.fr/11907966/victor_hugo/en.html
http://data.bnf.fr/11907966/victor_hugo/rdf.xml
http://data.bnf.fr/11907966/victor_hugo/rdf.n3
http://data.bnf.fr/11907966/victor_hugo/fr.pdf
http://data.bnf.fr/11907966/victor_hugo/en.pdf >
Il n'y a pas de langue pour les fichiers RDF.
Le schéma ci-dessous présente l'organisation générale des données dans data.bnf.fr.
Consultez aussi le modèle des pages de lieux
Ce modèle est fondé sur le modèle FRBR (Functional requirements for Bibliographic Records) élaboré par l’IFLA. Ce modèle comprend trois groupes d'entités liées par des relations : les informations sur les documents, les personnes physiques ou morales, et les sujets ou thèmes.
Le premier groupe du modèle FRBR décrit les différents aspects d’une production intellectuelle ou artistique, à travers 4 niveaux : l’œuvre, l’expression, la manifestation et l’item.
Le niveau de l'œuvre est celui de la création intellectuelle ou artistique. Exemple : Le colonel Chabert d'Honoré de Balzac. Les pages « œuvres » de data.bnf.fr sont créées à partir des notices d'autorité correspondantes de la BnF : http://catalogue.bnf.fr/ark:/12148/cb12006825f
Le niveau de l’expression est caractérisé dans data.bnf.fr par la langue (dcterms :language), le type de document (dcterms :type) et les liens de contributions (préfacier, illustrateur, traducteurs…) (dcterms :contributor, marcrel, bnfroles). Exemple : http://data.bnf.fr/ark:/12148/cb313699180#frbr:Expression.
Le niveau de la manifestation est celui de la matérialisation d'une expression. Exemple : une édition des Misérables comme « Nouvelle impression illustrée. 1879-1882. Paris. E. Hugues ». Les manifestations d’une œuvre sont listées dans la page « œuvre » et regroupées dans la section « Vie et éditions de l’œuvre ». Ce niveau correspond à la notice bibliographique dans le catalogue général de la BnF ou, dans le catalogue BnF-Archives et manuscrits, à un niveau de description identifié par une cote.
Le niveau de l'item est celui de l'exemplaire physique. Il est accessible par le lien vers la notice dans le Catalogue général de la BnF ou dans BnF-Archives et manuscrits, ou vers l'exemplaire numérisé dans la bibliothèque numérique Gallica.
Notons que des relations de tout à partie peuvent exister entre une œuvre et une autre œuvre. Par exemple : Le Père Goriot, d'Honoré de Balzac, est contenu dans Les Scènes de la vie privée du même auteur, et tous deux ont le statut d'œuvre et sont dotés d’une page data.bnf fr. ( http://data.bnf.fr/ark:/12148/cb427567440).
Une personne peut être auteur d'une œuvre (un lien existe alors entre la page « auteur » et la page « œuvre » correspondante) ou contributeur d'une expression (préfacier, traducteur, librettiste...). Cependant, le niveau de l'expression n’étant pas distinct de celui de la manifestation dans les pages html de data.bnf.fr, les contributeurs apparaissent au niveau de la manifestation.
Les différents rôles de création ou de contribution d’une personne font l'objet d'un
référentiel dans le format Intermarc adopté par la BnF, ainsi que de la part de la
bibliothèque du Congrès .
Elles sont construites à partir des sujets RAMEAU (Répertoire d'autorité-matière encyclopédique et alphabétique unifié) de la BnF, converties dans le langage RDF SKOS (Simple Kowledge Organisation). Ce référentiel est maintenu à jour sur data.bnf.fr avec la base de données totale et actualisée de la BnF.
Les manifestations, ayant pour sujet un terme RAMEAU, sont rattachées à la page « Thème » correspondante.
Enfin, vous trouverez aussi des études (œuvres et manifestations) au sujet d'une œuvre ou d'un auteur. Exemple : http://data.bnf.fr/11918316/ovide/studies.
Toutes les entités (sujets, auteurs, œuvres, lieux) sont décrites en tant que notice d’une référentiel d’autorité de bibliothèque, avec la classe : skos :Concept. La description précise alors : la forme préférée, les autres formes, les sources utilisées pour la notice, les termes plus larges, plus précis, les termes associés, les alignements avec d’autres jeux de données, par exemple. Par ailleurs, les auteurs, les œuvres, les lieux sont décrite avec des vocabulaires spécifiques : foaf :Person, foaf :Organization, frbr-rda :Work, wgs84 :SpatialThing.
Le concept et la ressource sont liés par une propriété foaf :focus.
Exemple :
〈http://data.bnf.fr/ark:/12148/cb123194593〉 foaf:focus 〈http://data.bnf.fr/ark:/12148/cb123194593#foaf:Person〉
La réutilisation de vocabulaires existants a été privilégiée pour favoriser l'interopérabilité, en particulier :
Prefix | URI |
---|---|
bibo | http://purl.org/ontology/bibo/ |
bio | http://vocab.org/bio/0.1/ |
dc | http://purl.org/dc/elements/1.1/ |
dcmi-box | http://dublincore.org/documents/dcmi-box/ |
dcterms | http://purl.org/dc/terms/ |
foaf | http://xmlns.com/foaf/0.1/ |
frbr-rda | http://rdvocab.info/uri/schema/FRBRentitiesRDA/ |
geo | http://www.w3.org/2003/01/geo/wgs84_pos# |
geonames | http://www.geonames.org/ontology# |
ign | http://data.ign.fr/ontology/topo.owl# |
insee | http://rdf.insee.fr/geo/ |
isni | http://isni.org/ontology# |
marcrel | http://id.loc.gov/vocabulary/relators/ |
mo | http://musicontology.com/ |
ore | http://www.openarchives.org/ore/terms/ |
owl | http://www.w3.org/2002/07/owl# |
rdagroup1elements | http://rdvocab.info/Elements/ |
rdagroup2elements | http://RDVocab.info/ElementsGr2/ |
rdarelationships | http://rdvocab.info/RDARelationshipsWEMI/ |
rdfs | http://www.w3.org/2000/01/rdf-schema# |
skos | http://www.w3.org/2004/02/skos/core# |
Les référentiels spécifiques de la BnF sont déclarés à l’adresse suivante : http://data.bnf.fr/vocabulary : codes de pays, codes de rôles, types de sujets RAMEAU, codes de classement géographique, genres musicaux.
L’ontologie bnf-onto est déclarée à l’adresse suivante : http://data.bnf.fr/ontology/bnf-onto/.
Les pages web de data.bnf.fr sont ouvertes sur le web et accessibles directement par les internautes depuis les moteurs de recherche. C'est pourquoi, outre les méthodes traditionnelles d'indexation de la page d'accueil, nous avons choisi d’embarquer deux types de données pour structurer les pages html :
Ce dernier fournit un vocabulaire pour ajouter de l'information au contenu HTML avec un format de microdonnées, favorisant le référencement par les grands moteurs de recherche.
Nous avons utilisé en particulier : http://schema.org/Person, http://schema.org/Organization, http://schema.org/Book,http://schema.org/Place, et http://schema.org/TheaterEvent.
C'est un vocabulaire mis en place pour encoder en RDFa quelques métadonnées qui seront récupérées lorsque l'utilisateur ajoutera la ressource à son profil Facebook.
Pour connaître le détail des éléments décrits en RDF dans data.bnf.fr, consultez le tableau de conversion Intermarc/EAD vers RDF
data.bnf.fr s’appuie sur des données bibliographiques structurées et liées pour construire ses pages en particulier :