55
Evolution des catalogues : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA ENS Lyon 17 au 19 juin 2013 Thierry Clavel et Philippe Bourdenet

Evolution des catalogues : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

  • Upload
    sydney

  • View
    29

  • Download
    0

Embed Size (px)

DESCRIPTION

Evolution des catalogues : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA. ENS Lyon 17 au 19 juin 2013 Thierry Clavel et Philippe Bourdenet. Programme. Introduction : le contexte Problématique de l’interopérabilité  des données en bibliothèque Paysage applicatif - PowerPoint PPT Presentation

Citation preview

Page 1: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Evolution des catalogues :Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

ENS Lyon

17 au 19 juin 2013Thierry Clavel et Philippe Bourdenet

Page 2: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Programme

Introduction : le contexte

1. Problématique de l’interopérabilité  des données en bibliothèque Paysage applicatif Exemple d’interopérabilité : le SCD du Maine Pourquoi changer ? : Enjeux du Web de données pour les

bibliothèques

2. Métadonnées : jeux et formats Expression des données en XML Dublin Core, MODS, ONIX, TEI, EAD METS, LOMFR

3. Interopérabilité des systèmes Notion de modèle conceptuel

4. Web sémantique et Web de données

5. FRBR et FRAD

6. RDA et le catalogage FRBerisé

Page 3: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Introduction : Le contexte

Page 4: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Bibliothèque scientifique numérique (BSN)

Une « très grande infrastructure de recherche » créée en 2009

Un projet qui fédère l’action des acteurs de l’enseignement supérieur et de la recherche basé sur la coopération

9 segments (axes) BSN 1 à BSN9

Page 5: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Projet d’établissement de L’ABES 2012-2015

Le projet compte 8 axes dont : Missions de l’ABES : mutualisation « acquérir, signaler,

diffuser » Signalement des ressources électroniques

« priorité absolue » Projet SGBM Hub de métadonnées de la recherche Faire évoluer les catalogues

Page 6: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

2012 : Lancement de 2 études en parallèle

Etude du cabinet pléiade sur les outils découverte Conclusions : La mutualisation devrait porter sur les données : base

de connaissances nationale intégrée à GOKB Se doter d’un localisateur national

Etude du groupe de travail SGBM 3 scénarios

Page 7: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Choix du CA de l’ABES du 31/5/2013

SGBM : Choix du scénario 2 Migration des établissements volontaires vers le

SGBM Maintien de CBS pour le catalogage (transferts

réguliers vers le SGBM) Étude complémentaire de 6 mois pour le

remplacement de CBS Etude Pléiade

Développement d’un localisateur national

Page 8: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Hub de métadonnées de la recherche

•Partenariat ABES-CNRS

•Récupération des métadonnées commerciales ou institutionnelles sous n’importe quel format

•Dédoublonnage, Conversion et Redistribution des métadonnées « enrichies » vers les bibliothèques du réseau

•Partenariat ABES-CNRS

•Récupération des métadonnées commerciales ou institutionnelles sous n’importe quel format

•Dédoublonnage, Conversion et Redistribution des métadonnées « enrichies » vers les bibliothèques du réseau

Page 9: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

que dit le projet sur FRBR et RDA et les données ?

« L’ABES poursuivra dans la voie de l’ouverture et de l’interopérabilité de ses données sur le web. Elle expérimentera la mise en oeuvre du modèle FRBR en concertation avec la BnF dans la perspective de l’implémentation du code de catalogage RDA »

Page 10: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Ouverture des données (open data) vers une interopérabilité technique et juridique

Mouvement international Plateforme française d'ouverture des données publiques

data.gouv.fr Exposition des données en RDF ABES : licence ouverte (LO) recommandée par la

mission ETALAB pour les données produites par le réseau

BnF : idem pour : Catalogues Gallica Data.BnF.fr

Page 11: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Le comité stratégique bibliographique (CSB)

Composition : ABES, BnF et leurs tutelles Nouvelles orientations du paysage bibliographique

français  : Exposer les métadonnées des catalogues nationaux

sur le Web de données FRBRiser les catalogues (BnF et SUDOC) Permettre un catalogage FRBRisé en révisant les

normes AFNOR (2015) Préparer l’adoption de RDA pour ne pas s’isoler du

contexte international et européen rapport d'orientation du 13 novembre 2012

Page 12: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

FIN de l’introduction

Page 13: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Open URL et les résolveurs de liens

OPEN URL : protocole de métadonnées permettant de faitre des liens contextuels

Résolveur de liens : outil informatique implémentant la norme OpenURL et faisant le lien entre une citation bibliographique et le texte intégral, en fonction des abonnements de l'établissement.

Page 14: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Discovery tools (outil découverte)

Logiciel avec fonctions de recherche et facettes Réservoir unique

Rapidité des résultats Indexe texte intégral et métadonnées de différentes

bases Base de connaissance Autres fonctions : fourniture de documents, résolveur de

liens Problème récurrent : bruit et pertinence des résultats

Page 15: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Pourquoi changer nos catalogues ?

ou

Les enjeux du Web de données pour les bibliothèques

Page 16: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Les catalogues de bibliothèques, monde merveilleux ?

On a déjà des normes de catalogage (ISBD, AFNOR…) des formats MARC pour saisir et récupérer des

notices… Des SIGB qui fonctionnent… Des OPAC et des catalogues

collectifs accessibles sur le Web…

Alors, pourquoi vouloir changer ?

Page 17: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Mais d’abord, est ce que nos catalogues conviennent aux usagers?

1 – changer pour l’usager1 – changer pour l’usager

Page 18: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA
Page 21: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

1 - changer pour L’usager

L’usager est avant tout un internaute : Il veut tout et tout de suite Il veut des contenus précis (un article, une chanson, etc.) Il recherche en priorité sur le Web (et pas spécialement dans des

catalogues) Il consulte les catalogues en recherche simple à la « google »

Il faut donc : Faire évoluer nos catalogues pour les adapter à l’usager

Ils ramènent trop de réponses (bruit) sans les classer Il faut structurer les résultats de recherche pour afficher des

réponses pertinentes Aller vers l’usager Pousser les contenus et les données des bibliothèques vers les

usagers/internautes donc sur le Web

Page 22: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Data.bnf.fr

Page 23: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA
Page 24: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Autre exemple

catalogue collectif ciné-ressources

http://www.cineressources.net/recherche_t.php

Page 25: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

« Super » Notice d'autorité « nom de personne »

C'est pas merveilleux,Cette page de résultats ?!

Page 26: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Expérimentation OPENCAT

Page 28: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Pourquoi Les catalogues de bibliothèques ne sont ils pas visibles sur le Web ?

Le Web ne parle pas MARC Le Web a ses propres normes

Et surtout …

2 – changer pour être sur le Web

2 – changer pour être sur le Web

Page 29: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

http://www.flickr.com/photos/markhillary/3774707075/

http://www.flickr.com/photos/markhillary/3774707075/

http://www.flickr.com/photos/75905404@N00/5088208539/

http://www.flickr.com/photos/75905404@N00/5088208539/

Les catalogues sont dans le Web profond

Les catalogues sont dans le Web profond

Les catalogues de bibliothèques sont dans des bases de données (silos) qui ne sont pas indexées par les moteurs de recherche

Les catalogues de bibliothèques sont dans des bases de données (silos) qui ne sont pas indexées par les moteurs de recherche

Page 30: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

2 - Changer pour être sur le Web

Pourquoi adopter les standards du Web sémantique ? pour sortir du Web profond et de notre « niche » technologique

des formats MARC pour évoluer avec le Web pour que la maintenance

de nos catalogues coûte moins cher

Interopérabilité

+++Interopérabilité

+++

Page 31: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

3 - Changer pour rationaliser et enrichir le travail de catalogage

Récupérer des données produites ailleurs Par exemple les biographies de Wikipedia

pour les auteurs

Ne pas avoir à répéter les mêmes informations Réutiliser les données du catalogue

Par exemple : l’indexation matière

Page 32: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Indexation matière dans le SUDOC :

Une indexation-matièrerecréée pour chaque notice

Page 33: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

4- Changer pour que nos données soient réutilisées

créer des « Données liées ouvertes »

Eclater nos notices en données réutilisables

pour que n’importe qui puisse réutiliser n’importe lesquelles de nos données de n’importe quelle manière

Page 34: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Quels outils pour le changement ?

Un code de catalogageUn code de catalogage

Des modèles conceptuels pour Structurer l’information bibliographique

Des modèles conceptuels pour Structurer l’information bibliographique

Des Technologies et normes garantissant l’Interopérabilité du Web de données

Des Technologies et normes garantissant l’Interopérabilité du Web de données

Un espace global d’information, ouvert, qui permet de lier, exploiter, mettre à disposition,réutiliser les données sur le Web

Un espace global d’information, ouvert, qui permet de lier, exploiter, mettre à disposition,réutiliser les données sur le Web

Web de donnéesWeb de données

Page 35: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Métadonnées : Tentative de définition

- données sur (à propos) d’autres données

- Information structurée qui sert à décrire, trouver, localiser, gérer, ,,, des ressources

Page 36: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Types de Métadonnées

Métadonnées descriptives Titre, auteur, résumé, mots clés, etc,

Métadonnées de structure Chapitres d’un livre, organisation d’un texte

Métadonnées de gestion (administratives) gestion des droits (propriété intellectuelle) Archivage et conservation Techniques : format, type, accès aux ressources, etc,

Page 37: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

37

Métadonnées ou notice ?

Métadonnées internes ou externes à une ressource

Page 38: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Formats de Métadonnées

- Métadonnées existent dans tous les secteurs d’activité

- Nombreux formats- Problème d’interopérabilité

Page 39: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Dublin core : un exemple de métadonnées

Page 40: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Dublin Core

Jeu de métadonnées descriptives normalisées : devenu une norme ISO (15836) en 2003, maintenu par le DCMI (Dublin Core Metadata Initiative).

Objectif d’origine:décrire les ressources électroniques sur Internet dans un contexte HTML pour faciliter la recherche , avoir des métadonnées communes à plusieurs communautés

Caractéristiques du Dublin Core :

Simplicité : 15 éléments seulement

Souplesse d’utilisation : tous les éléments sont facultatifs et répétables

Utilisable dans différents formats : HTML, XML, etc.

Page 41: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Les 15 éléments de base du Dublin Core

1. Title : titre de la ressource2. Subject : mots-clés ou language documentaire3. Description : présentation du contenu (résumé, table des matières,

etc;)4. Source : référence à une ressource dont la ressource décrite est

dérivée5. Language : langue utilisée dans la ressource6. Relation : référence à une ressource apparentée7. Coverage : couverture spatio-temporelle (périmètre ou domaine

d’application de la ressource)8. Creator : auteur principal9. Contributor : responsabilité secondaire10. Publisher : éditeur (mise à disposition de la ressource)11. Rights : gestion des droits12. Date : date d’un événement dans le cycle de vie de la ressource13. Type : catégorie, fonction ou genre de la ressource (contenu

sémantique)14. Format : format, taille de la ressource15. Identifier : identifiant (URL, ISSN etc.)

Page 42: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Dublin Core qualifié et non qualifié

Dublin Core non qualifié : utilisation des 15 éléments seulement

Dublin Core qualifié : Utilisation d’un Référentiel plus complet : Dubin Core metadata termsPossibilité de choisir d’autres éléments et des schémas d’encodage.

• http://dublincore.org/documents/dcmi-terms/

Exemples de DC qualifié: 1. qualificatifs de raffinement (création de nouveaux éléments)

<meta name="dc.identifier.URI" content=« http://www.enssib.fr">

2. schéma d’encodage (association d’un élément à un référentiel) <meta name="dc.subject" scheme = « DDC »  content= «  025.314 »>

Page 43: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Exemple pour un site Web

Page 44: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Exemple de notice OAI (métadonnées Dublin Core)

<record>

<identifier>oai: 2450</identifier>

<dc:title> Accueillir, orienter informer </dc:title>

<dc:creator> Bertrand Calenge</dc:creator>

<dc:type>Monographie imprimée</dc:type>

</record>

Page 45: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

DC Profil bibliothèques

http://dublincore.org/documents/library-application-profile/

Page 46: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Avantages du Dublin core

Simplicité Reconnaissance internationale : norme ISO Utilisation grandissante grâce au protocole OAI

PMH

Page 47: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Limites du Dublin Core

Globalement encore peu utilisé à l’échelle du Web

simplicité à double tranchant 15 éléments de base : insuffisant pour décrire des

ressources complexes

Page 48: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

Exercice Dublin Core

Transposer en DC simple la notice MARC suivante

Page 49: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

MODS Metadata Object Description Schema

Page 50: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

MODS

Schéma XML développé par la Bibliothèque du Congrès pour décrire tout type de ressource

Métadonnées descriptives Adaptation simplifiée du MARC 21 Indépendant d’un code de catalogage Plus riche que le Dublin Core Mappings facilités vers différents jeux de

métadonnées : MARC, DC, RDA, ONIX

Page 51: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

MODS

Exemples : http://www.loc.gov/standards/mods/userguide/

examples.html

Vocabulaire MODS en RDF http://www.loc.gov/standards/mods/modsrdf/

Page 52: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

MODS

A quoi sert MODS ? Décrire des ressources Échanger des métadonnées MARC avec d’autres

jeux de métadonnées Compatibilité OAI PMH et SRU

Qui utilise MODS en France ? DAPHNE (Données en Archéologie, Préhistoire et

Histoire sur le NEt) Portail Musique contemporaine

Page 53: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

ONIX Online Information eXchange

Format de métadonnées en XML de la chaîne éditoriale commerciale éditeurs, diffuseurs libraires

2 schémas ONIX for books ONIX for serials

Fait pour l’échange

Page 54: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

ONIX for books

Guide ONIX avec aperçu et éléments (version en français 2009)

200 éléments : En tête : expéditeur et destinataire 6 blocs :

description du produit Enrichissement marketing Détail du contenu Conditions de publication Matériels liés (dont autres œuvres) Conditions d’approvisionnement

Page 55: Evolution des catalogues  : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA

ONIX

Utilisation d’ONIX en France : Electre / cercle de la librairie

Produit ses données en ONIX

ONIX, FRBR RDA et le Web sémantique Mapping RDA/ONIX framework Production de données FRBrisées en ONIX possible ONIX n’est pas disponible sur le Web de données (en

juin 2013)