26
Hub de métadonnées Des données libres pour des outils vides #jabes14 [email protected]

Hub de métadonnées - jabes2014

Embed Size (px)

DESCRIPTION

Focus sur le hub de métadonnées. Projet en cours à l'ABES (2013-2015). Objectif : réutiliser, améliorer et redistribuer des métadonnées bibliographiques de qualité, avec les technologies du web sémantique (entre autres) et pour le web de données (entre autres). Plus d'infos : http://www.abes.fr/Projets-en-cours/Hub-de-metadonnees

Citation preview

Page 1: Hub de métadonnées - jabes2014

Hub de métadonnées

Des données librespour des outils vides

#jabes14

[email protected]

Page 2: Hub de métadonnées - jabes2014

Les métadonnées sont déjà là !

• Dixit Maurits :« La grande majorité des éditeurs produisent des métadonnées et livrent ces métadonnées aux bibliothèques.

En conséquence, les systèmes de catalogage partagé s’orientent vers la possibilité de manipulation des flux de métadonnées provenant des éditeurs. »

20/05/2014 à 14h37

• Que faire ? Attendre que tout soit en MARC ?

Page 3: Hub de métadonnées - jabes2014

marc marc marc

rdfABC

XYZ

Page 4: Hub de métadonnées - jabes2014

Métadonnées éditeur natives

MARCde l’éditeur

MARCimporté dans

le Sudoc

MARCenrichi parle réseau

MARCexporté vers

les SIGB locaux

RDF exposé (2011-)

Sudoc

Open data

Open data

Page 5: Hub de métadonnées - jabes2014

Métadonnées éditeur natives

MARCenrichi parle réseau

MARCexporté vers

les SIGB locaux

RDF exposé

Sudoc

KBARTMétadonnées éditeur modélisées en RDF et

enrichies

Métadonnées RDF enrichies par le réseau

et le hub

Hub

Open data

Open data

Open data

Page 6: Hub de métadonnées - jabes2014

Outils / Données / Collaboration

• Le hub est un ensemble de méthodes et d’outils internes pour récupérer et partager des données fiables

• But :– Contribuer à un espace public de métadonnées ouvertes, à

l’échelle du web– Que chacun intègre ces données ouvertes dans ses propres

outils (dont le Sudoc)• Aujourd’hui :– Pas d’outil « hub » proposé à l’extérieur– Esquisse de collaboration avec le réseau Sudoc

Résumé

Page 7: Hub de métadonnées - jabes2014

PÉRIODIQUES

Page 8: Hub de métadonnées - jabes2014

La liste éditeur,à la lumière du registre ISSN

titre année min.

année max.

p-issn e-issn titre année min.

année max

p-issn e-issn ppn

1950-2000 1940-1949 1950-1979

1980-2000

1980-=?

?

Identifiant de notice dans le Sudoc

Page 9: Hub de métadonnées - jabes2014

Initiatives de normalisation qui vont dans le même sens

PIE-J NISO 2013

KBART 2 2014

“will provide much-needed guidance on the presentation of

e-journals to publishers and platform providers as well as to

solve some long-standing concerns of serials librarians.”

Page 10: Hub de métadonnées - jabes2014

Enrichir les listes de périodiquesavec les métadonnées d’articles

titre année min

année max

p-issn e-issn ppn 1er volume

1er numéro

dernier vol.

dernier n°

1 1 77 4

<métadonnées d’articles en XML/>

etInversement

+

Page 11: Hub de métadonnées - jabes2014

Métadonnées de bouquet= fichier KBART

BACON

publication_titl

e

date_first_issue_online

date_last_issue_online

print _identif

ier

online_identifi

er

num_first_vol_o

nline

num_first_issue_online

num_last_vol_online

num_last_issue_online

title_url

Page 12: Hub de métadonnées - jabes2014

Notre tableau sert aussi à signaler dans le Sudoc

ajouter un exemplaire Licence Nationale et modifier la notice biblio du périodique :

207 $a Vol.1, n°1 (1914)-Vol.50, n°4 (1964)

titre année min

année max

p-issn e-issn ppn 1er volume

1er numéro

dernier vol.

dernier n°

URL

1914 1964 1 1 50 4

Page 13: Hub de métadonnées - jabes2014

Zone 100 Zone 207

Les dates d’un e-journal ?

Page 14: Hub de métadonnées - jabes2014

Signaler l’électronique pour gérer le papier

Aide au désherbage

titre année min

année max

p-issn e-issn ppn élec.

ppn papier

1er volume

1er numéro

dernier vol.

dernier n°

URL

1941 1964 1 1 50 4

Page 15: Hub de métadonnées - jabes2014

L’argus des périodiques papier achetés dans ISTEX

PPN 2013* 2014* % désexemplarisé

03930986X 490 431 -12,04081633

039401588 582 540 -7,216494845

038846373 1057 985 -6,811731315

039309878 328 307 -6,402439024

069424985 207 194 -6,280193237

039322688 249 234 -6,024096386

039395596 1208 1136 -5,960264901

040093417 351 331 -5,698005698

036747645 316 300 -5,063291139

013359258 854 811 -5,035128806

038263882 60 57 -5

* en années-périodiques

RSC journals

ISTEX entre

décembre 2013

et mai 2014

Page 16: Hub de métadonnées - jabes2014

Liste de périodiques commerciale

Liste de périodiques

conformes à ISSN

Liste des notices Sudoc : e-journals

Liste des notices Sudoc : revues

imprimées

Métadonnéesdes articles

Métadonnées des fascicules

Négociation

Sudoc PS : circuit denumérotation ISSN

Conservation

Conservation / états de collectionau niveau fascicule ?

Bases deconnaissance

Outils de découverte

Exemplarisationautomatique Sudoc

Passerelles

Web de données

Etablissements

CartoDoc elec. + ERE?

Page 17: Hub de métadonnées - jabes2014

EBOOKS

Page 18: Hub de métadonnées - jabes2014

Métadonnées éditeur natives XML

MARCenrichi parle réseau

MARCexporté vers

les SIGB locaux

RDF exposé

Sudoc

KBARTMétadonnées éditeur modélisées en RDF et

enrichies

Métadonnées RDF enrichies par le réseau

Hub

Page 19: Hub de métadonnées - jabes2014

• Enrichissements– Auteurs IdRef– Indexation matière RAMEAU– Langue des résumés– ISBNs– …

• Première interaction avec le réseau : zone 309 et todo list dynamique

Recueils des coursde l’Académie de La Haye

Page 20: Hub de métadonnées - jabes2014

309 ##$aLE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)$bBRILL-RADI-LN$cche ppn 060964588 OU 084013885$d2014-04-09 11:15:01.894

Le hub fait ce qu’il peut puis laisse une todo list au réseau

Page 21: Hub de métadonnées - jabes2014

PPN TEXTE CORPUS COMMANDE DATEIN ETAT.. Nombre de ppn total : 1177 .. .. .. .... Nombre de ppn réalisés : 111 .. .. .. .... Pourcentage de ppn realisés : 0.09 .. .. .. ..

176448683

LE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. A TITRE INDICATIF, LE SYSTEME DE DETECTION AUTOMATIQUE SUGGERE PLUSIEURS PPN A DEPARTAGER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)

BRILL-RADI-LN

che ppn 060964588 OU 084013885

2014-04-09 12:37:02.980 todo

176448691

LE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)

BRILL-RADI-LN null

2014-04-18 09:02:33.475 todo

176448705

LE(S) LIEN(S) VEDETTE MATIERE RESTE(NT) A CREER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)

BRILL-RADI-LN null

2014-04-18 08:48:18.551 todo

176448837

LE(S) LIEN(S) AUTORITE AUTEUR RESTE(NT) A CREER. A TITRE INDICATIF, LE SYSTEME DE DETECTION AUTOMATIQUE SUGGERE PLUSIEURS PPN A DEPARTAGER. SUPPRIMER LA PRESENTE NOTE 309 UNE FOIS LA (LES) CORRECTION(S) EFFECTUEE(S)

BRILL-RADI-LN che ppn 078858119

2014-04-09 12:37:37.500 todo

http://www.sudoc.fr/services/chantier/BRILL-RADI-LNtodo list

collective

Page 22: Hub de métadonnées - jabes2014

Conclusions (1/2)

• Essayer de tenir ensemble: Automatique | Humain ABES | Réseau Adaptation à des outils précis | ouverture générique

• court terme : listes (KBART, ppn élec, ppn papier), notices• moyen terme : web de données

Différents niveaux de granularité• articles | chapitres | revues | livres

Gestion de la documentation électronique | Rigueur bibliographique

National | International • on travaille pour l’international• et l’international pour nous

Page 23: Hub de métadonnées - jabes2014

Conclusions (2/2)

EnjeuSéparer fonction SGB

et fonction agrégation de métadonnées

Demain, les données seront toutes : • sur le web de données (RDF moyen et fin)

• Agrégation facilitée• Nous devons y contribuer !

• et/ou chez des sociétés spécialisées (data markets)• Ajouter de la valeur et du service au-dessus de données ouvertes

Open data

Pour des

SGB vides !

Page 24: Hub de métadonnées - jabes2014
Page 25: Hub de métadonnées - jabes2014

Questions pour la table ronde ?

• Quelle intensité et quelles formes de collaborations avec le réseau ? Quelles forces en central ? Des rôles différenciés reconnus pour certains établissements ? CollEx ?

• Sur quels corpus se concentrer ?– Archives (ISTEX)/courant– Revues/articles

• Quelles collaborations avec partenaires, fr et au-delà ?

Page 26: Hub de métadonnées - jabes2014

Corpus Analyser l’offre

KBART SUDOC Désherber Modéliser Convertir Enrichir

Brill RADI & New Pauly

Brill revues*

Elsevier

Nature

RSC

OUP

IOP

http://www.licencesnationales.fr/istex-negociations-en-cours/

Etat des traitements en mai 2014

* Numérisation non achevée au moment du signalementSignature Décembre 2013

Signature Avril/Mai 2014