Upload
maik
View
30
Download
0
Embed Size (px)
DESCRIPTION
Numérisation de la presse Belge. Projet fédéral D/00/02 Alain Goossens Bibliothèque royale de Belgique. Le projet en bref Titres concernés Principes clés du projet Situation en novembre 2008 Exploitation Démo Conclusion. Le projet en bref (1). - PowerPoint PPT Presentation
Citation preview
Numérisation de la presse Belge
Projet fédéral D/00/02
Alain Goossens
Bibliothèque royale de Belgique
• Le projet en bref
• Titres concernés
• Principes clés du projet
• Situation en novembre 2008
• Exploitation
• Démo
• Conclusion
Le projet en bref (1)
• Numérisation de 30 titres de la presse belge– Pourquoi, parmi les collections de la Bibliothèque
royale, choisir les journaux comme principal axe de numérisation ?
• Période couverte : début du journal jusque 1950– Volume : 3.000.000 pages
• En plus : presse clandestine et censurée des deux conflits mondiaux– Volume : 35.000 pages
• Choix opéré par le CEGES et la KBR
Le projet en bref (2)
• Cadre : projet de numérisation du patrimoine fédéral– 9 projets– 15.000.000 €– 2005-2008, reports sur 2009 autorisés– Investissement de l’Etat pour ce projet : 2.272.000 €
• Futur ? En discussion actuellement– Souhait de la politique scientifique : un large PPP
les titres concernés (1)• Le Courrier de l’Escaut (1829-1950)• Le Journal de Charleroi (1837-1950)• L’Indépendance belge (1843-1940)• Het Handelsblad (1844-1950)• La Meuse (1855-1950)• La Gazette de Charleroi (1878-1950)• De Gentenaar (1879-1950)• Vooruit (1884-1950)• Le Peuple (1885-1950)• Het Nieuws van den dag (1885-1950)• Het laatste Nieuws (1888-1950)• De Gazet van Antwerpen (1891-1950)• Het Volk (1891-1950)• Le Vingtième Siècle (1895-1940)• L’avenir du Luxembourg (1897-1950)
Titres concernés (2)• La Dernière Heure (1906-1950)• De Standaard (1914-1950) • De Volksgazet (1914-1950)• La Libre Belgique (1915-1950) • La Nation belge (1918-1950)• Vers l’Avenir (1918-1950)• De Schelde (1918-1936)• La Wallonie (1919-1950)• Le Drapeau Rouge (1921-1950)• De Rode Vaan (1921-1950)• Grenz Echo (1927-1950)• De dag (1934-1944)• Le Pays Réel (1936-1944)• Volk en Staat (1937-1944)• La Cité nouvelle (1937-1950)• + presse clandestine et censurée des deux conflits mondiaux
Principes clés du projet
• Scinder numérisation et exploitation
• Confier via appel d’offre européen la numérisation à un sous-traitant
• Scinder exploitation intranet et Internet
• Négocier l’exploitation Internet avec les ayant droits
• Assurer la conservation pérenne du patrimoine numérisé
Situation en novembre 2008
• Juillet 2007 : lancement de l’appel d’offre
• Depuis janvier 2008 : numérisation + OCR + segmentation
• Depuis janvier 2008 : réflexion sur le stockage et l’accès– Seuls (KBR + CEGES) ? (oui, mais insuffisant)– De façon concertée avec les autres ESF ? (toujours ouvert)– Via PPP, avec les éditeurs ? (toujours ouvert + auteurs +
journalistes + ???)
• Depuis juillet 2008 : exploitation (en fait… exploitations : cf slides suivants…)
Exploitation (1)
• Interne : = missions de base de la bibliothèque
• Externe : complexe, pcq nouvelles missions… mais on progresse– Belge : [email protected]– Internationale : RFBNN– Internationale : Europeana– …
Exploitation (2)
• De la totalité des pages numérisées : dans les murs de la bibliothèque
• Partielle ou totale : sur Internet
Exploitation (3)
• Gratuite : dans les murs de la bibliothèque
• Gratuite : sur Internet pour les journaux libres de droits
• Gratuite ou payante : sur Internet pour les journaux sous droits
Démo
• Outils mis en place à la Bibliothèque royale (en développement)
– http://mara.kbr.be/calendarapp/calendar1fr.php
– http://mara.kbr.be/nutch/KBRSearch.php
Conclusion (1)
• La numérisation prend plus de temps que prévu– Phase de démarrage = long dialogue…– Cadences difficiles à soutenir >< qualité– OCR erratique – Contrôle qualité nécessaire et long…
• Très bonne volonté de nos partenaires
• Le marché public nous protège très bien
Conclusion (2)• Le défi de l’exploitation est passionnant, mais complexe car neuf
– Pour la Bibliothèque– Pour les représentants des auteurs, des journalistes– Pour les représentants des éditeurs
• Globalement, les coûts de numérisation + exploitation sont et seront toujours supérieurs aux recettes futures
• Le plus important = obtenir la sécurité juridique, via accord le plus large possible entre ayant droits, et conscience des droits et devoirs respectifs de tous !
• La complexité croît encore lorsqu’on se place dans la perspective d’un PPP global à tous les ESF, pour tout type de documents patrimoniaux numérisés
Conclusion (3)
• Une seule plateforme d’exploitation ne suffit pas
• La redondance permettra de toucher plus d’internautes
• Via l’association privé-public, des plateformes à modalité d’accès et de services divers peuvent éclore.
• Il n’y a aucune incompatibilité avec les missions de base des bibliothèques
Conclusion (4)
• Au-delà de la numérisation et des formes d’exploitation, la préservation numérique est un vrai défi également
• Notre approche :– Formats ouverts (le + possible)– Lien structurel entre les formats + métadonnées– Stockage multiple + monitoring :
• On-line (serveur, Bibliothèque royale)• Near on-line (tape, Bibliothèque royale)• Off-line (disque + tape, hors site)
• Contacts :
– Coordination : [email protected]– Technique :
[email protected]– Presse belge : [email protected]– Presse clandestine et censurée :