Journées ABES 2014 - Focus sur la plateforme Istex

  • Upload
    abes

  • View
    263

  • Download
    2

Embed Size (px)

DESCRIPTION

Journées ABES 2014 - Session "ISTEX et ses Données" - Laurent Schmitt, Inist-CNRS :"Plate-forme ISTEX, intégration et complémentarité".

Citation preview

  • 1. JABES 21 MAI 2014 - MONTPELLIER Guillaume BILLEY, Etienne CARON, Stphane GULLY, William PAUL, Stanislas PERRIN, Claude NIEDERLENDER, Laurent SCHMITT { [email protected] } PLATEFORME ISTEX INTGRATION ET COMPLMENTARIT Plateforme HUB de Mta donnes Portails Services valeurs ajoute ENT SOCLE Infrastructure matrielle et logicielle Projets de Recherch e

2. ANR-10-IDEX-0004-02 21 Mai 2014 Journes ABES - MONTPELLIER CARTOGRAPHIE DES PROJETS 2 Le SOCLE Reconstruction de Rf. cites ISTEX-R LOREXPLOR CELLO .. HUB De Mtadonns 3. ANR-10-IDEX-0004-02 21 Mai 2014 Journes ABES - MONTPELLIER ARCHITECTURE GLOBALE 3 OAI PMH SPARQL ENDPOINT API Web REST/JSON WIDGETS Utilisateurs METS, DC, PREMIS Entrept central Normalisation des objets Standardisation des formats Gnration de formats (Zip) Gnration Etat de collection Enrichissement Chargement Enrichissement Diffusion 4. ANR-10-IDEX-0004-02 21 Mai 2014 Journes ABES - MONTPELLIER > CHARGEMENT 4 Cartographie des objets Validation Standardisation des formats Gestion des formats Gnration des tats de collection { IdIstext : 8772EC3749E3B85D81DE561444CE21E14EE7649C2 , Corpus : springer , Metadata : { Path : /data/springer/ /Article.xml.meta , Mime : text/xml , Original : true, } , Fulltext : { Path: /data/springer/ /Article.pdf , Mime: application/pdf, Original: true, } , Cover : { Front_matter : /data/springer/ /cover.gif , Back_matter : /data/springer/ /back.gif , } , Supplements: { Path : /data/springer/ /suppl/ } , Objet documentaire norm Homognisation de la granularit { Path: /data/springer/ /Article.xml.mods , Mime: text/xml , Original: false, } , Mtadonnes vers MODS PDF vers TEI ( ) { Path: /data/springer/ /Article.xml.tei, Mime: text/xml, Original : false, } , XmlWellFormed : true, XmlValid: true, Dtd : dtd/A++2/A++2V2-4.dtd XML bien form et valide Gnration de nouveaux formats { Path: /data/springer/ /Article.zip, Mime: application/zip, Original : false, } , 5. ANR-10-IDEX-0004-02 21 Mai 2014 Journes ABES - MONTPELLIER > ENRICHISSEMENTS Reconstruction des rf. cites Extraction terminologique Indexation automatique Entits nommes 5 } Entities : { Path : /data/springer/ /Article.xml.ent, Mime : text/xml , Original : false, } , URL, Dates, Projets, Nom de personnes, .. Article.xml.ent PROLEX : http://www.cnrtl.fr/lexiques/prolex/ Citations : { Path : /data/springer/ /Article.xml.cita, Mime : text/xml , Original : false, } , Article.xml.cita GROBID ET/ou BILBO Article.xml.kw Keywords : { Path : /data/springer/ /Article.xml.kw, Mime : text/xml , Original : false, } , Terminology : { Path : /data/springer/ /Article.xml.term, Mime : text/xml , Original : false, } , Filtrage des mots vides, Lemmatisation Groupes nominaux, Frquence, . TCC : http://ttc.syllabs.com/ Article.xml.term 6. ANR-10-IDEX-0004-02 21 Mai 2014 Journes ABES - MONTPELLIER > DIFFUSION 6 Accs aux ressources ISTEX travers un widget dinterrogation qui sintgre dans un site web. 1 Slection dun sous-corpus via les APIs scriptes, un moissonnage ou SPARQL4 Accs aux ressources ISTEX travers des outils de dcouverte ET/OU de rsolveur de liens. 3Accs aux ressources ISTEX travers les APIs interfaces . 2 7. ANR-10-IDEX-0004-02 21 Mai 2014 Journes ABES - MONTPELLIER 7 http://api.istex.fr/documentation [email protected] http://www.istex.fr @istexdev