24
27/11/2012 Veille & Documentation Le moteur de recherche : opportunité pour bâtir une application documentaire Retour d'expérience sur un corpus documentaire semi- structuré

Le moteur de recherche, opportunité pour bâtir une application documentaire

Embed Size (px)

DESCRIPTION

Lyon, 27 novembre 2012 - journée d'étude : "Le moteur de recherche interne, élément clé de l’accès à l’information dans l’entreprise" Retour d'expérience sur un corpus documentaire semi-structuré : les délibérations de la collectivité

Citation preview

Page 1: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Le moteur de recherche : opportunité pour bâtir

une application documentaire

Retour d'expériencesur un corpus documentaire semi-

structuré

FORMATION 0056
Sur la diapositive titre changer la direction (DRH - FORMATION) : Affichage>masque>masque des diapositivesSur toutes les autres diapositives : changer la date de réunion et indiquer en pied de page le thème de la réunion :Affichage >en-tête et pied de page
Page 2: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Plan de la présentation

le contexteinstitution, corpus documentaire

le projetantécédents, autres usages du moteur

déroulement, interfaces développées

des focus• indexation/restitution• résultats• facettes• utilisation du thésaurus• typologie documentaire

Page 3: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Rhône-Alpes : la région, la Région

La 2ème région de France par sa taille et sa population

Une collectivité territoriale, 2 assemblées : • Conseil régional (CR)• Conseil économique social environnemental régional (CESER)

Les compétences : emploi-formation, lycées, transports, développement économique…

Budget 2012 : 2,4 Mds €

L’administration : 6600 agents

Page 4: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

La délibération, document fondateur « Le Conseil régional règle par ses délibérations les affaires de

la région» (Art. L. 4221-1 Code Gén. Collectivités Territoriales)

Acte réglementaire, créateur de droits/obligations Résulte des discussions de l’assembléeExécutoire après publicationEffets perpétuels, tant qu’il n’est pas modifié ou abrogé

Page 5: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Les documents liés aux délibérations

En amont des débats :- rapports préparatoires (directions),- comptes-rendus (commissions thématiques), - avis (CESER)- droit d’initiative, amendements, questions d’actualité, vœux

(groupes d’élus)

Pendant les débats :- procès-verbaux (assemblée plénière)- comptes-rendus (commission permanente)

En aval :- arrêtés (Président)

Produits à partir de modèles, qui harmonisent a minima leur forme et posent des règles de rédaction communes

Page 6: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Les faiblesses de l’interface précédente

Application « Rapports et délibérations » sur l’Intranet (technologie Microsoft Index Server)

Un formulaire multicritères… très critiqué ! - sensible à la casse et l’accentuation - opérateurs obligatoires (ET, OU, SAUF, PRES)- résultats peu parlants- manuel d’utilisation et longues explications en ligne.

Des retours négatifs des usagers finaux, contraints de faire appel aux documentalistes pour trouver le bon document

Un mode de recherche présupposant que l’utilisateur « sait » : ce qu’il cherche précisément et comment l’exprimer

Page 7: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

formulaire

résultats

Page 8: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Le moteur FAST à la Région Rhône-Alpes

acquis avec l’Intranet Sharepoint 2007

les usages :

- recherche globale sur les contenus Intranet,

- contextualisation d’informations,

- personnalisation d’affichages,

- mise à disposition de données.

Page 9: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Développer un usage applicatif A la base : un processus et une ressource documentaire contraignants

Inenvisageable de construire une base de données documentaire, vu l’arriéré et les volumes (ex. Région Île-de-France : base Mariane sous CINDOC)

La décision : tirer parti de FAST dans une logique applicative

Quel intérêt ? Moteur pertinent pour des recherches plein texte, sur des contenus non structurés et de gros volumes de données

Quels objectifs ? permettre des recherches qualitatives, donner du sens au corpus

Comment ?Un travail conjoint du Service Veille & Documentation, de la DSI, des développeurs, en lien avec les services producteurs

Page 10: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Le déroulement du projet

1. Étude de l’existantlocalisation documents, bilan de l’application

2. Analyse du besoinretour sur recherches effectuées par les documentalistes, détermination de questions-types

3. Réalisation du prototype à partir d’une V0 isofonctionnelleprocessus d’indexation réitéré de très nombreuses foisconstruction des facettes

4. Validation auprès des services producteurs/gestionnaires5. Publication sur l’Intranet, communication auprès des publics-

cibles6. Suites

déclinaison pour le site webévolutions internes (nouvelles commissions…)suivi des usages

Page 11: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

La nouvelle interface

Un nouvel intitulé : « Actes et débats »

Un unique champ de recherche « à la Google »

Une page de résultats efficace et intuitive

Des contraintes réduites en recherche : insensibilité à la casse, aux accents, aux pluriels ; gestion des mots vides ; opérateur ET par défaut; « expression » ; troncature *; exclusion -

Présentation des résultats fortement améliorée : ordre, cartouche sur mesure, résumé dynamique…

Des facettes pour préciser la recherche et naviguer dans les résultats proposés

Page 12: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Deux applications : sur l’Intranet…

Une interface très complète :

- pour les agents et les élus- tous les documents liés à la vie des assemblées (soit 33 000 depuis 1997)- 7 facettes liées au contenant- 3 facettes liées au contenu

Page 13: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

… et sur le site web Région

Une interface allégée - pour le « grand public » - 2 entrées : CR, CESER - seulement les documents communicables (17600) - 3 facettes : date, géographie, thème - requête pré-câblée sur les dernières décisions

Page 14: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Focus 1 : indexation et restitution

Processus d’indexation commun

La source : un répertoire informatique où sont déposés les fichiers correspondant aux documents produits par les deux assemblées (CR et CESER)

Fast indexe les fichiers .html, mais affiche les documents .pdf

Recherche Intranet : le pdf affiché est stocké sur serveur interne

Recherche sur le site web : le pdf affiché est stocké sur un serveur externe, ne contenant que les documents communicables

Arborescence identique :- pour les documents PDF et HTML,- sur les serveur interne ou externe.

Page 15: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Focus 2 : les résultats

Ordre déterminé en combinant plusieurs critères : - pertinence du document, - valeur juridique, - fraîcheur.

Pondération : chaque résultat se voit attribuer un rang défini parun score dynamique présence du mot dans le titre, le numéro du document, le corps du texte …et statique boost en fonction de la valeur juridique, du + au moins contraignant

Modulé en fonction de la fraîcheur du document

Un cartouche de résultats dynamique et parlantSource de rebonds : vers le document PDF + documents liés

Page 16: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Le cartouche, le document PDF

Page 17: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Focus 3 : les facettes

Retenues à partir des besoins et pratiques

Typologie : - contenant : type de document, date, mandature, assemblée et

commission concernées, réunion - contenu : vocabulaire métier, territoires, relations entre

documents

Construction: structure du document, propriétés, texte

Les sources principales : - le chemin informatique d’accès au document (URL) ; - le texte intégral du document ; - les métadonnées portées par le document ; - le thésaurus interne.

Page 18: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Champ de recherche

Résultats de rechercheFacettes

« contenant »Facettes

« contenu »

Page 19: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Page 20: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Focus 4 : le recours au thésaurus

Appel au thésaurus interne VOCOM, en l’absence d’indexation

Vocabulaire métier sur mesure (mots-clés, politiques régionales, territoires, organismes partenaires…)

Utilisé pour les facettes DISPOSITIFS et GEOGRAPHIE

Extraction des descripteurs dans le texte des documents

Listes normalisées : mandatures, commissions thématiques

Page 21: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

- facette issue de la liste des ACTIONS REGION (VOCOM)

- liste ouverte par défaut sur 5 items

- classement / occurences

- facette issue de l’INDEX GEOGRAPHIQUE (VOCOM) : extrait de la branche Rhône-Alpes

- fermée par défaut

- une taxonomie

Exemple de recherche : entreprise + 2012

Page 22: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Focus 5 : typologie de délibérations

répondre aux les besoins métiers

en l’absence de règles d’écriture, identification d’habitudes et de choix rédactionnels

construction de règles de gestion

plusieurs clés : titres, récurrence de certains mots, commission responsable…

Page 23: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Délibération budgétaireDOB, budget primitif, décision modificative, compte de gestion, compte administratif, taux de fiscalité (directe / indirecte), TIPP, attribution de subvention, caducité des subventions et dépenses similaires, programme prévisionnel des investissementsCommission Finances + présence dans le titre des termes suivants

BUDGET* PRIMITIF*; COMPTE DE GESTION ; COMPTE* ADMINISTRATIF* ; TIPP ; TARIF* FISCALITE*; DECISION* BUDGETAIRE* MODIFICATIVE* ; DECISION* MODIFICATIVE* EXERCICE* ; ORIENTATION* BUDGET*EXONÉRATION* TAXE PROFESSIONNELLE ; EXONÉRATION* COTISATION* VALEUR AJOUTÉE ; RÈGLEMENT BUDGÉTAIRE FINANCIER ; DISPOSITION* BUDGETAIRE* ; DISPOSITION* FINANCIERE* ; PROGRAMME PRÉVISIONNEL INVESTISSEMENT* ; MODELE* CONVENTION* ATTRIBUTIVE* SUBVENTION* ; CADUCITE* SUBVENTION* ; DEPENSE* SUBVENTIONNABLE*

Délibération cadre (création/révision d’une politique régionale)Plan régional en faveur de…Politique régionale…Plan de mandat…Schéma régional…Plan…Plan de soutien…Plan cadre…Stratégie régionale…Modalités d’intervention…Présence dans le titre des termes suivants :

PLAN REGIONAL EN FAVEUR DEPLAN POUR LE DEVELOPPEMENTPLAN REGIONAL POURPLAN REGIONAL DE DEVELOPPEMENTPLAN REGIONAL D’AIDEPLAN REGIONAL DESPOLITIQUE* REGIONALE*PLAN* MANDAT*SCHEMA* REGIONA*PLAN TRIENNALPLAN ROUTIERPLAN* ENERGIE*PLAN* D'ACCES*PLAN* MODERNISATION*PLAN* CAMPUS*PLAN* SAISONNIER*PLAN* SAISONNALITE* TOURISME*PLAN* DEPLACEMENT* URBAIN*PLAN* PREVENTION*PLAN* SOUTIEN*DELIBERATION* CADRE*PLAN* CADRE*STRATEGIE* REGIONALE*STRATEGIES EUROPEENESMODALITE* D’INTERVENTION* PRINCIPE* D'INTERVENTION* MODALITE* MISE ŒUVRE*MODALITE* D'APPLICATION*

Page 24: Le moteur de recherche, opportunité pour bâtir une application documentaire

27/11/2012Veille & Documentation

Merci pour votre attention !

Pascale BOUTON [email protected]