Urfist de Rennes, SCD Rennes 1, 20111 Maîtrise de linformation scientifique en Doctorat 2010-2011 URFIST de Rennes, SCD Rennes 1 Module 1, TD 1 : Outils.

  • Published on
    03-Apr-2015

  • View
    106

  • Download
    3

Transcript

Page 1 Urfist de Rennes, SCD Rennes 1, 20111 Matrise de linformation scientifique en Doctorat 2010-2011 URFIST de Rennes, SCD Rennes 1 Module 1, TD 1 : Outils de recherche du web Session MATISSE Alexandre Serres URFIST de Rennes Page 2 Urfist de Rennes, SCD Rennes 1, 20112 Page 3 3 PLAN 1/Panorama, typologies des outils de recherche 2/ Outils de reprage et daccs : annuaires thmatiques, portails 3/ Outils automatiss : moteurs et mtamoteurs de recherche 4/ Moteurs scientifiques, moissonneurs OAI 5/ Outils pour la veille : syndication de contenu, pages personnalisables 6/ Outils de gestion et de partage de signets : les plates-formes de social bookmarking 7/ Ressources pour aller plus loin Page 4 Urfist de Rennes, SCD Rennes 1, 20114 1/ Panorama, typologies des outils de recherche Existence de milliers doutils de recherche : Voir :ISEDB, Vite tous les outilsISEDBVite tous les outils Nombreuses catgories doutils : Annuaires thmatiques Moteurs de recherche Moteurs spcialiss Mtamoteurs Outils de veille, agents intelligents Portails, sites de rfrence Moissonneurs Plates-formes de signets Pages personnalisables... > quelles typologies ? Page 5 Urfist de Rennes, SCD Rennes 1, 20115 1/Typologies des outils de recherche du web Distinguer dabord : Outils propres au web : moteurs de recherche, moteurs de blogs Outils accessibles par le web : bases de donnes, catalogues Deux critres essentiels : Offre des ressources : outil gnraliste / spcialis Mode dindexation : outil humain / automatis Page 6 Urfist de Rennes, SCD Rennes 1, 20116 1/ Typologies des moteurs de recherche : loffre des ressources Critre : type de ressources collectes Distinction principale : Moteurs gnralistes : Google, Yahoo, Exalead, Ask, Bing caractristique historique des grands moteurs : collecte et indexation de tous les types de ressources Moteurs spcialiss : Tendance lourde des moteurs : Modules spcialiss lintrieur des moteurs gnralistes Infinit des types de spcialisations Explosion du nombre doutils Page 7 Urfist de Rennes, SCD Rennes 1, 20117 2.1 Outils de reprage : les annuaires thmatiques Premiers outils du web : Virtual Library (1991), Yahoo (1994) Des principes communs : Slection humaine de ressources : Caractre trs slectif des annuaires Recensement de sites web (et non de pages web) Pr-catgorisation des ressources Arborescence Description manuelle des sites Moteur de recherche interne lannuaire : Possibilits de requtes Page 8 Urfist de Rennes, SCD Rennes 1, 20118 2.1 Outils de reprage : les annuaires thmatiques Usages : Recherche dinformation sur un sujet large Premire approche dun domaine : Exemple de la presse Recherche gographique Recherche de sites de rfrence utiles pour dfricher un domaine, pour les premires recherches sur un sujet Ne pas opposer annuaires et moteurs : outils complmentaires Page 9 Urfist de Rennes, SCD Rennes 1, 20119 2.1 Outils de reprage : les annuaires thmatiques Annuaires tous publics: Open Directory : Open Directory plus important annuaire gnraliste Annuaires scientifiques multidisciplinaires : Virtual Library : annuaire collectif de ressources scientifiques Virtual Library Les Signets de la BNF : Les Signets de la BNF slection de sites de rfrence Signets Universits : Signets Universits Liens slectionns par les BU Sciseek DOAJ : annuaire de revues en libre accs DOAJ 5952 revues recenses en janvier 2011 Guides disciplinaires de lUQAC (Universit du Qubec Chicoutimi) : Guides disciplinaires de lUQAC Guides de ressources par disciplines Exemple en Gnie informatiqueGnie informatique Page 10 Urfist de Rennes, SCD Rennes 1, 201110 2.1 Outils de reprage et daccs : les portails Dfinition : "Ressource accessible via Internet, constituant un point d'accs unique, simplifi, facile d'emploi et unifi, pour un public cible, des ressources (services, produits) lectroniques distantes, varies et htrognes". (Sylvie Dalbin, Instruments de recherche sur le Web, in La Recherche d'information sur les rseaux, cours INRIA 2002) Dispositif : documentaire (ressources informationnelles), communicationnel, ditorial, technique... Diversit des ressources et services : recherche d information, achats/ventes, informations gnrales, spcialises, personnalisation, messagerie, forums, services dalerte Portails gnralistes / spcialiss Exemples : Yahoo.fr, Culture.frYahoo.frCulture.fr Page 11 Urfist de Rennes, SCD Rennes 1, 201111 2.1 Annuaires et portails en sciences Portails officiels : Science.gouv.fr, portail de la science du Ministre de lEnseignement suprieur Science.gouv.fr Portails multidisciplinaires : Intute : Intute: Portail scientifique multidisciplinaire Voir Intute Mathematics and Computer scienceIntute Mathematics and Computer science SciNet Science and Technology : SciNet Science and Technology Annuaire, cr en 1999 SciCentral Portail de ressources scientifiques, depuis 1997 Page 12 Urfist de Rennes, SCD Rennes 1, 201112 2.1 Annuaires et portails en sciences de lingnieur SAPRISTI (Sentiers d'Accs et Pistes de Recherche d'Informations Scientifiques et Techniques sur Internet), INSA Lyon SAPRISTI Propose des slections de sites et doutils, une mthodologie de recherche et de validation de linformation, dans le domaine des Sciences de lingnieur. Portail de lIEEE : Portail de lIEEE Exemple : recherche de confrencesrecherche de confrences Page 13 Urfist de Rennes, SCD Rennes 1, 201113 2.1 Autres annuaires et portails spcialiss en sciences de lingnieur Un portail scientifique spcialis : AERADE (Aerospace and Defence resources (http://aerade.cranfield.ac.uk)http://aerade.cranfield.ac.uk Cranfield University (G.B.) Deux portails professionnels : Mechanical Engineering Portal (The Mechanical Design Engineering Portal) (http://iCrank.com)http://iCrank.com ABC Electronique, Portail de llectronique (http://www.abcelectronique.com/)http://www.abcelectronique.com/ Depuis 2000 Page 14 Urfist de Rennes, SCD Rennes 1, 201114 3.1 Les moteurs de recherche Dfinition : outil automatis dindexation et de recherche des ressources du web Fonctionnement : 3 modules autonomes : robot collecteur : collecte des donnes module dindexation : base de donnes du moteur module de requte : gestion des requtes et des rsultats Diffrence avec les annuaires : - indexent automatiquement les ressources - indexent les pages web et/ou les documents, et non les sites Page 15 Urfist de Rennes, SCD Rennes 1, 201115 3.1 Moteurs de recherche : comprendre leur fonctionnement Source : R. Viseur, CETICR. Viseur, CETIC Page 16 Urfist de Rennes, SCD Rennes 1, 201116 3.1 Moteurs de recherche : matriser linterrogation avance Nombreuses possibilits de filtrage des rsultats : gographique du web : mondial, francophone linguistique : choix de la langue des ressources des types de ressources : images, audio des ressources internet : web, forum, messagerie, weblogs des formats : HTML, PDF, DOC, PPT, XLS, RTF des dates : plusieurs options (mais problmatique) des champs : titre, URL, host, domaine thmatique : choix du domaine de recherche Exercice de recherche : chercher un support pdagogique rcent, en franais, expliquant le fonctionnement des moteurs de recherche et provenant dune universit Page 17 Urfist de Rennes, SCD Rennes 1, 201117 3.1 Moteurs de recherche : matriser les oprateurs de recherche Oprateurs boolens : AND : implicite ; diffrent de + + : prend en compte lorthographe exacte - : exclut un ou plusieurs termes (SAUF) OR (ou |) : lun ou lautre ou tous les termes Oprateurs linguistiques : : recherche dexpression exacte * : astrisque permet de remplacer un terme sur Google : ~ : recherche sur les synonymes (dans version anglaise) define: : pour trouver la dfinition dun mot Rgle : limite des 10 mots Page 18 Urfist de Rennes, SCD Rennes 1, 201118 3.1 Moteurs de recherche : connatre les m thodes de classement des rsultats Enjeux du relevance ranking , du classement des rsultats selon leur pertinence Deux grandes mthodes (imbriques) de classement : tri par indice de pertinence : calculs statistiques sur la frquence des termes tri par popularit : indice de popularit, indice de clic Page 19 Urfist de Rennes, SCD Rennes 1, 201119 3.1 Mthodes de classement des rsultats : lindice de pertinence Principes : classement des rsultats fond sur la frquence dapparition et la localisation des termes de la requte dans une page web affichage des rsultats partir du calcul dun score pour chaque rponse : Ex. : Requte sur le march des DVD en France : +march +DVD +France > retourne les documents contenant tous les mots de la requte >> documents contenant le plus de fois les mots de la requte classs en premier Utilisation : premire mthode de classement utilise sur le web ; Utilise, partiellement ou non, sur tous les moteurs de recherche ; Problmes : dtournement par le spamdexing Page 20 Urfist de Rennes, SCD Rennes 1, 201120 3.1 Mthodes de classement des rsultats : lindice de popularit Principes, origines : Utilisation de la nature hypertextuelle du web : prise en compte des liens entre sites, considrs comme des liens de parent smantique calcul de la notorit dun site en fonction du nombre de liens pointant vers le site Utilisation : indice de popularit lanc par Google en 98 originalit et succs de Google et de son PageRankGoogle Page 21 Urfist de Rennes, SCD Rennes 1, 201121 3.1 Moteurs de recherche : utiliser le filtrage des rsultats Utiliser les options daffinement des rsultats : Sur Exalead : la zapette zapette Sur Google : Afficher les options Afficher les options Diffrentes possibilits de filtrage : Sur les types de ressources : blogs, vidos, actualits Sur les dates dindexation Sur les mots associs (Exalead), les recherches associes (Google Options de tri et daffichage : Sur la chronologie (Google) Sur les concepts ( roue magique sur Google) Page 22 Urfist de Rennes, SCD Rennes 1, 201122 3.1 Moteurs de recherche : distinguer liens naturels et liens sponsoriss Positionnement : Position occupe par un site ou une page web dans la page de rsultats dun outil de recherche Positionnement naturel Selon le contenu, la notorit du site parcouru par le robot Positionnement payant : Achat de mots-cls, pour garantir une visibilit en tte des rsultats dun outil de recherche Ex. sur GoogleGoogle Principale source du financement de Google Page 23 Urfist de Rennes, SCD Rennes 1, 201123 3.2 Outils de recherche : Les mtamoteurs Dfinition : Un mtamoteur est un outil de recherche qui interroge en parallle plusieurs outils (moteurs et annuaires), rapatrie leurs rponses et les organise, selon des mthodes de classement spcifiques, pour fournir aux utilisateurs une prsentation structure des rsultats. Ns en 1995 Diversit des mtamoteurs : En ligne / hors-ligne Gnraux / spcialiss Page 24 Urfist de Rennes, SCD Rennes 1, 201124 3.2 Les mtamoteurs Fonctionnement, lments dun mtamoteur : pas de base de donnes en propre outils intermdiaires : une seule requte pose sur diffrents outils Exploitation des rsultats des autres outils Gnralement, fusion des rsultats et limination des doublons Classement des rsultats selon critres propres au mtamoteur Prsentation des rsultats, selon diffrentes mthodes : linaires, cartographiques Page 25 Urfist de Rennes, SCD Rennes 1, 201125 3.2 Les mtamoteurs Utilisation, intrt : Simplification : Une seule requte sur plusieurs outils Elargissement de la recherche : : Possibilit dinterroger plusieurs sources : dune dizaine un millier (Copernic) Renforcement de la pertinence : Slection des documents plus pousse, par le calcul de pertinence opr sur plusieurs outils Utiles pour un panorama des ressources, des sites de rfrence sur un thme Exploitation parfois sophistique des rsultats Outils paramtrables, personnalisables (surtout hors- ligne) Page 26 Urfist de Rennes, SCD Rennes 1, 201126 3.2 Les mtamoteurs Exemples de mtamoteurs : Francophones : Ixquick : http://www.ixquick.com Ixquick Anglo-saxons : Yippy : Yippy Plusieurs modules spcialiss Techniques de clustrisation SurfWax : http://www.surfwax.com SurfWax Page 27 Urfist de Rennes, SCD Rennes 1, 201127 4/ Outils de recherche spcialiss selon loffre des ressources Au moins 3 critres de spcialisations : Selon les ressources internet : Moteurs de blogs, de forums, de listes de diffusion, de FAQ, de wikis, de fils RSS Selon la nature du contenu : Moteurs scientifiques, dactualit, de personnes, de produits Selon la nature du mdia : Moteurs dimages, de vidos, de podcasts, de photos.. Autres critres possibles : langue, gographie, domaine thmatique Page 28 Urfist de Rennes, SCD Rennes 1, 201128 4/ Outils spcialiss : quelques exemples Selon les ressources internet : Moteurs de blogs : Technorati Google Blog Search Pour aller plus loin : Intelligence-CenterIntelligence-Center Selon la nature des informations : Moteurs dactualit (dpches, articles) : Wikio Yahoo Actualits Page 29 Urfist de Rennes, SCD Rennes 1, 201129 4.1 Moteurs scientifiques Moteurs spcialiss sur les ressources scientifiques Plusieurs types, plusieurs statuts; typologie possible selon : Le contenu des ressources : Moteurs multidisciplinaires : Google Scholar, ScirusGoogle ScholarScirus Moteurs disciplinaires : GetInfo, SearchPigeonGetInfoSearchPigeon Laccessibilit des ressources : Moteurs de recherche spcialiss dans les ressources en "libre accs" (open access), appels aussi moissonneurs (harvesters) : OAIsterOAIster Moteurs de recherche spcialiss dans les articles de revues, la littrature scientifique commercialise : ScirusScirus Page 30 Urfist de Rennes, SCD Rennes 1, 201130 4.1 Google Scholar : fonctionnalits dinterrogation Prfrences : interface en franais Lien vers bibliothques Champs et oprateurs avancs dinterrogation : Sur lauteur : author: ou champ Auteur en mode avanc Sur le titre dune revue : Uniquement en mode avanc : champ Publication, Sur le titre dun article ou dun document : Oprateur intitle: Sur la date : Uniquement en mode avanc : champ Date Pour en savoir plus Page 31 Urfist de Rennes, SCD Rennes 1, 201131 4.1 Moteurs scientifiques en sciences et techniques Toutes disciplines scientifiques : Scirus :Scirus Produit par Elsevier ; indexation des revues et produits dElsevier plus de 450 millions de documents Pour en savoir plus, cf Urfist de LyonUrfist de Lyon Citebase Search : base de citations ; articles en physique, maths, informatique, biologie et mdecineCitebase Search Informatique, Sciences de lingnieur, maths : CiteSeer.IST : informatique et sciences de linformationCiteSeer.IST Plus de 760 000 documents indexs ; la fois bibliothque numrique et moteur de recherche. systme automatique de calcul de citations. TechXtra :TechXtra Recherche dans 31 collections : revues, archives ouvertes, bases de donnes GetInfo :GetInfo Moteur de recherche allemand en sciences et technologie Page 32 Urfist de Rennes, SCD Rennes 1, 201132 A. Serres, Urfist Rennes, 2011 32 4.2 Moteurs scientifiques : moissonneurs OAIster : OAIster Le plus grand moissonneur OAI Dvelopp lUniversit du Michigan et soutenu par OCLC (depuis janvier 09) Donne accs plus de 23 millions de notices Aliment par plus de 1100 contributeurs : archives ouvertes essentiellement Dsormais intgr et accessible dans WorldCatWorldCat LARA : LARA Libre accs aux Rapports scientifiques et techniques Moissonneur de lINIST Page 33 Urfist de Rennes, SCD Rennes 1, 201133 4.2 Moteurs scientifiques : moissonneurs Scientific Commons : Scientific Commons Conu par l'Universit de St Gallen et l'Institute for Media and Communications Management (Suisse). Annone plus de 38 millions de publications, plus de 6 millions d'auteurs, rparties sur plus de 1100 archives. Simplicit dinterrogation en texte intgral et filtrage des rsultats par anne et par langue (anglais et allemand) et pertinence. Exportation des rfrences bibliographiques d'un rsultat au format EndNote ou Bibtex. Commence extraire les citations des publications indexes en texte intgral (+ de 500 000). Page 34 Urfist de Rennes, SCD Rennes 1, 201134 4.2 Moteurs scientifiques : golocalisation de chercheurs AuthorMapper : AuthorMapper Outil bibliomtrique gratuit, produit par Springer Recherche dans 3 millions darticles, issus des 2000 revues diffuses par Springer Golocalisation : Croisement des donnes sur les publications en ligne avec la technologie Google Maps Localisation dexperts, dquipes, de thmes de recherche Page 35 Urfist de Rennes, SCD Rennes 1, 201135 5/ Outils pour la veille Veille : au sens large, activit de surveillance de lenvironnement et de ses volutions, dans un domaine donn Importance pour le chercheur : Se tenir inform des nouveauts dans son domaine Suivre lactualit dun site, dune source, dun auteur Nombreux outils existants : Mtamoteurs, outils professionnels Syndication de contenus Page 36 Urfist de Rennes, SCD Rennes 1, 201136 5.1 Faire de la veille : les alertes Rappel : Rptition automatique dune requte chaque mise jour dune source d'information (base de donnes, catalogue, revue, moteur de recherche). Comment mettre en place une alerte ? Ouvrir un compte, dfinir un profil Dfinir la source : revue, site dfinir la requte : mots-cls.. Dfinir la priodicit des alertes Dfinir le mode de transmission : mel, fils RSS Page 37 Urfist de Rennes, SCD Rennes 1, 201137 5.1 Faire de la veille : les alertes Quelques exemples de services dalertes Tous publics, tous sujets : Google Alertes Sur les bases de donnes : voir Services dalertes dans les bases de donnesServices dalertes dans les bases de donnes Services scientifiques : Inist : Inist Services payants de veilleveille Page 38 Urfist de Rennes, SCD Rennes 1, 201138 5.1 Faire de la veille : exemples de veille avec les fils RSS Rcupration automatique : des tables des matires des derniers numros de revues lectroniques : Ex. : f ils RSS des revues du groupe Naturegroupe Nature des rsultats d'une recherche bibliographique dans une base de donnes : ex : fils RSS dans PubmedPubmed Des derniers billets dun blog scientifique : Ex. : DrugMonkeyDrugMonkey Page 39 Urfist de Rennes, SCD Rennes 1, 201139 5.1 Faire de la veille : utiliser les fils RSS Diffrents outils pour agrger et lire les fils RSS : Agrgateurs en ligne : MetaRSS,MetaRSS Pages personnalisables : Netvibes, IGoogle... Agrgateurs en local : FeedReader ;FeedReader Agrgateurs intgrs a u navigateur : Firefox, Safari, Opera.. Page 40 Urfist de Rennes, SCD Rennes 1, 201140 5.2 Faire de la veille : Les pages personnalisables Dfinition : Pages personnalisables : Possibilit de grer et dorganiser soi-mme ses flux RSS Pages web organises en onglets et botes Fournies gratuitement Exemples : Netvibes PagesFlakes iGoogle Page 41 Urfist de Rennes, SCD Rennes 1, 201141 5.2 Faire de la veille : Les pages personnalisables Fonctions : Pour la gestion et la recherche dinformation Choix personnel des sources : sites web, blogs, fils RSS Divers services : calendrier, agenda Bureau virtuel Outils de veille, de surveillance Outils dinformation, de publication Dveloppement des portails Netvibes Pages personnalisables Netvibes rendues publiques Urfist de Rennes Documentation Franaise MonBiblioCNRS : MonBiblioCNRS Portail Netvibes du CNRS Page 42 Urfist de Rennes, SCD Rennes 1, 201142 6/ Les plateformes de partage de signets Intrt pour la recherche : Recherche parmi les sources juges pertinentes par une groupe dutilisateurs Identifier des leaders de veille Juger de la popularit dune source (combien de fois a-t-elle t mise en signets) Page 43 Urfist de Rennes, SCD Rennes 1, 201143 6/ Les plateformes de partage de signets Intrt pour les doctorants : Garder les traces de ses navigations Reprer des sources fiables Grer ses bibliographies Faire de la veille Se familiariser avec les outils 2.0 Page 44 Urfist de Rennes, SCD Rennes 1, 201144 6/ Les plateformes de partage de signets Principes : Externalisation de ses bookmarks Indexation libre par tags Classement des signets par catgories et par tags Indication du nombre de signalements d'un mme signet Cration de rseaux de partage social bookmarking Intrt : Simplicit : de collecte et de gestion des signets Plus-value documentaire : Tags Catgories Plus-value sociale : Capitalisation du rseau Rseaux de confiance Page 45 Urfist de Rennes, SCD Rennes 1, 201145 6/ Plateformes de partage de signets Gnralistes : Delicious : Yahoo Delicious Diigo Blogmarks : entreprise franaise Blogmarks Blinklist : MindValley Labs, entreprise de Malaisie Blinklist Scientifiques : Connotea : revue Nature Connotea 2collab : Elsevier 2collab Bibsonomy : Universit de Kassel (Allemagne) Bibsonomy Page 46 Urfist de Rennes, SCD Rennes 1, 201146 6.1 Grer ses signets sur des plateformes de partage en ligne : Delicious Plateforme de partage de signets la plus ancienne : http://delicious.com/ Cre fin 2003 par Joshua Schachter, pour grer ses propres signets Ancien nom : Del.icio.us Plateforme rachete par Yahoo en dcembre 2005 Symbole du web 2.0 et des folksonomies Plateforme la plus importante : tous publics Cration de rseaux de social bookmarking Interfaage avec applications web 2.0: pages perso., autres plateformes... Page 47 Urfist de Rennes, SCD Rennes 1, 201147 6.2 Grer ses signets sur des plateformes de partage en ligne : Connotea Connotea http://www.connotea.org/ Lanc en 2004 par la revue Nature (Nature Publishing Group) Service en ligne gratuit Cration, gestion, partage de sa bibliographie de rfrences en ligne gratuit / accs lensemble des rfrences partages dans Connotea + Partage de signets dans le monde acadmique Annotation / Tags Extraction automatique de rfrences bibliographiques Abonnement RSS aux listes des autres utilisateurs ou tags spcifiques Export possible Page 48 Urfist de Rennes, SCD Rennes 1, 201148 6.2 Grer ses signets sur des plateformes de partage en ligne : Connotea Connotea Installation des boutons Connotea dans la barre personnelle navigateur My Library Add to Connotea Connotea Comments Intgration de signets en cours de navigation Page courante + clic sur Add Connotea Page 49 Urfist de Rennes, SCD Rennes 1, 201149 6.2 Grer ses signets sur des plateformes de partage en ligne : Connotea Utilisation de la toolbox pour grer sa bibliothque Bote outils Connotea Page 50 Urfist de Rennes, SCD Rennes 1, 201150 7/ Ressources pour aller plus loin Form@doct URFIST de Rennes : Supports de formation sur la recherche dinformation la recherche dinformation Slection de ressources sur les outils de recherche Slection de ressources sur les outils de recherche URFIST de Lyon : Ressources pdagogiques REPERE SAPRISTI SISTEM CALIS DEFIST MethoDoc (Univ. De Gembloux) MethoDoc InfoSpheres AERIS (en sciences) AERIS

Recommended

View more >