Click here to load reader

Les annuaires Les moteurs de recherche Les méta moteurs Les outils de la recherche sur le web

Embed Size (px)

Citation preview

  • Page 1
  • Les annuaires Les moteurs de recherche Les mta moteurs Les outils de la recherche sur le web
  • Page 2
  • Les annuaires de recherche ou index ou rpertoires Ils sont les plus anciens outils de recherche. Cest un outil de recherche qui recense des sites web. Lannuaire est constitu de rubriques (catgories). Subdivises en sous rubrique. Chacune des sous-rubriques comprend une liste de site web.
  • Page 3
  • Page 4
  • Les annuaires : construction La construction dun annuaire est effectue manuellement par la socit qui le gre. Les sites web sont soumis pas les diteurs, lannuaire est libre de les rfrencs ou non dans son index. Une condition de lefficacit dun annuaire est donc forcment li sa taille. Cest--dire le nombre de page rfrencs dans son index.
  • Page 5
  • Utilisation Un annuaire sutilise de 2 manires : Soit par la consultation des catgories (navigation de rubriques en sous-rubriques jusquau sites), Soit par recherche laide de mots-cls.
  • Page 6
  • Avantages & Inconvnients : Avantage : La navigation est simple et constitue un guidage trs efficace, Avantage : Les sites ont t slectionns ; ils sont donc de bonne qualit et bien centrs sur le thme recherch. Inconvnient : La taille de lannuaire est rduite et ne suit pas la croissance du web. Inconvnient : Les sujets trs spcifiques et trs pointus sont difficiles localiser.
  • Page 7
  • Remarque : la recherche Vous ne faites pas la recherche dans le texte intgral du site, mais dans des champs ayant permis de caractriser le site : Son titre Son adresse Sa description Les catgories
  • Page 8
  • Perspectives Le modle de construction dun annuaire repose sur un travail ralis par des humains. Actuellement ce modle conomique tendance disparatre. Les internautes utilisent peu les annuaires parce quils ne les connaissent pas. Chers maintenir Seuls les annuaires spcialiss demeurent en activit et volue
  • Page 9
  • Les annuaires spcialiss Parmi les annuaires spcialiss : Bonweb2, guide des meilleurs sites BrainTrack3, guide d'universits dans le monde CISMef4, catalogue de ressources pour les professionnels de sant Francophones GeoGuide5, sciences de la terre et gographie Historyguide6, histoire Infomine7, ressources pour chercheurs Intute8, ressources pour le monde scolaire et universitaire Le Meilleur du Web9, industrie MathGuide10, mathmatiques MedExplorer11, pharmacie (US) SciSeek12, sciences
  • Page 10
  • Etude de lannuaire Open Directory LOPD, aussi appel DMOZ est un rpertoire de sites web cre en 1998. Il est gr, dvelopp et maintenu par des bnvoles, chacun tant responsable de la vrification des sites et de leur classement. Les principales catgories : 1.Arts 2.Jeux 3.Enfants et adolescents 4.Rfrences 5.Achats 6.Commerce et conomie 7.Sant
  • Page 11
  • La recherche par navigation Recherche sur impressionnisme Le chemin parcourir est le suivant : Arts > Arts Plastiques > Peinture > Priodes et mouvements > Impressionnisme Les rsultats sont :
  • Page 12
  • La recherche simple par mots-cls Les rsultats comprennent les catgories de lannuaire concerns par ce mot-cl, puis les sites correspondant.
  • Page 13
  • La recherche avance par mots-cls
  • Page 14
  • Les moteurs de recherche Les outils les plus utiliss
  • Page 15
  • Prsentation Les outils les plus utiliss Ils fonctionnent sur un systme compltement diffrent de celui de lannuaire. Des robots logiciels (crawlers, spiders, bots) parcourent le web de lien en lien et indexent automatiquement les documents trouvs, permettant ainsi une recherche par mots-cls. Les index contiennent des milliards de pages web.
  • Page 16
  • Utilisation Les recherches dans un moteur se font laide de mots-cls. Ceux-ci peuvent tre nombreux et combins laide doprateur boolen. Ils proposent de faire des recherches simples ou avances. Ces dernires offrent de trs importantes possibilits
  • Page 17
  • Avantages La possibilit de faire des recherches dans une grande masse dinformations. Le fait dobtenir rapidement des informations prcises sur des sujets divers et varis. Le fait de pouvoir trouver des documents spcifiques. Le fait de reprer des sites rcents ou ayant t carts des annuaires. Le fait de pouvoir effectuer des recherches complexes.
  • Page 18
  • Inconvnients Absence de contrle des informations (prsence dURL primes dans les rsultats.) Des interrogations qui semblent complexes car les interfaces changent dun moteur de recherche lautre. Des rsultats parfois surprenants car lindexation est automatique. Des rsultats qui sont classs selon un ordre qui donne la priorit la popularit des rsultats.
  • Page 19
  • Conseil Aucun moteur de recherche ne donne accs la totalit du web. Etre familier avec deux ou trois moteurs vous permettra de faire des recherches pertinentes.
  • Page 20
  • Les moteurs de recherche spcialiss Ghanni17, musique Google Patents18, brevets Google Scholar19, littrature de recherche universitaire In-extenso20, sciences humaines et sociales MedHunt21, information mdicale PhiBot22, information scientifique Scirus23, information scientifique (Elsevier) PsychCrawler24, psychologie Science Research25, sciences Scitopia26, sciences et technologies Spinoo27, sites ducatifs franais Web 2.0 Search Engine28 Wikipedia29
  • Page 21
  • Recherche simple : Cas Google Des sa page daccueil, Google propose une barre de requte permettant deffectuer des recherches. Vous pouvez y inscrire des mots cls simplement spars par des espaces. Attention : Dans Google un simple espace est considr comme un ET par le moteur.
  • Page 22
  • Recherche avance : Cas Google
  • Page 23
  • La recherche avance permet de combiner les mots-cls et d'utiliser des filtres pour paramtrer les recherches. Combiner des mots-cls : La rubrique Pages contenant permet de combiner les mots-cls : avec les oprateurs ET (tous les mots suivants), OU (au moins un des mots suivants), SAUF (aucun des mots suivants), ... (cette expression exacte). Il suffit de placer les mots-cls voulus dans les espaces prvus...et Google saura retranscrire la bonne syntaxe. Utiliser les filtres : Limiter la recherche aux pages rdiges dans une langue donne (Langue), Limiter la recherche des rsultats un pays (Rgion).
  • Page 24
  • Recherche avance : Cas Google Exclure ou au contraire privilgier un format de fichier spcifique :.doc,.xls,.pdf,.ppt (Format de fichier). Limiter la recherche une date (Date). Remarque : la date prise en compte est celle de l'entre de la page dans l'index de Google et non sa date de ralisation. Prciser le champ de la recherche : n'importe o dans la page, dans les titres, dans les URLs, dans le corps de la page ou les liens de la page (Emplacement). Exclure ou au contraire privilgier une extension de Nom de Domaine (Domaines). Rechercher des pages similaires (Similaires). Rechercher des pages lies une page (Liens). Effectuer des recherches sur un sujet prcis (Recherche de code source public).
  • Page 25
  • Une bonne requte Etre prcis et utiliser plusieurs mots pour affiner la recherche. Utiliser lordre du langage naturel. Savoir que Google renvoie des pages qui contiennent exactement les mots-cls recherchs. Google fait des propositions orthographiques. Il ne cherche que le mot, pas sont pluriel ou les conjugaison.
  • Page 26
  • Les mta moteurs ou mta index Outils cres plus rcemment que les prcdents, les mtamoteurs interrogent plusieurs outils de recherche. Ils peuvent tre utiliss directement sur le web ou installs sur le poste client. Les mtamoteurs permettent denvisager un travail de veille avec la gestion de profils et ltablissement de calendriers dexploration.
  • Page 27
  • Utilisation Ils nont pas doutils en propre mais utilise ceux des autres. Moteurs, Annuaires Encyclopdie, Newsgroup Bases de donnes Ils liment les doublons et affichent les rsultats par pertinence.
  • Page 28
  • Avantages Une recherche plus rapide que si on la faisait successivement dans tout les moteurs. Une recherche plus exhaustive en raison dune plus grande couverture. Un reprage des outils les plus fournis sur un sujet donn.
  • Page 29
  • Inconvnients Moins de filtrage car toutes les possibilits de chaque outil ne peuvent tre exploites simultanment. Des recherches moins pointus.
  • Page 30
  • Etude de Ixquick Ixquick transforme la question pose dans la syntaxe de chaque outil interrog. Ixquick limine les doublons et donne les TOP 10 rsultant de chaque outil utilis. On peut choisir de ne faire les recherches que sur certains outils. Les rsultats sont affichs selon un critre de pertinence.
  • Page 31
  • Annuaires, Moteurs, Meta Choisir un annuaire : Il est utile pour trouver des sites rfrencs par des humains. Sur un thme donn, on ne trouvera pas seulement un site, mais en gnral toute une rubrique ddi cette thmatique. Dans une recherche on utilise un annuaire : Se faire une ide des sites existants, dbuter une recherche Identifier prcisment et rapidement des sites de rfrence et ou dactualit sur un thme particulier. Reprer des ressources web invisibles.
  • Page 32
  • Choisir un moteur Lindex dun moteur se construit de manire automatique : les rsultats sont nettement plus nombreux, mais moins fiables. Faire une recherche pointue sur un sujet spcifiques Retrouver rapidement une information pour laquelle vous disposez de mots-cls prcis. Elargir la porte dune requte une grande partie du web.
  • Page 33
  • Choisir un mta Les rsultats dpendent des partenariats tablis avec les autres outils. Le mtamoteur permet dtablir un premier inventaire des informations dites de rfrence .
  • Page 34
  • Synthse Ce que vous devez surtout retenir de ce chapitre Il existe diffrents types d'outils pour rechercher de l'information sur Internet : Les annuaires, qui recensent des sites manuellement et les classent par domaines thmatiques. Ils permettent une recherche par navigation dans lescatgories ou par mots-cls. Ces annuaires peuvent tre gnralistes (comme Open Directory Project) ou spcialiss. Les moteurs de recherche, qui indexent automatiquement le web et permettent une recherche par mots-cls. Ces moteurs peuvent tre gnralistes (comme Google et Exalead) ou spcialiss. Les mtamoteurs de recherche, qui interrogent simultanment plusieurs outils de recherche (comme Ixquick). Le choix de chacun de ces outils dpend troitement du type de recherche effectuer : l'annuaire est le plus pertinent pour dbuter la recherche ; le mta moteur permet de reprer des sites de rfrence ; enfin le moteur de recherche est privilgier pour une recherche pointue partir de mots-cls prcis. Dans tous les cas, il est recommand d'utiliser les possibilits de recherche avance des outils, qui permettent de prciser la recherche et de filtrer les rsultats.
  • Page 35
  • Les outils de recherche dimages, son et vido Les volutions technologiques des outils de recherche permettent dsormais dindxer des documents multimdias de manire efficace.
  • Page 36
  • Les outils collaboratifs Ils sont susceptibles de transformer ou de complter votre manire deffectuer vos recherches. Ils appartiennent au concept Web 2.0 Notion de partage dinformations Flickr, youtube Facebook, Ning Digg Connotea
  • Page 37
  • Dcrypter une adresse Une URL est un format de nommage universel Contient : Le protocole (http) Le nom de domaine (relation IP nom) Le chemin daccs la ressource
  • Page 38
  • Nom de domaine Ce sont les extensions de domaine qui fournissent le plus dinformations Ils en existent deux sortent : Les thmatiques et les gographiques.