Click here to load reader

Les outils de la recherche sur le web

  • Upload
    lore

  • View
    45

  • Download
    0

Embed Size (px)

DESCRIPTION

Les outils de la recherche sur le web. Les annuaires Les moteurs de recherche Les méta moteurs. Les annuaires de recherche ou index ou répertoires. Ils sont les plus anciens outils de recherche. C’est un outil de recherche qui recense des sites web. - PowerPoint PPT Presentation

Citation preview

Les outils de la recherche sur le web

Les annuairesLes moteurs de rechercheLes mta moteursLes outils de la recherche sur le webLes annuaires de recherche ou index ou rpertoiresIls sont les plus anciens outils de recherche.Cest un outil de recherche qui recense des sites web.Lannuaire est constitu de rubriques (catgories).Subdivises en sous rubrique.

Chacune des sous-rubriques comprend une liste de site web.

Les annuaires : constructionLa construction dun annuaire est effectue manuellement par la socit qui le gre.

Les sites web sont soumis pas les diteurs, lannuaire est libre de les rfrencs ou non dans son index.

Une condition de lefficacit dun annuaire est donc forcment li sa taille. Cest--dire le nombre de page rfrencs dans son index.

UtilisationUn annuaire sutilise de 2 manires :

Soit par la consultation des catgories (navigation de rubriques en sous-rubriques jusquau sites),

Soit par recherche laide de mots-cls.

Avantages & Inconvnients :Avantage : La navigation est simple et constitue un guidage trs efficace,

Avantage : Les sites ont t slectionns ; ils sont donc de bonne qualit et bien centrs sur le thme recherch.

Inconvnient : La taille de lannuaire est rduite et ne suit pas la croissance du web.Inconvnient : Les sujets trs spcifiques et trs pointus sont difficiles localiser.

Remarque : la rechercheVous ne faites pas la recherche dans le texte intgral du site, mais dans des champs ayant permis de caractriser le site :

Son titreSon adresse Sa descriptionLes catgoriesPerspectivesLe modle de construction dun annuaire repose sur un travail ralis par des humains . Actuellement ce modle conomique tendance disparatre.

Les internautes utilisent peu les annuaires parce quils ne les connaissent pas.

Chers maintenir

Seuls les annuaires spcialiss demeurent en activit et volueLes annuaires spcialissParmi les annuaires spcialiss :Bonweb2, guide des meilleurs sitesBrainTrack3, guide d'universits dans le mondeCISMef4, catalogue de ressources pour les professionnels de sant FrancophonesGeoGuide5, sciences de la terre et gographieHistoryguide6, histoireInfomine7, ressources pour chercheursIntute8, ressources pour le monde scolaire et universitaireLe Meilleur du Web9, industrieMathGuide10, mathmatiquesMedExplorer11, pharmacie (US)SciSeek12, sciencesEtude de lannuaire Open DirectoryLOPD, aussi appel DMOZ est un rpertoire de sites web cre en 1998. Il est gr, dvelopp et maintenu par des bnvoles, chacun tant responsable de la vrification des sites et de leur classement.Les principales catgories : 1.Arts2.Jeux3.Enfants et adolescents4.Rfrences5.Achats6.Commerce et conomie7.SantLa recherche par navigationRecherche sur impressionnisme

Le chemin parcourir est le suivant : Arts > Arts Plastiques > Peinture > Priodes et mouvements > ImpressionnismeLes rsultats sont :

La recherche simple par mots-clsLes rsultats comprennent les catgories de lannuaire concerns par ce mot-cl, puis les sites correspondant.

La recherche avance par mots-cls

Les moteurs de rechercheLes outils les plus utilissPrsentationLes outils les plus utilissIls fonctionnent sur un systme compltement diffrent de celui de lannuaire.Des robots logiciels (crawlers, spiders, bots) parcourent le web de lien en lien et indexent automatiquement les documents trouvs, permettant ainsi une recherche par mots-cls.

Les index contiennent des milliards de pages web.UtilisationLes recherches dans un moteur se font laide de mots-cls. Ceux-ci peuvent tre nombreux et combins laide doprateur boolen.

Ils proposent de faire des recherches simples ou avances.

Ces dernires offrent de trs importantes possibilitsAvantagesLa possibilit de faire des recherches dans une grande masse dinformations.Le fait dobtenir rapidement des informations prcises sur des sujets divers et varis.Le fait de pouvoir trouver des documents spcifiques .Le fait de reprer des sites rcents ou ayant t carts des annuaires.Le fait de pouvoir effectuer des recherches complexes.InconvnientsAbsence de contrle des informations (prsence dURL primes dans les rsultats.)Des interrogations qui semblent complexes car les interfaces changent dun moteur de recherche lautre.Des rsultats parfois surprenants car lindexation est automatique.Des rsultats qui sont classs selon un ordre qui donne la priorit la popularit des rsultats.ConseilAucun moteur de recherche ne donne accs la totalit du web. Etre familier avec deux ou trois moteurs vous permettra de faire des recherches pertinentes.Les moteurs de recherche spcialissGhanni17, musiqueGoogle Patents18, brevetsGoogle Scholar19, littrature de recherche universitaireIn-extenso20, sciences humaines et socialesMedHunt21, information mdicalePhiBot22, information scientifiqueScirus23, information scientifique (Elsevier)PsychCrawler24, psychologieScience Research25, sciencesScitopia26, sciences et technologies Spinoo27, sites ducatifs franaisWeb 2.0 Search Engine28Wikipedia29Recherche simple : Cas GoogleDes sa page daccueil, Google propose une barre de requte permettant deffectuer des recherches.Vous pouvez y inscrire des mots cls simplement spars par des espaces.

Attention : Dans Google un simple espace est considr comme un ET par le moteur.Recherche avance : Cas Google

Recherche avance : Cas GoogleLa recherche avance permet de combiner les mots-cls et d'utiliser des filtres pour paramtrer les recherches.Combiner des mots-cls :La rubrique Pages contenant permet de combiner les mots-cls :avec les oprateurs ET (tous les mots suivants),OU (au moins un des mots suivants),SAUF (aucun des mots suivants), ... (cette expression exacte).Il suffit de placer les mots-cls voulus dans les espaces prvus...et Google saura retranscrire la bonne syntaxe.Utiliser les filtres : Limiter la recherche aux pages rdiges dans une langue donne (Langue), Limiter la recherche des rsultats un pays (Rgion).Recherche avance : Cas GoogleExclure ou au contraire privilgier un format de fichier spcifique : .doc, .xls,.pdf, .ppt (Format de fichier). Limiter la recherche une date (Date).Remarque : la date prise en compte est celle de l'entre de la page dans l'index de Google et non sa date de ralisation. Prciser le champ de la recherche : n'importe o dans la page, dans les titres, dans les URLs, dans le corps de la page ou les liens de la page (Emplacement). Exclure ou au contraire privilgier une extension de Nom de Domaine (Domaines).Rechercher des pages similaires (Similaires). Rechercher des pages lies une page (Liens).Effectuer des recherches sur un sujet prcis (Recherche de code source public).Une bonne requte Etre prcis et utiliser plusieurs mots pour affiner la recherche.Utiliser lordre du langage naturel.Savoir que Google renvoie des pages qui contiennent exactement les mots-cls recherchs.Google fait des propositions orthographiques.

Il ne cherche que le mot, pas sont pluriel ou les conjugaison.Les mta moteurs ou mta indexOutils cres plus rcemment que les prcdents, les mtamoteurs interrogent plusieurs outils de recherche.

Ils peuvent tre utiliss directement sur le web ou installs sur le poste client.

Les mtamoteurs permettent denvisager un travail de veille avec la gestion de profils et ltablissement de calendriers dexploration.UtilisationIls nont pas doutils en propre mais utilise ceux des autres.Moteurs, AnnuairesEncyclopdie, NewsgroupBases de donnes

Ils liment les doublons et affichent les rsultats par pertinence.

AvantagesUne recherche plus rapide que si on la faisait successivement dans tout les moteurs.

Une recherche plus exhaustive en raison dune plus grande couverture.

Un reprage des outils les plus fournis sur un sujet donn.InconvnientsMoins de filtrage car toutes les possibilits de chaque outil ne peuvent tre exploites simultanment.

Des recherches moins pointus.Etude de IxquickIxquick transforme la question pose dans la syntaxe de chaque outil interrog. Ixquick limine les doublons et donne les TOP 10 rsultant de chaque outil utilis.

On peut choisir de ne faire les recherches que sur certains outils.

Les rsultats sont affichs selon un critre de pertinence.Annuaires, Moteurs, MetaChoisir un annuaire : Il est utile pour trouver des sites rfrencs par des humains. Sur un thme donn, on ne trouvera pas seulement un site, mais en gnral toute une rubrique ddi cette thmatique.

Dans une recherche on utilise un annuaire : Se faire une ide des sites existants, dbuter une rechercheIdentifier prcisment et rapidement des sites de rfrence et ou dactualit sur un thme particulier.Reprer des ressources web invisibles.

Choisir un moteurLindex dun moteur se construit de manire automatique : les rsultats sont nettement plus nombreux, mais moins fiables.Faire une recherche pointue sur un sujet spcifiques

Retrouver rapidement une information pour laquelle vous disposez de mots-cls prcis.

Elargir la porte dune requte une grande partie du web.Choisir un mtaLes rsultats dpendent des partenariats tablis avec les autres outils.

Le mtamoteur permet dtablir un premier inventaire des informations dites de rfrence.SynthseCe que vous devez surtout retenir de ce chapitreIl existe diffrents types d'outils pour rechercher de l'information sur Internet :Les annuaires, qui recensent des sites manuellement et les classent par domaines thmatiques. Ils permettent une recherche par navigation dans lescatgories ou par mots-cls. Ces annuaires peuvent tre gnralistes (comme Open Directory Project) ou spcialiss.Les moteurs de recherche, qui indexent automatiquement le web et permettent une recherche par mots-cls. Ces moteurs peuvent tre gnralistes (comme Google et Exalead) ou spcialiss.Les mtamoteurs de recherche, qui interrogent simultanment plusieurs outils de recherche (comme Ixquick).Le choix de chacun de ces outils dpend troitement du type de recherche effectuer : l'annuaire est le plus pertinent pour dbuter la recherche ; le mta moteur permet de reprer des sites de rfrence ; enfin le moteur de recherche est privilgier pour une recherche pointue partir de mots-cls prcis.Dans tous les cas, il est recommand d'utiliser les possibilits de recherche avance des outils, qui permettent de prciser la recherche et de filtrer les rsultats.Les outils de recherche dimages, son et vidoLes volutions technologiques des outils de recherche permettent dsormais dindxer des documents multimdias de manire efficace.

Les outils collaboratifsIls sont susceptibles de transformer ou de complter votre manire deffectuer vos recherches.Ils appartiennent au concept Web 2.0

Notion de partage dinformationsFlickr, youtubeFacebook, NingDiggConnotea

Dcrypter une adresseUne URL est un format de nommage universelContient :

Le protocole (http)Le nom de domaine (relation IP nom)Le chemin daccs la ressourceNom de domaineCe sont les extensions de domaine qui fournissent le plus dinformations

Ils en existent deux sortent : Les thmatiques et les gographiques.