58
Initiation à Internet Module 2 Recherche efficace dans le Web L’@telier Espace Culture Multimédia. Médiathèque de Lorient 1 @telier – 2009

Initiation aux moteurs de recherche

Embed Size (px)

DESCRIPTION

Initiation aux moteurd de recherche

Citation preview

Initiation à Internet

Module 2Recherche efficace

dans le Web

L’@telier Espace Culture Multimédia.

Médiathèque de Lorient

1@telier – 2009

La recherche sur Internet

• Objectifs de la présentation :

– Découvrir les bases de la recherche sur Internet

– Utiliser les moteurs de recherche

2@telier – 2009

Pourquoi

• Soit on connaît l’adresse d’un site que l’on peut avoir trouvée dans un magazine, et on la tape directement dans la barre d'adresse du navigateur,

• soit on accède au site en question par l'intermédiaire d'un lien trouvé sur un autre site, en général au contenu proche on fait appel à un outil de recherche

3@telier – 2009

Définition : le moteur de recherche

 Selon le Journal Officiel Moteur de recherche :

• système d'exploitation de banque de données, et, par extension, serveur spécialisé permettant d'accéder sur la toile à des ressources (pages, sites, etc.) à partir de mots clés.

4@telier – 2009

Annuaire ou moteur de recherche

• Un annuaire, répertoire Internet est un site Web proposant une liste classée de sites web.

• Le classement se fait typiquement dans une arborescence de catégories, censée couvrir tout ou partie des centres d’intérêt des visiteurs.

• Chaque catégorie contient : des sous-catégories concernant des aspects plus pointus d’un sujet donné et des liens agrémentés d’une description.

• Ces liens sont des URL pointant vers les ressources relatives à la catégorie dans laquelle elles ont été classées.

5@telier – 2009

Moteur de recherche• De façon complémentaire aux annuaires, les moteurs de

recherche effectuent, un travail approfondi pour répertorier les pages à l'intérieur de ces sites.

• Un moteur de recherche sur le Web est constitué de "robots", spiders, crawlers ou agents qui parcourent les sites à intervalles réguliers et de façon automatique pour découvrir de nouvelles adresses (URL).

• Ils suivent les liens hypertextes (qui relient les pages les unes aux autres) rencontrés sur chaque page atteinte.

• Chaque page identifiée est alors indexée dans une base de données.

6@telier – 2009

• Le principe en est simple : le service indexe au préalable, c'est-à-dire stocke et traite sur ses propres disques durs, un certain nombre de pages web.

• Cette indexation s'effectue en texte intégral, tous les mots contenus dans toutes les pages référencées devenant alors des index potentiels de recherche

7@telier – 2009

Utiliser un moteur de recherche• Un moteur de recherche est un « robot » qui indexe les

pages Web en fonction de leur titre, de certains mots-clés ou de leur contenu complet, sans intelligence particulière.

• Il nous faut apprendre à effectuer des recherches efficaces afin de tirer le maximum de résultats pertinents et d'éviter les réponses redondantes ou peu concluantes.

• Le défi principal, lors de l'utilisation d'un moteur de recherche, repose sur le choix des mots-clés et de leur disposition.

8@telier – 2009

Un outil ou des outils de recherche

• Il existe des centaines de moteurs qui collectent, regroupent et présentent l’information de différentes manières.

• Par exemple, – « Google » range les résultats d’une recherche en fonction de

l’importance et de la pertinence des sites trouvés; – « Yahoo! » possède un répertoire qui permet des recherches

par thèmes; – « Kartoo » classe les différents sites trouvés à l’intérieur de

catégories sélectionnées à partir de mots ou de phrases contenus dans les résultats de leur recherche.

• Un moteur peut donc être mieux adapté qu’un autre à tel ou tel type de recherche.

9@telier – 2009

Pourquoi plusieurs moteurs?• Beaucoup de spécialistes conseillent d’utiliser plusieurs

moteurs, d’une part parce qu’ils offrent des services différents, d’autre part parce qu’aucun d’entre eux n’est capable à lui seul de répertorier au complet les millions de pages disponibles sur Internet.

• Ils affirment aussi que le meilleur moteur de recherche ne peut que scruter 16 % de l’ensemble de la Toile et que tous les moteurs réunis ne peuvent même pas sonder 50 % des contenus existants.

10@telier – 2009

11@telier – 2009

12@telier – 2009

13@telier – 2009

14@telier – 2009

Un méta moteur français

15@telier – 2009

Comment ça marche ?

•    Les descriptions des pages et les mot-clés contenus dans ces pages, quand elles sont présentes, ne sont pas visibles par l'internaute. Ce sont des informations cachés, introduites dans le code HTML de la page par l'auteur de la page, et uniquement destinées pour leur indexation par les moteurs de recherches.

• Dans l'exemple qui suit, on retrouve le titre, les mot-clés (Keywords), et la description d’une page d'accueil du site

16@telier – 2009

Codes sources d’un page : le moteur collecte les mots-clés permettant son indexation

• Déportation et camps </title> <!-- #EndEditable --> <meta NAME="Description" CONTENT="Mémoire Net est consacré à la mémoire locale lié à la 2eme guerre mondiale, à la Résistance et à la déportation dans le Rhône sur les cantons de Mornant et Givors. Témoignages d'Anciens Combattants et Déportés."> <meta name="keywords" content="Résistance, déportation, déportés, deportes, deportation, resistance, mémoire, locale, patrimoine, cmap, extermination,1939 -1944 -1945,Mémoire, terezin, lidice, lyon, rhône-alpes,Givors, Résistance, resistance, deportes, maquis, résistants, camps, mauthausen, auschwitz, ravensbruxk, extermination, antisémitisme, guerre, combat, mornant, givors, bombardements,Déportation, Auschwitz, Terezin, Forces Françaises Libres, FFI, maquis, maquisards, résistants, déportés, antisémitisme, juifs, mauthausen, buchenwald, auschwitz, ravensbrück, spahis, France, mémoire, déportation, Resistance, Memoire, Deportation, Déportation, éducation, histoire,2ème guerre, Concours scolaire, camps, extermination, guerre, XX eme sicle, Mémoire Net, memoire net, Mornant, Rhône, concours résistance, maquis, extermination, pologne, allemand, guerre, xx siècle, memoire, locale, patrimoine, camp, résistance, déportation, france"> <meta NAME="Robots" CONTENT="index, follow, all, NOARCHIVE"> <meta NAME="Author" CONTENT="Evelyne Py"> <meta NAME="Identifier-URL" CONTENT="http://www.memoire-net.org"> <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1"> <link rel="stylesheet" href="stylemem.css" type="text/css"> <style> BODY

17@telier – 2009

• Le moteur va rechercher les occurrences de ces mots dans les pages sources et affiche ensuite celles qui lui semblent les plus pertinentes (selon un algorithme de classement qui lui est propre).

L'utilisateur dans la pratique saisit des mots clés

18@telier – 2009

Donc, quel outil pour quelle recherche ?

• Les portails généralistes ou thématiques 

...quand la recherche est ciblée sur un domaine :

– Exemples : – pour la Bretagne : breizhoo – sur les questions administratives : service-public.fr– pour le cinéma : Internet Movie Database en anglais

19@telier – 2009

Quel outil pour quelle recherche ?

• On peut aussi trouver des informations sur les

• Encyclopédies gratuites et les dictionnaires :

– l'encyclopédie coopérative Wikipedia 

– le quid

20@telier – 2009

Quel outil pour quelle recherche ?

• Les annuaires et moteurs de recherche Le site de référence est «  abondance  »

dans la description des principaux annuaires et moteurs de recherche ( http://www.abondance.com/)

Exemples d’annuaires : breizhoo ,nomade , babygo (pour les enfants )

21@telier – 2009

Quel outil pour quelle recherche ?

– les moteurs : l'indexation est automatique, les moteurs parcourent les pages du web régulièrement => google, google scholar, exalead

– les métamoteurs utilisent plusieurs moteurs de recherche => kartoo ,clusty , webcrawler, ixquick

pour en savoir plus : allez sur la page du site intelligence

center (http://c.asselin.free.fr/french/metamoteurs.htm )

22@telier – 2009

Quel outil pour quelle recherche ?

• Globalement

–  quand on veut explorer un sujet il vaut mieux utiliser les thèmes et sous-thèmes d'un annuaire, utiliser les encyclopédies... et les rayons des bibliothèques

– quand on a une question très précise on peut utiliser les moteurs de recherche ou les métamoteurs (en rédigeant bien sa requête).

23@telier – 2009

Méthodologie de recherche

Une recherche efficace dans le Web

24@telier – 2009

Règles de saisie :•  formuler un ensemble de mots précis• Les moteur de recherches ne reconnaissent pas le langage naturel.

Ils fonctionnent par mots clés

• => comparer mediatheque lorient et lorient mediatheque dans un moteur de recherche

( selon la position du terme l’axe de recherche est différent )

• la casse (minuscule majuscule) pour certains outils il n'y a pas de différence et pour d'autres non – => tapez ibm ou IBM (sur google, exalead)

25@telier – 2009

Règles de saisie

•  les accents pour certains outils il n'y a pas de différences et pour d'autres ouitapez bébé (sur google, exalead,clusty ) vous

trouverez des résultats contenant bébé bébe bebe bebé

• Nota : pour faire une recherche dans la page Ctrl + F (sur Mozilla Firefox ou sur Internet Eplorer) … ça permet de gagner du temps !

26@telier – 2009

Une recherche avancée

•  Les opérateurs booléens :

– ET AND : les sites contiennent les deux termes

– OU OR : les sites contiennent l'un ou l'autre des termes – SAUF AND NOT : les sites contiennent le premier terme et pas le

2ème – PRES NEAR : les sites contenant les termes rapprochés

• Les moteurs proposent des modules de recherche avancé :– pour google : c'est une page accessible ici

– pour exalead il faut ouvrir une petite fenêtre

27@telier – 2009

Signes mathématiques et recherche d'une expression

• Vous pouvez utiliser le signe + dans une requête pour indiquer que vous souhaitez faire figurer le mot clé dans la recherche.

• De même, utilisez le signe - pour exclure un terme de la recherche.

• On utilise les guillemets "..." pour rechercher une expression.

28@telier – 2009

29@telier – 2009

Choisir parmi les résultats

• Filtrer ses résultats avec google :– se limiter aux pages francophones, aux pages

France : cocher le point qui convient

– filtrer les résultats : aller sur google préférences : "la fonction SafeSearch interdit m'affichage dans les résultats de pages Web à contenu sexuellement explicite".

30@telier – 2009

Choisir parmi les résultats • Sur la liste, les noms de domaine d'un site se termine

par un .fr un .com.• Ces extensions peuvent donner des indications

– géographiques : • .fr : site français• .ca : site canadien• .be : site belge• .ch : site suisse 

 – de domaine d'activité (mais ce n'est pas une règle exacte) 

• .com : commercial, communication• .org : associatif, à but non lucratif• .edu : éducation 

31@telier – 2009

32@telier – 2009

Cas pratique• Vous cherchez des

informations sur Charlotte Gainsbourg mais pas sur son père Serge Gainsbourg.

• Tapez Gainsbourg AND NOT Serge.

• Vous aurez tous les sites dans lesquels apparaît le mot Gainsbourg mais pas ceux qui parlent de Serge.

33@telier – 2009

Comment préciser sa recherche

34@telier – 2009

Dans Google, l’usage de l’outil recherche avancée

35@telier – 2009

Autres outils Google

36@telier – 2009

Conseil No 1

• Utilisez de six à huit mots-clés, de préférence des noms.

• La plupart des internautes n’utilisent qu’un ou deux mots, trop peu pour une recherche efficace.

• Évitez les verbes et utilisez des adjectifs ou autres mots s’ils contribuent à mieux définir un nom. Par exemple, tapez « fromage feta » plutôt que simplement « fromage ».

37@telier – 2009

Conseil No 2

• Réunissez plusieurs mots-clés à l’intérieur de guillemets pour en faire une phrase, comme « système solaire ».

• La plupart des moteurs de recherche traiteront l’expression au complet et non chaque mot séparément, système et solaire.

38@telier – 2009

« entre guillemets »

Moteurs de recherchePuis

« Moteurs de recherche » ( c’est-à-dire : l’expression entre guillemets )

***Y a-t-il une différence dans les résultats?

39@telier – 2009

Conseil No 3

• La plupart des moteurs de recherche ne font pas la distinction entre majuscules et minuscules.

• Pour les recherches générales, il est toutefois préférable d'utiliser des lettres minuscules.

• Tous les moteurs de recherche ne traitent pas les signes de ponctuation de la même façon.

40@telier – 2009

Conseil No 4• « and » ou « + » entre deux mots-clés signifient :

« Je veux seulement les documents qui contiennent ces deux mots ou tous les mots. »

• « or » entre deux mots-clés signifie : « Je veux les documents qui contiennent l’un de ces deux mots, peu importe lequel. »

• « not » ou « - » signifient : « Je veux les documents qui contiennent le premier mot, à condition qu’ils ne contiennent pas le second. » Exemple : « adolescents and not sexe ». L’expression « and not » ne s’applique qu’au mot ou à la phrase qui suit immédiatement.

41@telier – 2009

Conseil No 5

• Une fois l’information trouvée, vérifiez son exactitude en consultant au moins trois autres sites indépendants qui devraient la confirmer.

• On appelle cela la méthode du triangle.

42@telier – 2009

Quelques moteurs populaires et performants:

google.fr

search.yahoo.com

exalead.fr

43@telier – 2009

Autres petits détails

• Éliminez tous les pronoms (elle, quel), que les moteurs de recherche considèrent redondants.

• Retenez 6 à 8 mots (maximum recommandé). En moyenne, la plupart des utilisateurs soumettent 1,5 mot, ce qui n'est pas suffisant.

• Essayez d'éviter les verbes d'action et n'utilisez des adjectifs que s'ils aident à définir l'objet de votre recherche (comme dans planète bleue).

44@telier – 2009

define

Dans une recherche avec Google, l’utilisation de define: placé juste avant un mot ordonne de rechercher les sites contenant une définition du mot, ainsi que l’adresse du lien Internet où se trouve cette définition.

45@telier – 2009

filetype

1. Moteurs de recherche filetype:ppt2. Moteurs de recherche filetype:pdf3. Moteurs de recherche filetype:doc

L’utilisation de l’opérateur filetype:suivi d’un type de format limite les résultats aux adresses Internet contenant un document dans le format précisé

46@telier – 2009

related

1. related:mediatheque.lorient.fr2. related:www.lorient.fr

L’opérateur related: peut être très utile lorsque l’on a trouvé un site pertinent à notre requête et qu’on souhaite en trouver d’autres semblables.    

47@telier – 2009

allintitle

1. allintitle:pédagogie2. allintitle:éducation

3. allintitle:apprentissage

Google restreint les résultats aux sites dont le titre contient les

termes inscrits.   

48@telier – 2009

fonction calculatrice intégrée

1. 2 * 5 - 42. 28 * 5 / 10 + 2

Si vous souhaitez utiliser la fonction calculatrice intégrée de Google, il vous suffit d’entrer la formule que vous désirez exécuter dans le champ de recherche, appuyer sur la touche Entrée ou cliquer sur le bouton Recherche Google. La calculatrice peut exécuter des formules mathématiques en arithmétique simple (5+2*2 ou 2^20) ou plus compliquées (e^(i pi)+1)    

49@telier – 2009

Recevoir l’information tranquillement

Les alertes Google

50@telier – 2009

Les Alertes Google sont envoyées par courrier électronique quand des articles publiés en ligne correspondent aux sujets que vous indiquez.

http://www.google.fr/alerts

51@telier – 2009

Créer une alerte

-Actualités-Web-Tous les types-Groupes

-une fois par jour-selon l’actualité-une fois par semaine

52@telier – 2009

Résultat

53@telier – 2009

Gérer ses alertes

54@telier – 2009

Bonne recherche!

En conclusion.

•Les moteurs sont des outils (grande différence avec les annuaires et leur coté humain) qui assistées par des robots scrutent le contenu du web à la recherche de pages nouvelles. Le contenu des pages est analysé et stocké dans de larges indexes.

•Mais, aucun des moteurs (ni même des annuaires) necouvre la totalité du web, mais beaucoup offrent des indexes très larges.

55@telier – 2009

Petits exercices

• Exercice sur google,

– trouvez le titre de la chanson qui contient les paroles Chérie je t'aime, chérie je t'adore ,

– comparer les premiers résultats avec : chateau de versailles et "chateau de versailles"

– New York et "New York

56@telier – 2009

Exemples pratiques :

• Rechercher le peintre Millet et son tableau l'Angelus (sur google, exalead)– 1er essai avec Millet => nombre de pages trouvées ? – 2e essai : recherche en France seulement : nombre de pages trouvées ?

• Regarder la première page trouvée, est-elle pertinente ?

57@telier – 2009

Exemples pratiques (2)– 3e essai :  Jean-François Millet => nombre de pages trouvées ? – 4e essai Angelus => nombre de pages trouvées ? – 5e essai Angelus Millet => nombre de pages trouvées ? – Autre approche : peinture angelus Millet

*************• "Googliser quelqu'un" écrire votre nom avec et sans les

«  » sur google, exalead , est-ce bien vous dans les réponses ? 

58@telier – 2009