117
Recherche d’Informations sur Internet Réaliser par Mr VERBERT, professeur de SVT avec la participation de Mr LEBON, responsable « Informatique et réseau », Lycée La Malassise Longuenesse

Recherche d’Informations sur Internet

  • Upload
    sanaa

  • View
    26

  • Download
    3

Embed Size (px)

DESCRIPTION

Recherche d’Informations sur Internet. Réaliser par Mr VERBERT, professeur de SVT avec la participation de Mr LEBON, responsable « Informatique et réseau », Lycée La Malassise Longuenesse. Problématique. “Comment trouver facilement et efficacement l’information sur Internet”. - PowerPoint PPT Presentation

Citation preview

Page 1: Recherche d’Informations sur Internet

Recherche d’Informations sur Internet

Réaliser par Mr VERBERT, professeur de SVT avec la participation de Mr LEBON, responsable « Informatique et réseau », Lycée La Malassise Longuenesse

Page 2: Recherche d’Informations sur Internet

Problématique

“Comment trouver facilement et efficacement l’information sur

Internet”

Page 3: Recherche d’Informations sur Internet

Organisation de la présentation

• Introduction• Sources d’Informations• Les opérateurs logiques• Annuaires de recherche thématique• Moteurs de recherche• Métamoteur • Création d’une fiche ressource• Impression partielle d’un site

Page 4: Recherche d’Informations sur Internet

Le contexte• Internet équivalent à une bibliothèque dans laquelle, sans

l'utilisation de repères et sans aide, il serait difficile de se retrouver devant le gisement des informations.

• Les premiers systèmes de recherche :– Veronica (Very Easy Redent Oriented Net-wide Index to

Computerized Archives).– Recherche dans les titres– Wais : outil de recherche texte intégral

• Réservé au monde clos des Universités

• En 1997 : il existe plus de 100 millions de pages naissance des services Yahoo!, Infoseek, Altavista. Financés par la publicité.

Page 5: Recherche d’Informations sur Internet

Le contexte• La concurrence des services oblige l'utilisateur à formuler sa requête

différemment. Importance de l'aide en ligne.Les utilisateurs oublient cela et ne tapent que 1 ou 2 mots clés. Cela peut entraîner plus de 100.000 documents en réponse.

• Ce qui est demandé à un moteur n'est pas de donner l'exhaustivité sur 1 sujet mais plutôt les documents intéressants répondant à une problématique intelligence artificielle.

• Un outil de recherche n'est pas réservé au web, il permet aussi de rechercher :

• email• Forums de discussion• Logiciels, ...

Page 6: Recherche d’Informations sur Internet

Document Internet

• Une page sur Internet = un document HTML (HyperText Markup Language– Longueur non définie– Son nom : document.html ou document.htm– Adresse (URL)

http://www.serveur.fr/Repertoire/SousRepertoires/Document.html

La page "document.html" se trouve sur une machine dont le nom est www.serveur.fr et sur cet ordinateur, la page se trouve dans le dossier sous répertoire lui même dans le dossier répertoire.

• Si le serveur ne trouve pas le document, il renvoie une erreur 404 : Not found, Page not found, Document not found.– Ex : http://www.adit.fr/Produits/TF/tf.html– On peut tenter de la retrouver par le sous répertoire.

www.serveur.fr

Page 7: Recherche d’Informations sur Internet

Rappels sur la première partie d'une adresse

http://www.serveur.fr• http://

Hypertext Transfer Protocol : protocole utilisé pour l’échange de pages entre un serveur et le logiciel de navigation

• www nom de l'ordinateur (pas obligatoire)ex : perso.wanadoo.fr…

• serveurnom de l'organisme propriétaire de la machine

• Domaine 2 lettres (géographique)3 lettres (type d'établissement)

• Important : Un serveur peut héberger plusieurs services (sites).

Page 8: Recherche d’Informations sur Internet

Quelques grands concepts• Parfois, les médias, à tort, donnent l'impression que l'on peut tout trouver

sur InternetC'est faux.

• On peut perdre énormément de temps à rechercher une information. Il faut savoir décrocher si on ne trouve pas. Ne pas s'entêter.

• Ne pas prendre pour argent comptant une information trouvée sur Internet. Il faut, quand cela est possible, vérifier la source des informations.– Rappels : tout utilisateur peut dispenser de l'information sur le Net.

• De manière générale, l'info est gratuite car rémunérée par de la publicité. • Ne pas oublier que l'information peut être trouvée par d'autres moyens que

la recherche, par les listes de diffusion ou forums de discussions.• Le "push" offre le moyen de se tenir informé selon un modèle prédéfini

configuré au préalable.

Page 9: Recherche d’Informations sur Internet

Un constat sur la pratique de la recherche

- 90 % se contentent des recherches les plus élémentaires (un ou deux mots clés).

- Des services très utiles de FAQ (Foire aux Questions), listes d'email, forums, sont méconnus des utilisateurs.

Page 10: Recherche d’Informations sur Internet

Les sources d’informations

• les sites officiels des entreprises/organismes• Sites de références. On les trouve souvent par les moteurs

thématiques• Les pages bénévoles

• Attention, vérifier la fiabilité des informations

• Avantage : on peut profiter du travail de recherche effectué par un passionné

• Les laboratoires de recherche/universités• Thèses, travaux des étudiants.

Page 11: Recherche d’Informations sur Internet

Les sources d’informations

• Les bibliothèques :• Ex : www.bnf.fr (Opale-BN)• Plus de 200 millions de références

• Les sites gouvernementaux et institutionnels• ex : Ministère des Finances, de l'Industrie, etc…

• Les banques de données• Les organismes de presse

• Gratuits. Financés par de la publicité.• Ex : www.globeonline.fr

Page 12: Recherche d’Informations sur Internet

Les opérateurs logiques

Page 13: Recherche d’Informations sur Internet

Les opérateurs logiques

• Opérateurs logiques (booléens)– ET (AND)– OU (OR)– SAUF (NOT)

• Opérateurs de troncatures– *, ?,…

• Opérateurs de proximité– Proche (NEAR)

Page 14: Recherche d’Informations sur Internet

Logique Booléenne 1/6

• ET (AND) - + - Intersection - “tous les mots (all)”

légume ET rond

Page 15: Recherche d’Informations sur Internet

Logique Booléenne 2/6

• ET (AND) - Intersection - “tous les mots (all)”

légume ET rond ET rouge

Page 16: Recherche d’Informations sur Internet

Logique Booléenne 3/6

• OU (OR) - {espace} - Réunion - “un des mots (any)”

légume OU rond

Page 17: Recherche d’Informations sur Internet

Logique Booléenne 4/6

• OU (OR) - Réunion - “un des mots (any)”

légume OU rond OU rouge

Page 18: Recherche d’Informations sur Internet

Logique Booléenne 5/6

• Combinaison de ET et de OU

Légume ET (rond OU rouge)

Page 19: Recherche d’Informations sur Internet

Logique Booléenne 6/6

• Combinaison de ET et de OU

(Légume ET rond) OU rouge

Page 20: Recherche d’Informations sur Internet

Les Annuaires de recherche par thèmes

Page 21: Recherche d’Informations sur Internet

Principe de l’annuaire

• Nés en 1993• Il propose une recherche :

- géographique- thématique- par mots clés

• On peut les assimiler à des pages jaunes mises à jour en permanence.

• Il propose un thesaurus interactif. Il va d'un thème le plus général vers le plus précis pour fournir à la fin une liste de sites.

• Exemple : faisons une recherche dans un annuaire

Page 22: Recherche d’Informations sur Internet

Yahoo! (Yet Another Hierarchical Officious Oracle)

• Pour la petite histoire : – date de création : avril 1994 par deux

étudiants de l'Université de Stanford– en 1997 :

• 600.000 sites référencés• 38 millions de requêtes par jour• Ligne d'accès : 45 Mbps

Page 23: Recherche d’Informations sur Internet
Page 24: Recherche d’Informations sur Internet

Yahoo! légende

des informations actualisées heure par heure sont mises à disposition par l'agence de presse Reuter

un des meilleurs sites dans sa catégorieNouveau !Critique du site dans ZDNetrubrique présente dans plusieurs

thèmes

[xtra!]

@

Page 25: Recherche d’Informations sur Internet

Yahoo! légende

• Nombre de sites répertoriés.• liste des sites non réalisés par

Yahoo!• Hiérarchie de la catégorie• actualité par rapport à cette

catégorie.

(113)

Indices

Sub category listing

Yahoo! Net events

Page 26: Recherche d’Informations sur Internet

Yahoo! Recherche par mots clés

• Ces recherches ne s'effectuent pas dans le texte intégral de la page mais par rapport aux indications enregistrées par l'auteur du site :

• le titre

• l'adresse

• deux lignes de commentaires

• noms des catégories choisies

• Lorsqu'il ne trouve pas, Yahoo! propose un résultat provenant du moteur d'Inktomi.

Page 27: Recherche d’Informations sur Internet

Yahoo! Exemple

• mot-clé : finance

• Catégories :– Présente toutes les rubriques où figure la requête.

• Site web : – Propose la liste des sites web où figure la requête

• Autres pages :– Réponse à la requête par Inktomi

• Dépêches d'actualité :– Actualité concernant la requête

Page 28: Recherche d’Informations sur Internet

Yahoo! Classement

• Une fois les mots clés saisis, Yahoo! recherche les occurrences des mots indiqués.

• Son classement :- Nombre d'occurrences des mots trouvées

par Yahoo!- Si les mots sont présents dans la liste- Mieux classés si parmi les 14 grandes

catégories

Page 29: Recherche d’Informations sur Internet

Yahoo! Recherche plus affinée

• Le « ET » est symbolisé par le signe « + »– Exemple 1 : +veille +technologique

Présence obligatoire des deux mots dans la recherche

– Exemple 2 : veille technologiqueRecherche des sites contenant l'un des deux mots

• Important : veille +technologique est différent de +veille +technologique

Dans le premier cas, recherche obligatoire de "technologique" et éventuellement "veille"

Page 30: Recherche d’Informations sur Internet

Yahoo! Recherche plus affinée

• Le « sauf » est symbolisé par le signe « - »– exemple : +ordinateur +multimédia –apple

• Recherche sur une chaîne de caractères– exemple : "virus informatique"

Cherche les deux mots placés l'un à côté de l'autre

Page 31: Recherche d’Informations sur Internet

Yahoo! Recherche plus affinée• Le joker est symbolisé par le signe « * »

– Sans joker : recherche exacte du mot– Avec joker : recherche la correspondance exacte d'un début

de mot suivi de tout ce qui se trouve d'autre commençant par d'autres lettres• Exemple :

– Recherche avec Cap* : » Cap» Capitaine» Capital» …

• Important : Le joker se trouve toujours à la fin, jamais au début ou au milieu d'un mot.

Page 32: Recherche d’Informations sur Internet

Yahoo! Restreindre la recherche

• Option t : • recherche dans le titre uniquement

• Option u: • recherche dans l'URL

• exemple 1 :t:Boulogne

• exemple 2 :u:ports

Page 33: Recherche d’Informations sur Internet

Yahoo! Restreindre la recherche

• On peut mixer à loisir les options de recherche. – Exemple : +t:ordinateur +PC –apple

Page 34: Recherche d’Informations sur Internet

Yahoo! Options avancées

Page 35: Recherche d’Informations sur Internet

Autres annuaires thématiques• International :

– Yahoo ! International– Snap– Open Directory– Looksmart

• France– Yahoo ! France– Nomade

Page 36: Recherche d’Informations sur Internet

Moteurs de recherche par mots clés

Page 37: Recherche d’Informations sur Internet

Présentation• La démarche logique d'un internaute qui

recherche l'information est d'entrer une suite de mots clés.

• Un moteur de recherche indexe le texte intégral d'un site.

• L'utilisateur entrera une série de mots clés reliée par des opérateurs logiques. Le moteur ira chercher les occurrences de ces mots dans les pages sources et affichera le résultat des pages qui lui semble les plus pertinentes.

Page 38: Recherche d’Informations sur Internet

Indexation des pages

Il existe deux façons d'indexer les pages dans un moteur de recherche : – par le responsable du site : déclaration volontaire– par le robot du moteur (spiders, crawlers, agents)

qui parcourt automatiquement le Web en naviguant à travers les liens hypertextes.

Important : La page ne sera pas indexée si d'autres sites Web n'y font pas référence

ALTAVISTA GOOGLE HOTBOT

Page 39: Recherche d’Informations sur Internet

Lien 1Lien 2Lien 3

Lien 1Lien 2Lien 3

Lien 1Lien 2Lien 3

Lien 1Lien 2Lien 3

Page principale

Page 1 Page 3Page 2

Page 40: Recherche d’Informations sur Internet

Périodicité de scrutationUn robot fait le tour de tous les sites en 10 à 20

jours.Robot

Site web moteur de recherche

Serveur d’index

Page 41: Recherche d’Informations sur Internet

Limites d’un serveur

• La fréquence d'actualisation étant longue, la recherche d'informations n'est pas valable sur des sites qui changent tous les jours. Exemple : la Presse.

• L'indexation ne concerne que les pages statiques, pas celles générées par une base de données. Exemple : base de données du site "Le Monde".

• Il est possible, pour le concepteur des pages, d'indiquer dans celles-ci qu'il ne souhaite pas figurer dans tel ou tel moteur de recherche. Ceci est assez anecdotique car ce n'est pas dans le principe du Web, sauf pages à usage privée ou pages en cours de création.

Page 42: Recherche d’Informations sur Internet

ALTAVISTA

http://www.altavista.com/

http://www.av.com/

http://altavista.digital.com/

Retour

Page 43: Recherche d’Informations sur Internet

AV Pour la petite histoire...• fin 1997, Altavista annonce 100 millions de pages

indexées• 10 millions de requêtes par jour• La puissance totale du système Altavista correspond à

375 PC haut de gamme mis en réseau• La connexion à Internet s'établit sur une ligne à 100Mbps• Le robot indexe 10 millions de pages par jour • 2000 sites majeurs (parmi les plus populaires) sont

scrutés tous les jours• Le service a depuis été décliné en plusieurs points du

monde.

Page 44: Recherche d’Informations sur Internet

Recherches simples sur AltaVista

• Les recherches peuvent s'effectuer :– sur le Web– les actualités– dans les forums de discussions– les produits

• Un menu déroulant offre le choix de la langue• Le lancement d'une recherche affiche le résultat

suivant :

Page 45: Recherche d’Informations sur Internet
Page 46: Recherche d’Informations sur Internet

AV : Résultat d’une recherche

• En haut de page :Il est indiqué le nombre de pages correspondant

à la requête.

Page 47: Recherche d’Informations sur Internet

AV : Résultat d’une recherche

En bas de page :• Est indiqué le nombre de fois où Altavista a

trouvé chacun des mots dans ses pages.• Des chiffres de 1 à 20 permettent de circuler

dans chaque groupe de 10 réponses.• [next>>] : permet d'obtenir les groupes de

réponses suivantes.

Page 48: Recherche d’Informations sur Internet

Classement des pages

• Critères retenus :- présence de tous les mots dans la requête- présence des mots recherchés au début du

document (dans le titre), plutôt qu'à la fin- proximité des mots dans le document- rareté des termes demandés dans la base

des documentsexemple : le mot "caniche" aura un poids plus

élevé que le mot "chien".

Page 49: Recherche d’Informations sur Internet

Classement des pages

• Le nombre d'occurrences d'un mot ne joue aucun rôle dans le classement d'une page. Exemple : 20 fois le mot "Boulogne" dans une page donnera le même score qu'une seule fois.

• L'affichage du résultat se fait dans l'ordre décroissant de pertinence.

Page 50: Recherche d’Informations sur Internet

Mode d'interrogation

• Mot clé : correspond à une suite de lettres ou chiffres séparés par un espace ou tout caractère non alphabétique (&, %,$, /,…).

• Les signes de ponctuation ne sont pas indexés.• on peut interroger Altavista en langage clair mais il vaut mieux

utiliser les fonctionnalités que nous allons voir plus loin.• Les minuscules et les majuscules ont leur importance

– Exemple 1 : si vous tapez "boulogne"Altavista cherchera les mots :

– boulogne– Boulogne– BOULOGNE

– Exemple 2 : si vous tapez "Boulogne”Altavista cherchera uniquement le mot "Boulogne”

Il est donc recommandé de taper les mots clés en minuscules afin de ne fermer aucune porte.

Page 51: Recherche d’Informations sur Internet

Mode d'interrogation

• Les accents sont traités à part entière, c'est-à-dire qu'Altavista fait la distinction entre "peche" et "pêche"

• Un joker "*" peut être utilisé pour remplacer une lettre ou une série de lettres.– Exemple 1 : boul* :

• boule• boulogne• boulet• …

– Exemple 2 : alumi*m :• aluminum• aluminium

– Le caractère "*" doit être placé à au moins 3 caractères du début du mot.

– Il remplace de 0 à 5 lettres, et uniquement en minuscules.

Page 52: Recherche d’Informations sur Internet

Format d'interrogation

• Mots adjacents :– Exemple : "traitement du poisson »

Dans ce cas, les mots seront trouvés dans la page : "Boulogne sur Mer, premier centre européen pour le traitement du poisson" mais ne seront pas trouvés dans la page : "à Boulogne, des entreprises sont spécialisées dans le traitement des produits de la mer…… les poissons sont commercialisés à la criée de Boulogne".

• Opérateurs Booléens (ET, OU, SAUF)– Si les mots clés sont séparés par des espaces, Altavista place un

"OU" implicitement.• Exemple : Port Boulogne

Altavista cherchera les pages contenant le mot "Port" ou le mot "Boulogne" ou les deux.

– Les pages avec les deux mots clés seront en général placées en premier.

Page 53: Recherche d’Informations sur Internet

Recherches spécifiques

Altavista permet de rechercher sur certaines parties du document indexé. Les options doivent obligatoirement être tapées en minuscules.– “title:" recherche dans le titre du document– "domain:"

exemple : domain:eduCette option est intéressante pour des recherches sur les domaines (edu,

gov, mil)Par contre, cela ne présente pas d'intérêt pour les domaines (com, net, org)Pour une recherche par pays (fr), il vaut mieux la faire par une recherche

linguistique

– "host:" : présente les pages d'un site figurant dans la base de données d'Altavista

exemple :host:portboulogne.com

Page 54: Recherche d’Informations sur Internet

Recherches spécifiques

– "url:" : recherche l'expression dans l'url et pas uniquement dans le nom du site comme "host:".

– "text:" : recherche uniquement dans le texte de la page. Option fortement conseillée pour obtenir de meilleurs résultats.

– "anchor:" : recherche d'un texte faisant partie d'un lien hypertext.Exemple : découvrez le site du port de Boulogne

– "link:" : recherche les pages faisant référence au lien indiqué.Exemple : link:portboulogne.com

liste de toutes les pages ayant un lien vers le site du port de Boulogne.

– "images:" : recherche d'une image sur Internet.Exemple : images:clinton.jpg

– "applet:" : permet de rechercher des applets java.

Cette option est plutôt réservée aux programmeurs.

Page 55: Recherche d’Informations sur Internet

Recherche avancée (Advanced Search)

• Permet d'ajouter des parenthèses aux opérateurs booléens.

• Opérateurs booléens reconnus : - AND- OR- NEAR- NOT

• Ils peuvent être écrits en majuscules ou en minuscules• Les opérateurs peuvent être remplacés par des symboles

:– and &– or |– near ~– not !

Page 56: Recherche d’Informations sur Internet

Recherche avancée (Advanced Search)

• Si un mot recherché correspond à un opérateur, il faut le taper entre guillemetsExemple : ruée AND "or"

• NEAR : mots proches distants de 8 mots maximum.• PARENTHESES :

– Sans parenthèse : mot1 OR mot2 AND mot3Recherche du mot 1 ou les mots 2 et 3, ou les 3 mots

– Avec parenthèses :L ’exemple précédent est équivalent à :

mot1 OR (mot2 AND mot3)

Par contre : (mot1 OR mot2) AND mot3Altavista recherchera le mot 1 et le mot 3 ou bien le mot 2 et le

mot 3

Page 57: Recherche d’Informations sur Internet

Recherche avancée (Advanced Search)

• On peut utiliser des imbrications de parenthèses mais attention à conserver la compréhension de la requête.Exemple : ((mot1 NEAR mot2) AND (mot3 OR mot4) OR (mot4 AND

mot1)) AND NOT (mot1 NEAR mot4).

Page 58: Recherche d’Informations sur Internet

Recherche avancée (Advanced Search)

• Boolean query : permet d'écrire la requête booléenne.

• Sort by : permet d'obtenir un affichage selon le mot choisi.Exemple : Boolean query : (port OR pêche) AND boulogneSi boulogne figure dans le champ "sort by", le tri se fera en affichant

uniquement les documents où figure le mot "Boulogne".La fenêtre du haut sert à trouver les documents, le champ "sort by" à les classer.De même, vous pouvez aussi entrer : fenêtre du haut : (port OR pêche) NEAR

boulogne "sort by" = entreprise*

Page 59: Recherche d’Informations sur Internet

Google

http://www.google.fr

Retour

Page 60: Recherche d’Informations sur Internet

Google : un moteur de recherche intuitif

-L’intérêt de google réside dans le fait que google présente différentes catégories :

-Recherche sur le web entier ou restreint aux sites français-Recherche d’image-Groupe de discussion par thème-Répertoires thématiques (médecines, économie …)

-- Option intéressante “J’ai de la chance” qui permet une connexion directe au premier site qui est censé être le plus approprié

Retour

Page 61: Recherche d’Informations sur Internet

HOTBOT

http://www.hotbot.com

Retour

Page 62: Recherche d’Informations sur Internet

Son historique...

• Mise en œuvre par le magazine américain "wired", ce service a depuis été racheté par Lycos.

• Annoncé comme le challenger d'Altavista• Basé sur la technologie de la société Inktomi

(considéré comme grossiste en url)• Aujourd'hui, c'est l'un des meilleurs outils de

recherche • Taille d'index équivalent à Altavista : 110

millions de pages

Page 63: Recherche d’Informations sur Internet

Classement des documents

• Nombre d'occurrences des mots dans le document

• Présence des mots dans le titre• Présence des mots parmi les mots clés

figurant dans l'en-tête du document• Taille du document : plus c'est court

mieux c'est.• Respect de la netiquette : les tentatives

de "spam" conduisent à un mauvais classement de la page

Page 64: Recherche d’Informations sur Internet

Format des mots clés

• La saisie des mots en majuscules ou minuscules n'influera pas sur le résultat, sauf pour certains mots, par exemple : NeXT

• Comme Altavista, hotbot fait la distinction entre les mots avec et sans accent.

Page 65: Recherche d’Informations sur Internet

Recherche simple :En fonction des mots entrés dans le champ, "Search

Smarter" offre à l'utilisateur les options suivantes :– "Look for" :

• "all the word" : correspond à un ET (par défaut)D'habitude, c'est généralement le "OU" par défaut dans d'autres moteurs

• "Any of the word" : certains mots (OU)• "exact phrase" : correspond aux guillemets (adjacence)• "the page title" : mots présents dans le titre• "links to this URL" : liste des liens vers cet URL (équivalent à "link:"

d'Altavista)– exemple : http://www.netinfo.fr

• "Boolean phrase" : à utiliser si des opérateurs logiques sont entrés dans le champ

– "date" : restreint la recherche à une période.

– "Language" : langue de la page

Page 66: Recherche d’Informations sur Internet

Recherche simple

– "page must include" : les pages doivent proposer :– image– vidéo– mp3– javascript

– "Return result" : – nombre des réponses par page– .type de descriptions :

complète brève uniquement les url

Page 67: Recherche d’Informations sur Internet

Résultat d'une recherche

• Classement dans l'ordre décroissant de pertinence

• Chaque réponse comporte :– titre de la page– descriptif– date de mise à jour– url– option de restriction à tous les liens du site

Page 68: Recherche d’Informations sur Internet

Syntaxe avancéeLa recherche simple correspond à quasiment

l'ensemble des demandesSyntaxe des opérateurs reconnus :

– "+" ET– "-" sauf– "*" joker (troncature)– Les guillemets peuvent être utilisés pour rechercher

une expression exacte ou l'adjacence de mots.– Hotbot permet l'utilisation des opérateurs booléens

AND, OR, NOT, et l'usage des parenthèses.

Page 69: Recherche d’Informations sur Internet

Recherche spécifique

• title: : idem Altavista• domain: : idem Altavista• depth: : recherche en profondeur dans les sous-

dossiers d'un siteexemple : si "depth:2" et recherche http://www.portboulogne.com

page d'accueil :www.portboulogne.comprofondeur 1 :http://www.portboulogne.com/peche/

default.htmlprofondeur 2 :http://www.portboulogne.com/peche/

base/liste.html

• feature: : restreint la recherche à certains types de documents

Page 70: Recherche d’Informations sur Internet

Recherche spécifique

• linkdomain: : fonctionnalité identique à "link:" d'Altavista

» exemple : linkdomain:nausicaa.fr

• outgoingurlext: ou linkext: : recherche sur des pages contenant des liens vers des fichiers ayant une extension spécifique

» exemple : linkext:wrl

• before: : [jour]/[mois]/[année]• after: : [jour]/[mois]/[année]• within: : [nombre]/[type]

» exemple : within:3/months

Page 71: Recherche d’Informations sur Internet

Recherche avancée

Page 72: Recherche d’Informations sur Internet

Recherche avancée

Page 73: Recherche d’Informations sur Internet

Lycos

www.lycos.com ou www.english.lycos.com

Retour

Page 74: Recherche d’Informations sur Internet

Historique

• Lycos vient du nom d'une race d'araignées (Lycosidae) qui capture ses proies en les poursuivant contrairement aux autres qui utilisent des toiles. Les Lycosidaes sont rapides et se déplacent la nuit.

• Lycos propose plusieurs services :– recherche thématique

– les sites les plus intéressants

– les pages jaunes

– …

• Le système reconnaît automatiquement les pays appelants et fournit des versions traduites. Le défaut du système est qu'on navigue fréquemment entre la version française et anglaise.

Page 75: Recherche d’Informations sur Internet

Format des mots clés

• Pas de distinction entre majuscules et minuscules

• Recherche exacte des mots accentués

• L'ordre des mots n'a pas d'importance

• Pas de troncature (joker)

Page 76: Recherche d’Informations sur Internet

Format d'interrogation• +(signe plus)

• Placé au début d'un mot pour indiquer que le mot est requis pour la recherche. bill + clinton

• -(signe moins)• Placé au début d'un mot pour indiquer que le mot doit être exclu de la recherche. bill-clinton

• " "(guillemets)• Précise que les documents doivent contenir l'expression entre guillemets. "Il était une fois..."

• AND & && • Indique dans une recherche de documents, que ceux-ci doivent contenir tous les termes liés

par l'opérateur. bill AND hillary

• OR | | | • Indique dans une recherche de documents, que ceux-ci doivent contenir au moins l'un des

termes liés par l'opérateur. dole OR clinton

http://www.lycos.fr/help/quickref.html

Page 77: Recherche d’Informations sur Internet

Recherche avancéePermet la recherche avec option

sous forme de menu déroulant.

Page 78: Recherche d’Informations sur Internet

Autres outils

Page 79: Recherche d’Informations sur Internet

Autres outils• Moteurs de recherche géographique

– Exemple : http://www.w3.org/History/19921103-hypertext/hypertext/DataSources/WWW/Servers.html

(carte du monde continent pays villes

• Les FAQ (Frequently Asked Questions ou Foire aux Questions ou Forum aux Questions)– Souvent présents dans les forums de discussions– A consulter avant toute contribution à un forum– Ex : http://www.pasteur.fr/infosci/FAQ/

• What's New– Exemple :

• Yahoo : http://www.yahoo.com/new• UREC : http://web.urec.fr• NCTech : http://nctech.fr/

Page 80: Recherche d’Informations sur Internet

Autres outils• Veilleurs

– Exemple : Netmind http://www.netmind.com

Principe : Lance une veille et prévient par email lors d'un changement de page web

Avantages :

– Permet une veille concurrentielle sans avoir à interroger le site

– Possibilité de mettre un veilleur sur la page "new" du site

Inconvénients :

– Ne permet pas de surveiller l'ensemble d'un site

– Peut engendrer de fausses alertes notamment sur les compteurs du site. Partiellement corrigé grâce à certaines options

Page 81: Recherche d’Informations sur Internet

Autres outils• Il existe des outils logiciels qui proposent le même

genre de services : – MyUpdate http://www.getupdated.com/fr/myupdate.htm– Netbuddy

• Les revues et dépêches de presse– Service de dépêches de l'agence Reuter dans Yahoo

– AFP.com (service payant)

– Net2one.com : communiqué de presse chaque jour par le Net

– Revues de presse gratuites• internationale : www.newspage.com • française : www.pressed.fr

Page 82: Recherche d’Informations sur Internet

Autres outils

• Le Push– Plutôt que d'aller vers l'information,

pourquoi celle-ci ne viendrait-elle pas vers l'utilisateur. C'est ce qu'on appelle la technologie "push" à l'inverse de celle qui consiste à aller chercher l'information "pull".

– Les programmes "push" sont aussi appelés "chaîne".

Page 83: Recherche d’Informations sur Internet

Métamoteurs et agents intelligents

L ’idée : Plutôt que de passer du temps à effectuer des recherches, pourquoi ne pas confier la réalisation de cette tâche à un logiciel.

• Les métachercheurs ou métamoteurs "on-line"– Outil permettant la recherche simultanée sur plusieurs moteurs de

recherche :

- Metacrawler- ProFusion- Sawy Search

Page 84: Recherche d’Informations sur Internet

Métamoteurs et agents intelligents

• Les métamoteurs/chercheurs "off-line"– Principe : interrogation "off-line" de plusieurs moteurs pour la même

requête.– Ces outils offrent la possibilité d'utiliser les opérateurs logiques

(ET,OU, NOT…)– Les plus connus :

• Copernic 2000 : existe en version :– gratuite

• version "plus" : propose 50 domaines de recherche sur plus de 400 moteurs

• version "pro" : – veille automatisée avec envoi d'informations par email sur les nouveaux

documents trouvés– automatisation des tâches– vérificateur d'orthographe

Page 85: Recherche d’Informations sur Internet

Métamoteurs et agents intelligents

• Autres metamoteurs off line– Strategic Finder

http://www.strategicfinder.com/

– Net Attaché Prohttp://www.tympani.com/products/NAPro/NAPro.html

Page 86: Recherche d’Informations sur Internet

Recherche d’adresses E-mail

Trouver une adresse Email est une tâche difficile pour les raisons suivantes :

• Les utilisateurs changent fréquemment d’adresses email en changeant de fournisseur,

• Pas encore d ’annuaire mondial unique des utilisateurs d’Internet,

• Les fournisseurs hésitent à dévoiler la liste de leurs clients à la concurrence.

• En France la CNIL impose de proposer le choix à une personne de figurer ou pas dans une liste,

• Certaines personnes refusent d’être présentes sur ces listes pour éviter de recevoir trop de courriers (Spam)

Page 87: Recherche d’Informations sur Internet

Recherche d’adresses E-mail

Malgré cela, des services existent et donnent d’assez bons résultats

• Four11 http://www.four11.com (Yahoo!)

• Whowhere http://www.whowhere.com (Lycos)

• Internet Address Finder http://www.iaf.net

Page 88: Recherche d’Informations sur Internet

Liste de diffusion

• Ou mailing-lists• Fondée sur l’utilisation de l’Email• Un message envoyé à une adresse de liste

sera automatiquement transmis aux abonnés de la liste

• Chaque liste correspond à un domaine• une adresse email est utilisée pour la

discussion et une autre pour l’administration de la liste (Abonnement/Désabonnement)

Page 89: Recherche d’Informations sur Internet

Liste de diffusion

• L’inscription peut se faire manuellement ou automatiquement par un serveur

• Des commandes simples dans le sujet du message permettent d ’entrer en contact avec la liste :– help, subscribe, unsubscribe, …

• Les listes sont généralement gérées par un animateur chargé de « modérer » la liste.

Page 90: Recherche d’Informations sur Internet

Liste de diffusion

• Listes de listes de diffusion :– http://www.liszt.com (en anglais)– http://www.updesk.net/france/annuaire.cfm

(en français)

Page 91: Recherche d’Informations sur Internet

Forum de discussion• News ou Newsgroups• Différents des listes car les messages sont

disponibles sur des serveurs (usenet)• Les forums sont libres donc les messages

sont visibles de tous• Certains groupes sont modérés• il existe plus de 30000 thèmes de discussion

Page 92: Recherche d’Informations sur Internet

Forum de discussion• Comment se compose en général les thèmes :

cat.dom.thème• cat : catégorie

– ex :• comp = informatique• sci = sciences• rec = loisirs• soc = société• talk = débats publics• alt = sujets alternatifs

• dom : domaine– ex :

• comp.ai = intelligence artificielle

• thème : définit encore plus finement un thème d’intérêt– ex :

• comp.unix.questions =pour poser des questions sur le système d’exploitation unix

Page 93: Recherche d’Informations sur Internet

Forum de discussion

• Exemples de site de recherche dans les forums de discussions :– DejaNews http://www.dejanews.com– CNET Help http://www.help.com/

Page 94: Recherche d’Informations sur Internet

Serveurs FTP

Outil permettant de rechercher et de télécharger de dizaines de milliers de logiciels gratuits ou presque.

Deux types de logiciels sont mis à disposition :– freeware = gratuiciel = gratuits

– shareware = partagiciels = contribution financière (en général assez faible)

Un serveur FTP (File Transfert Protocol) permet l’échange de fichiers entre un serveur et un client.

Pour des raisons de taille, la plupart des fichiers sont compressés

Page 95: Recherche d’Informations sur Internet

Services de recherche de logiciels• Véritables outils de recherche fonctionnant

sur mots clés et permettant de rechercher n’importe quel programme

• Exemple de services :– Shareware.com http://www.shareware.com– Download http://www.download.com– Zdnet http://www.zdnet.com– tucow http://www.tucow.com

Page 96: Recherche d’Informations sur Internet

Méthodologie de recherche

Page 97: Recherche d’Informations sur Internet

Adresse email

Hypothèse : on connaît le nom Recherche dans un annuaire d’email

Service Whois

Contact direct (tel, fax)

forum soc.net-people (en dernier recours, si tout le reste a échoué).

Page 98: Recherche d’Informations sur Internet

Adresse email

Hypothèse : on ne connaît pas l’orthographe exacte mais on connaît l’entreprise

Recherche par mot clé sur le nom de l’entreprise puis écrire à [email protected]

Contact direct téléphone, fax

Page 99: Recherche d’Informations sur Internet

Renseignements sur une personne

On recherche un spécialiste d’un domaine précis sans disposer d’un nom en particulier Recherche dans un forum. Recherche du forum

adéquat. Lire les messages. Récupérez l’Email

Recherche dans les archives des forums

Recherche dans les FAQ

Recherche sur le Web

Contribution dans les forums

Page 100: Recherche d’Informations sur Internet

Recherche d’une entreprise

On connaît le nom Recherche intuitive sur le web par l ’adresse de

l ’entreprise en .com, .fr, .net Recherche par un moteur en utilisant l ’option

anchor:nom_de_l ’entreprise d’AltaVista Recherche sur l’url par l’option

url:nom_de_l ’entreprise Recherche par mot clé pensez à mettre la première

lettre en majuscule Interrogation par thème Interrogation par zone géographique

Page 101: Recherche d’Informations sur Internet

Recherche sur des thèmes précis

La recherche est ponctuelle Interrogation par mots clés

Interrogation par thèmes

Lecture des FAQ

Interrogation des forums adéquats

Page 102: Recherche d’Informations sur Internet

Recherche sur des thèmes précisRecherche régulière (veille)

Inscription à des listes de diffusion lecture régulière des forums de discussion Services de revues de presse automatisés Presse en ligne Veille sur page Web Automatisation des recherches, sauvegarde des

pages de recherche Bibliothèque, laboratoires de recherche Recherche dans les What ’s New

Page 103: Recherche d’Informations sur Internet

Recherche d’un logiciel

Recherche sur des services comme shareware, download, zdnet, etc…

Recherche sur un moteur de recherche

Page 104: Recherche d’Informations sur Internet

Surveillance des technologies émergentes

Inscription dans des listes de diffusion

Lecture des forums de discussion

Revues de presse automatisées

Surveillance de la création ou du volume des forums

Recherche de sites Web ou de liste

Page 105: Recherche d’Informations sur Internet

Surveillance des concurrents

Inscription à des listes de diffusion

Lecture régulière des forums de discussion

Revues de presse automatisées

Interrogation des moteurs par thèmes

Recherche de listes

Veille sur les pages web

Interrogation par zone géographique

Page 106: Recherche d’Informations sur Internet

Comment archiver ces recherches ?

• La recherche sur Internet, offre parfois une multitude de site face à une recherche

• Les sites peuvent parfois se recouper et présenter la même information

• Il faut donc créer SA propre base de donnée sur le sujet à traiter:

Création d’une fiche ressource

Page 107: Recherche d’Informations sur Internet

Création d’une fiche ressource Internet

1. Créer un document Word : Menu DEMARER, PROGRAMME, sélectionner WORD

Page 108: Recherche d’Informations sur Internet

Création d’une fiche ressource Internet

2. Rédiger votre « Fiche ressource » , c’est à dire les sites visités avec un résumé du site, ainsi que l’adresse complète du site visité

Page 109: Recherche d’Informations sur Internet

Création d’une fiche ressource Internet

2. Dans le menu OUTILS sélectionner Personnaliser puis Enregistrement. Saisir un mot de passe (à ne pas perdre)

Page 110: Recherche d’Informations sur Internet

Création d’une fiche ressource Internet

• Sélectionner l’adresse du site, puis dans le menu Insertion sélectionner « Lien Hypertexte »

Page 111: Recherche d’Informations sur Internet

Création d’une fiche ressource Internet

La fenêtre ci-contre s’affiche, vérifier l’adresse indiquée puis valider (OK)

Page 112: Recherche d’Informations sur Internet

Impression

• Il est parfois intéressant d’imprimer une partie d’un site.

• Pour ce faire, il est préférable de copier le texte, pour ensuite le coller dans un traitement de texte pour le retravailler afin d’éviter l’ impression de page inutile

Page 113: Recherche d’Informations sur Internet

Imprimer un texte

1. Sélectionner votre texte

Page 114: Recherche d’Informations sur Internet

Imprimer un texte2. Dans le Menu EDITION sélectionner Copier

Page 115: Recherche d’Informations sur Internet

Imprimer un texte

3. Ouvrir WORD par le Menu DEMARER, PROGRAMME, sélectionner WORD

Page 116: Recherche d’Informations sur Internet

Imprimer un texte4. Dans le Menu EDITION sélectionner Coller

Vous pouvez dès à présent retravailler le texte, la présentation pour ne sélectionner QUE l’essentiel. De plus, réduisez les marges ainsi que la taille de la police utilisée.

Page 117: Recherche d’Informations sur Internet

Conclusion

• Voici donc un aperçu très rapide des possibilité qu’offre l’outils « Internet » lors d’une recherche

• Il faut surtout bien garder à l’esprit qu’Internet est un outils parmi d’autre qu’il faut apprendre à manipuler efficacement afin d’ouvrir les portes vers de nouvelles connaissances