7
INDEXATION INDEXATION ET ET RECHERCHE SUR LE RECHERCHE SUR LE WEB WEB

recherche sur le web

  • Upload
    lyrae

  • View
    345

  • Download
    4

Embed Size (px)

Citation preview

Page 1: recherche sur le web

INDEXATIONINDEXATION ET ET RECHERCHE SUR RECHERCHE SUR

LE WEBLE WEB

Page 2: recherche sur le web

1)Composants d’un moteur de 1)Composants d’un moteur de rechercherecherche

Page 3: recherche sur le web

Robot d’indexationRobot d’indexation : : nombre important de nombre important de logiciels qui parcourent les documents du logiciels qui parcourent les documents du Web, à partir d’une adresse donnée (saut de Web, à partir d’une adresse donnée (saut de page en page grâce aux liens trouvés) et page en page grâce aux liens trouvés) et récupèrent les informationsrécupèrent les informations

IndexIndex : : base de données des informations base de données des informations récupérées lors de la phase de collecte; prépare récupérées lors de la phase de collecte; prépare ces informations pour optimiser le temps de ces informations pour optimiser le temps de réponse des requêtesréponse des requêtes

Interface d’interrogationInterface d’interrogation

Page 4: recherche sur le web

2)Principe de fonctionnement2)Principe de fonctionnement

Page 5: recherche sur le web

Préparation de la requêtePréparation de la requête

Interrogation de la base : Interrogation de la base : en mode simple, en mode simple, avancé(expert) ou spécialiséavancé(expert) ou spécialisé

Restitution des résultats : Restitution des résultats : la visualisation la visualisation des résultats repose sur un classement (les des résultats repose sur un classement (les réponses sont ordonnées)réponses sont ordonnées)

Page 6: recherche sur le web

3)Modes d’indexation de 3)Modes d’indexation de documentsdocuments

Page 7: recherche sur le web

Métadescription de documentsMétadescription de documentsOn observe le document et on le décrit à côté : récupération des On observe le document et on le décrit à côté : récupération des

propriétés et caractéristiques du documentpropriétés et caractéristiques du document

Mode qui fait une sélection pour qualifier le documentMode qui fait une sélection pour qualifier le document

Mode plein texteMode plein texteLe contenu de la page est indexé intégralementLe contenu de la page est indexé intégralement

Problème pour les images, sons et vidéosProblème pour les images, sons et vidéos

Mise à jour automatisée (robot logiciel : repérage et visite) ou Mise à jour automatisée (robot logiciel : repérage et visite) ou manuelle (auteur du site, personne chargée du référencement manuelle (auteur du site, personne chargée du référencement ou professionnel)ou professionnel)