21
1 gle, un moteur de recherche comme les autres Laurent CHERKI Brice DUTHEIL Guillaume GERME

1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

Embed Size (px)

Citation preview

Page 1: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

1

Google, un moteur de recherche comme les autres ?

Laurent CHERKIBrice DUTHEILGuillaume GERME

Page 2: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

2

Introduction

Sergey Brin Larry Page

Fondateurs

Page 3: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

3

Introduction

Google43%

Google Image

8%

MSN Search

21%

Yahoo!10%

AOL5%

Autres13%

Statistiques Google en Europe en 2004

Page 4: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

4

Introduction

Google, un moteur comme les autres ?

Page 5: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

5

I) Principes et idées fondatrices.I) Google, « googol »II) Google, « large-scale search engine »III) Google, efficace

II) Google, une recette originale.I) Google, architecture

I) Aspiration.II) Indexation

II) PageRankI) FonctionnementII) Limites

III) Infrastructure

III)Avenir et concurrence.I) Un marché disputéII) Les pistes de recherches

Plan

Page 6: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

6

La mission :

Garantir à ses utilisateurs les solutions de recherche les plus confortables, les plus complètes et les plus précises

Google, « googol »

Google ?

Néologisme sur le mot googol googol = 10100

Principes et idées fondatrices

Page 7: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

7

Google, « large-scale search engine »

• Pas d’intervention humaine• Recherche sur une base de donnée • Utilisation des algorithmes

Principes et idées fondatrices

Page 8: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

8

Google, efficace

• Résultats de qualité.• Recherche rapide• on ne peut pas payer sa place

Principes et idées fondatrices

Page 9: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

9

Aspiration

Web

Indexation

Barrel

Google

L’ architecture de Google

Google, une recette originale

Page 10: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

10

L’aspiration

But : télécharger le web

Composée de :• Crawler• « Repository »

Tache difficile et sensible

Limite : • Multiplication des pages• Le silence • Sites fantômes

Google, une recette originale

Page 11: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

11

L’indexation

But : analyse et trie des documentsComposée de :• « Indexer »• « Sorter »• « Barrel »

Construction d’un double index« forward index »« inverted index »

Google, une recette originale

Page 12: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

12

Le PageRank

• Qu’est ce que le PageRank ?

• le Concept, le principe de fonctionnement

• La formule.

Google, une recette originale

Page 13: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

13

Le PageRank

Expression mathématiques

Avec comme variables :P : page P d : facteur d’absorptionPageRank(Ti) : PageRank de la page Ti C(Ti) : nombre de liens sortants de la page Ti

Google, une recette originale

Page 14: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

14

Le PageRank

Limite : • Méthode qui devient trop connue • Ne tient pas compte de la vraie structure du web• Ne prend pas en compte d’information sémantique

Google, une recette originale

Page 15: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

15

L’infrastructure

Cluster :

Composé de :plusieurs dizaines de milliers d’ordinateur bas de gamme

Principe : Répartition de la charge

Intérêt : Réduction des coûtsHaute tolérance de panne

Google, une recette originale

Page 16: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

16

Un marché disputé

« Clustered Search »

ex: ,

Search

Avenir et concurrence

Page 17: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

17

Moteurs spécialisés

Diversification des moyens d’accès

Recherche surl’ordinateur

Les pistes de recherche

12

31

Avenir et concurrence

Page 18: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

18

Moteurs spécialisés

Diversification des moyens d’accès

Recherche surl’ordinateur

12

312

Avenir et concurrenceLes pistes de recherche

Page 19: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

19

Moteurs spécialisés

Diversification des moyens d’accès

Recherche surl’ordinateur

12

3123

SMS

Avenir et concurrenceLes pistes de recherche

Page 20: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

20

En conclusion nous pouvons maintenant répondre à la problématique posée :

Est il un moteur de recherche comme les autres ?

Page 21: 1 Google, un moteur de recherche comme les autres ? Laurent CHERKI Brice DUTHEIL Guillaume GERME

21

Conclusion

Laurent CHERKI - Brice DUTHEIL- Guillaume GERME