25
TYPO3 et les moteurs de recherche 01.07.2011 Yohann CERDAN <[email protected]> Thomas LEROY <[email protected]>

T3UNIFR11 - TYPO3 et les moteurs de recherche

  • Upload
    sitengo

  • View
    752

  • Download
    2

Embed Size (px)

Citation preview

Page 1: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et

les moteurs de recherche 01.07.2011

Yohann CERDAN <[email protected]> Thomas LEROY <[email protected]>

Page 2: T3UNIFR11 - TYPO3 et les moteurs de recherche

Yohann CERDAN Directeur Technique Site’nGo Profil : Développeur TYPO3 Certifié TYPO3 Integrator

Thomas LEROY Directeur Techno-commerciale Site’nGo Profil : Intégrateur TYPO3 Certifié TYPO3 Integrator

T3UNI11

TYPO3 et les moteurs de recherche 01.07.2011

Page 3: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

Page 4: T3UNIFR11 - TYPO3 et les moteurs de recherche

Ce qu’il existe par défaut

Page 5: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

Recherche full text MySQL

Retourne les enregistrements avec leur pertinence

Gère les opérateurs booléens + et –

Peut convenir pour un développement spécifique

T3UNI11

01.07.2011

http://dev.mysql.com/doc/refman/5.0/fr/fulltext-search.html

Page 6: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

Recherche full text MySQL

Trop simpliste

Modifie la structure de la table (MyISAM)

Performances faibles sur des gros volumes

T3UNI11

01.07.2011

http://dev.mysql.com/doc/refman/5.0/fr/fulltext-search.html

Page 7: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

Recherche full text MySQL

T3UNI11

01.07.2011

Page 8: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

indexed_search

T3UNI11

01.07.2011

Page 9: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

indexed_search

Est développée depuis 2004 (Kasper Skaarhoj)

Est intégrée et configurée dans les sources de TYPO3

Indexe toutes les pages/contenus et documents (catdoc / pdftotext)

Gère les espaces authentifiés

Dispose d’un crawler externe (CRON) ou indexation à la visite (aucune configuration)

T3UNI11

01.07.2011

Page 10: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

indexed_search

Convient parfaitement pour des sites à faible et moyen trafic

Ne gère pas de manière poussée les opérateurs et le filtrage

Est difficile à surcharger pour ajouter des fonctionnalités (XCLASS, hooks…)

T3UNI11

01.07.2011

Page 11: T3UNIFR11 - TYPO3 et les moteurs de recherche

Pour aller plus loin

Page 12: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

Google Search (version gratuite)

Très simple à mettre en place

Aucun contrôle :

Retours Mise en forme Indexation dépend de votre SEO

http://www.google.com/cse/

T3UNI11

01.07.2011

Page 13: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

Google Search (version payante)

Toujours aussi simple

Gestion des synonymes

Pondération de certains résultats

Pas de publicité

Flux XML

Filtrage par catégorie simple

Dépend toujours de l’indexation de Google

T3UNI11

01.07.2011

http://www.google.com/sitesearch/

Page 14: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

Google Search et TYPO3

ya_googlesearch

googlecse

google_api_search

ltg_googlesearch

so_gsearch

ajax_google_search

T3UNI11

01.07.2011

Page 15: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

MnoGoSearch

Ecrit en C

Composé d’un crawler et d’un moteur de recherche

Supporte la plupart des base de données

Support de l’UTF8

Gestion du multilinguisme (70 langues)

Indexation et recherche rapide

Indexation des pages et documents

Existence d’une extension PHP (http://php.net/manual/fr/book.mnogosearch.php)

http://www.mnogosearch.org/

T3UNI11

01.07.2011

Page 16: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

MnoGoSearch et TYPO3

1 seule extension : mnogosearch (2009)

Développée par Dmitry Dulepov (realurl, templavoila, pagebrowse…)

Simple (nécessite par contre l’installation sur le serveur)

Supporte les pages authentifiées et les documents

Peu d’options disponibles pour les recherches (tris, filtres…)

T3UNI11

01.07.2011

Page 17: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

Sphinx

Ecrit en C++

Spécialement conçu avec la performance à l’esprit

Composé d’un crawler et d’un moteur de recherche

Couvre les mêmes fonctionnalités que mnogosearch

Plus rapide que mnogosearch (ou les autres) pour les deux traitements

Supporte la plupart des base de données (ou des fichiers XML)

Possibilité de recherches distribuées pour les très gros sites

De bonnes références : wordpress, dailymotion, mozilla

Craigslist : 5 billions de documents, 6 TB de données, 50 millions de recherches/jour

http://www.sphinxsearch.com/

T3UNI11

01.07.2011

Page 18: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

Sphinx et TYPO3

Rien ! Tout est à faire

SphinxAPI compatible PHP (SphinxAPI, SphinxSE et SphinxQL)

Peut-être une implémentation de SphinxQL dans le core de TYPO3 4.6?

T3UNI11

01.07.2011

Page 19: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

Apache SOLR

Ecrit en Java (nécessite un serveur d’application Java)

Composé d’un moteur d’indexation et de recherche (Lucene)

Propose une interface de recherche (SOLR)

Solution très rapide

Pas besoin de base de données

Interface sous forme d’API XML / JSON exploitable de n’importe où et avec

n’importe quelle technologie (SolrPHPClient)

De bonnes références : Cnet, Panasonic, Porsche…

Nécessite de la configuration et un serveur « convenable »

http://lucene.apache.org/solr/

T3UNI11

01.07.2011

Page 20: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

Apache SOLR

Beaucoup de fonctionnalités :

Possibilité de choisir exactement ce qui est indexé

Indexation des documents puissante (Apache Tika)

Recherche avec des opérateurs

Recherche par facette

Réplication des index

Recherche distribuée

Interface d’administration

Interaction possible avec d’autres systèmes (Liferay, AlFresco)

T3UNI11

01.07.2011

Page 21: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

Apache SOLR et TYPO3

Projet débuté en 2008

Projet soutenu par dkd

Une version gratuite Une version payante

Bien intégré

Pages authentifiées Facettes Tris Filtres Auto-complétion Installation facilitée …

http://www.typo3-solr.com/

T3UNI11

01.07.2011

Page 22: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

Apache SOLR et TYPO3

Toute la configuration est faite en typoscript

Paramétrage

Ajout de champs, facettes…

Objets typoscript

T3UNI11

01.07.2011

http://www.typo3-solr.com/

Page 23: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

Apache SOLR et TYPO3

Et si l’extension ne fait pas ce que je veux?

Possibilité de surcharger le typoscript (userfunc)

Des hooks aux bons endroits

Une XCLASS?

T3UNI11

01.07.2011

http://www.typo3-solr.com/

Page 24: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

Questions / Réponses

T3UNI11

01.07.2011

Page 25: T3UNIFR11 - TYPO3 et les moteurs de recherche

TYPO3 et les moteurs de recherche

Merci

Retrouvez cette présentation sur www.site-ngo.fr

Yohann CERDAN <[email protected]> Thomas LEROY <[email protected]>

T3UNI11

01.07.2011