Le balisage sémantique, une opportunité pour votre visibilité web

Embed Size (px)

Citation preview

Stratgie de visibilit web et mdias sociaux

Le balisage smantique, une opportunit pour votre visibilit webStandards, bonnes pratiques, tendances1

1

partenaires

2

2

Louis durocher3

Prsident et associ

Ornoque interactif inc.www.orenoque.com [email protected] 844-5049@orenoquehttp://fr.slideshare.net/orenoque

3

Ornoque interactifNous sommes une agence dexperts en solutions de visibilit et de marketing web Montral. Depuis 1995, nous accompagnons nos clients dans latteinte de leurs objectifs de marketing Internet B2B comme B2C, en dveloppant avec eux des stratgies personnalises.Nous sommes la premire agence offrir aux entreprises, et aux particuliers, un service de gestion de la rputation en ligne.Par o commencer?Laissez-nous vous guider travers une analyse de vos besoins. Contactez-nous ds aujourd'hui: 514 [email protected]

4

4

Le balisage smantiquedekec?5

5

Mettre de lordre dans le chaosGoogle = + de web smantiqueCrer de lordre et du sens dans le chaos de donnes non structuresFormats de donnes ou de vocabulaires prcis

6

Au cours des prochains mois et des prochaines annes, Google misera de plus en plus sur la publication de rsultats du web smantique dans ses rsultats de recherches.

Mais quest-ce exactement que le balisage smantique, et pourquoi donc sen soucier si votre objectif est damliorer votre rfrencement internet sur Google et les autres moteurs ?

La tendance vers le web smantique origine du besoin quont les dveloppeurs et surtout je crois, les moteurs de recherches, de crer de lordre et du sens dans le chaos de donnes non structures qui compose la plupart des pages Web.

Prendre lexemple des pages web vs wordpress

Rendre le chaos comprhensible aux moteurs de rechercheRendre les donnes contenues dans des milliards de pages web facilement comprhensibles etaccessibles la recherche laide de formats de donnes ou de vocabulaires prcis, tel est lobjectif que se donne le balisage smantique.

Un article rcemment paru dans le Wall Street Journal a relanc le dbat et la curiosit sur la recherche smantique en rapportant que Google prvoit faire de grands changements dans ses rsultats de recherche en y incorporant des rsultats en provenance de la recherche smantique.

Ces rsultats seront un moyen pour Google de montrer quil comprend la signification de la recherche du chercheur et quil tente dy rpondre directement dans les rsultats de recherche grce des rponses suggres.

Les rsultats de la recherche smantique impacteront de 10 20 % des recherchesLe Wall Street Journal, citant une source anonyme, indique que ce changement pourrait avoir un impact sur 10 % 20 % de lensemble des requtes de recherche.

Ces technologies ne sont pas nouvelles, la nouveaut cest que Google va les implanter de plus en plus dans ses rsultats de recherches.

Lavantage pour le moteur tant videmment de vous garder le plus longtemps sur place en interprtant votre question et en lui fournissant une rponse directement dans les rsultats de recherches.

6

Dfinitionweb smantique = web 3.0Tim Berners-Lee Un web de donnes qui peuvent tre traites directement et indirectement par des machines. Sparer la prsentation des donnes des donnes elles-mmes

7

Le pre du World Wide Web, Tim Berners-Lee, dfinit le Web smantique comme un web de donnes qui peuvent tre traites directement et indirectement par des machines."

Cela rsume bien le concept premier du web smantique - savoir une sparation entre la prsentation des donnes et les donnes elles-mmes.

Dans cette prsentation, et pour des raisons qui deviendront videntes, je parlerais finalement peu de sites web mais beaucoup donnes.

C'est parce que le Web de donnes selon le modle et le concept de Berners-Lee comprend toutes sortes d'informations qui sont actuellement indisponibles dans la notion traditionnelle du web: des documents dans de nombreux formats, des informations qui n'existe que dans les bases de donnes, et ainsi de suite.

Ces donnes peuvent inclure des sites web et de pages web, bien sr, mais le web n'est pas le domaine exclusif de ce rseau de donnes.7

Rfrencement/seo smantiqueComment utiliser les techniques du web smantique pour:Envoyer Google des informations dtailles sur la signification de votre contenu,D'une manire facilement comprhensible par des algorithmes

8

Semantic Search Engine Optimization (SEO smantique) ou le rfrencement smantique cest l'utilisation des techniques du Web Smantique pour:

1.Envoyer des informations dtailles sur la signification du contenu de vos pages et de vos sites des moteurs de recherche ou dautres consommateurs de donnes,

2. D'une manire qui peut tre facilement transforme et comprise par des ordinateurs

De nombreux sites sont gnres partir de donnes structures, souvent stockes dans des bases de donnes.

Mais lorsque ces donnes sont formates en HTML, il devient trs difficile, pour les moteurs de recherche, de rcuprer ces donnes dorigine structures.

De nombreuses applications, les moteurs de recherche en particulier, peuvent grandement bnficier dun accs direct ces donnes structures.

Le balisage de vos pages permet aux moteurs de recherche de mieux comprendre les informations contenues sur vos pages Web et de fournir des rsultats de recherche plus riches afin de rendre plus facile pour les utilisateurs de trouver des informations pertinentes sur le web.

Il existe plusieurs formats de balisage qui fournissent un vocabulaire et un ensemble commun de schmas que les webmestres peuvent utiliser.

De plus, un format unique permet damliorer la cohrence entre les moteurs de recherche qui se basent sur ces donnes.

8

Rfrencement/seo smantiqueStructured DataMarkup Language & Vocabulary Linked DataURI Uniform Resource IdentifierWeb SmantiqueRDFResource Framework Dfinition9

Si lon omet laspect technique, essayons dexpliquer ce que cela pourrait signifier pour les commerants et les entreprises qui possdent un site web et qui souhaitent amliorer leur rfrencement internet.

Le balisage smantique vous permet de faire en sorte que tout votre contenu soit facilement accessible, que ce soit par les moteurs de recherche ou par des applications Web.

Fondamentalement, vous pouvez utiliser un balisage smantique pour du contenu vido, des critiques de produits, des emplacements et des coordonnes, des donnes sur des entreprises ou des organisations, des attributs dauteur, des recettes, des fiches produits, des conditions mdicales, et bien plus encore , et ce dune faon quil est trs facile pour les moteurs de recherche de comprendre.

Si Google interprte correctement le contenu de vos pages, il peut crer des extraits enrichis, cest--dire des informations dtailles visant aider les internautes lors de recherches spcifiques.

Ces extraits enrichis, les Rich Snippets, utilisent et affichent vos donnes structures de faon crative et visuelle dans les rsultats de recherche.

Structured Data = Donnes organises par un langage de balisage et un vocabulaire. Peut tre organis et recherch par les machines.Linked Data = Publication de donnes structures afin quelles puissent tre accessible par un URI Unified Ressource IdentifierLe Web smantique = le Web des entits de donnes interconnectes, accessibles globalementRDF = Resource Framework Dfinition. Il s'agit d'un modle de donnes qui tablit des relations d'entits utilisant des triples ou triplets9

Langage de balisageRDF markup languageLes triplets (triples)SujetPrdicat Objet

10

Exemples de triplets RDF dcrivant des entits. C'est ainsi que les donnes du web smantique sont dfinies.10

ontologie du riz

11

Les triplets sont une faon formelle, mais tonnamment flexible de dcrire et de classer les donnes.

Il n'existe aucune relation entre des sujets et des objets qui ne peuvent tre dcrites par des triplets.

Les webmasters fournissent dj Google des donnes structures ou semi-structures qui font peu prs la mme chose: comme lvaluation moyenne des clients concernant ce lecteur DVD est de 4 toiles, le titre de ce document est Le jaguar est un flid, ou, bien par exemple la balise alt de cette photo est La Jaguar modle XJ.

Ce que les modles de donnes structures du web smantique font, cest vraiment dtendre la capacit de lier toutes sortes de donnes en mme temps que de le faire de manire beaucoup plus significative.11

HomonymieJaguar ou jaguarrel="canonical"canocalisation

12

Avant de passer rfrencement smantique comme tel, permettez-moi une pause pour tirer les premires analogies entre le rfrencement et le web smantique.

La capacit de rechercher une ressource spcifique - disons une page web - en utilisant un identifiant unique, une procdure appele drfrencement .

Imaginons une page de produit, un appareil photo, qui serait accessible par diffrentes catgories: appareil photo canon, reflex numrique, prix entre 1500 et 3000 dollars, appareil capteur plein format, stabilisateur dimage, etc. chaque fois que lon accde la page de produit dun chemin diffrent, son URL change parce que des paramtres y sont ajouts. a peut-tre trs mlangeant pour un moteur de recherche de se retrouver avec 15 URL diffrentes pour en fait la mme page.

En fait, Google a invent essentiellement la balise justement parce qu'il voulaient tre en mesure de drfrencer les pages Web.

Fournir des donnes structures est une manire beaucoup plus formelle de le faire, et pourraient peut-tre tre employes pour rsoudre beaucoup de problmes de contenu dupliqu.

Clarification de Jaguar

Homonymie Jaguar le mamifre carnivorde de la famille de flids, et la Jaguar, une marque de voitures de luxe.

Prsent avec deux ressources sur jaguar" disponible uniquement en HTML, Google doit faire un peu de gymnastique de donnes pour comprendre - s'il le peut de quelle sorte de jaguar une ressource donne parle.

Les modles du web smantique permettent non seulement de dire trs explicitement "hey Google, il s'agit de la voiture Jaguar, pas du gros chat", mais aussi de dire, la Porshe est une voiture de luxe" et la Mercdes est une voiture de luxe, et dtablir des connexions entre des ressources.

Alors, est-ce que dutiliser des donnes structures peut vous aider amliore vos classements web?

Eh bien, Google aime vraiment se faire dire directement ce que quelque chose signifie, et plus vous laidez en lui donnant des donnes biens structures, meilleures sont vos chances que vos pages recevrons plus de visibilit dans ses rsultats de recherche. Plus sur a plus tard.12

Google approved:schema.org

13

lheure actuelle, il existe diverses options pour le balisage smantique (schema.org, les microformats, RDFa, GoodRelations, etc.), mais lelangagerecommand par Google est le balisage demicro-donnesdisponible sur Schema.org.

Schema,org propose une collection de schmas, cest--direde balises html, que les webmestrespeuvent utiliserpour baliser leurs pages de manire reconnue par les moteurs de recherche majeurs.

Les moteurs de recherche, y compris Bing, Google, Yahoo! et Yandex, sappuient ensuite sur ce balisage pour amliorer laffichage de leurs rsultats de recherche, et rendre plus facile aux internautes la tche de trouver les bons rsultats de recherches.

13

Les opportunits pour votre visibilit web14

Le rfrencement smantique: une opportunit pour votre site

Le rfrencement smantique ressemble de plus en plus une opportunit sans pareil pour les webmestres damliorer la description et la comprhension de leurs donnes par les moteurs.

Dans les prochaines annes, il est fort parier que ce type de critres de mise en forme sera certainement favoris par Google et les autres moteurs de recherche dans leurs algorithmes de pertinence des contenus, si ce nest dj le cas.14

Les moteurs de rechercheRecettes15

De nos jours les moteurs de recherche utilisent dj les donnes structures pour afficher des rsultats de recherches enrichis, les Rich Snippets.

Selon certaines sources, les Rich Snippets peuvent augmenter votre taux de clic par autant que 20% ou 30%.

Google (et Bing) utilise les codes de balisage smantique, comme celui utilis dans Schema.org, pour identifier le type de contenu dune page et fournir des donnes supplmentaires sur le contenu de celle-ci dans le rsultat de la recherche.

Par exemple, Google dispose actuellement de plusieurs types de Rich Snippets quil montre dans ces rsultats, y compris les commentaires, la musique, des vnements, les recettes et plus encore.

Le premier facteur considrer sera limpact sur les rsultats de recherche organiques.

Il est probable que les rsultats classiques seront pousss plus loin en bas de page, rendant plus difficile latteinte dune visibilit organique pour votre site web dans les rsultats organiques.

15

Les moteurs de rechercheMicrodonnes (format recommand)MicroformatsRDFa16

AvisPersonnesProduitstablissements et entreprisesRecettesvnementsMusiqueVidosApplications logiciellesRubriques de fil dAriane

Microdonnes (format recommand)MicroformatsRDFaAvisPersonnesProduitstablissements et entreprisesRecettesvnementsMusiqueVidosApplications logiciellesRubriques de fil dAriane, Bread Scrum16

Les moteurs de rechercheShopping17

Pour les sites qui incorporent le commerce lectronique, il est fortement suggr de regarder du ct des initiatives que sont les donnes de produit sous la forme dun balisage structur disponible sur Shema.org, ou les formats compatibles comme ceux sous la forme des formats GoodRelations et RDFa.

Par exemple on peut dcrire un produit avec un vocabulaire prcis qui comprend : marque, manufacturier, modle, ID du produit, le prix, etc.17

Les moteurs de rechercheShopping18

Profiter de la visibilit accrue offerte par les extraits enrichis

Pour amliorer votre rfrencement web, soigner votre rputation en ligne ou profiter de la visibilit accrue dans les rsultats de recherches, les extraits enrichis sont la solution.

Si vous tes un marchand par exemple, il est donc conseill de fournir Google des informations dtailles sur vos produits.

Le moteur les utilisera ensuite pour afficher des extraits enrichis ou Rich Snippets, (prix, disponibilit, avis et notes, par exemple) sur ses pages de rsultats de recherche.

Si Google interprte correctement le contenu de vos pages, il peut crer des extraits enrichis, c'est--dire des informations dtailles visant aider les internautes lors de recherches spcifiques.

Pour les sites de commerce lectronique par exemple, il est possible dannoter ses pages de produits et de spcifier la marque, le manufacturier, ladisponibilit, le prix, etc.

Pour le moment, les extraits enrichis de produits apparaissent uniquement sur les pages de rsultats de recherche aux tats-Unis, mais ce nest quune question de temps avant que ce type de donnes apparaissent au Canada et au Qubec.

De toute vidence, votre objectif en tant que concepteur web ou de responsable marketing doit maintenant tre dintgrer non seulement les rsultats organiques traditionnels, mais aussi la nouvelle section des rsultats smantiques.18

Les moteurs de recherchevnements19

vnements19

Les moteurs de rechercheFilms20

Films20

Les moteurs de rechercheSries TV21

Sries tl21

Schmas disponibles22

Types de commerce, informations mdicales, professions, heures douvertures, etc.22

Google knowledge graph23

http://www.youtube.com/watch?v=mmQl6VGvX-c

Les moteurs comme Google, tentent de plus en plus de donner des rponses des questions et non des rsultats.

Le moteur se transforme de moteur de recherche moteur de connaissances.23

Google knowledge graph24

Vers un web dentitsAcquisition de Metaweb et de son index Freebase

Pour se faire, Google pourra compter sur sa technologie et sur lacquisition de Metaweb et de son index Freebase et son entity graph de prs de 22 millions dentits (en comparaison, Wikipdia en anglais comporte seulement 4 millions darticles).

24

freebase25

Cette acquisition va permettre dajouter une couche dinformation supplmentaire

Cette nouvelle mouture de Google, en plus de rpondre des questions simples comme la conversion de 100 dollars canadiens en dollars amricains, ajoute une couche dinformation aux rsultats de recherches.

Freebase est une collection de donnes structures et ouvertes, disponible sous licence Creative Commons et une plate-forme pour y accder et en manipuler les donnes via une API.

Par exemple voici linformation structure sur Apple inc.

Freebase contient des informations surenviron 22 millions desujetsouentits.Chacune possde un ID unique, ce quipeut aider distinguerplusieurs entitsqui ont des nomssimilaires, tels queHenryFord lindustrielHenry Fordvsle footballeur.

La plupart des sujetssont associs un ou plusieurs types, comme les personnes, les lieux,livres, films,etc., etpeuvent avoir des propritssupplmentaires, commela date de naissancepour une personneou la latitude etla longitudedun lieu.25

Google knowledge graph26

Les moteurs comme Google, tentent de plus en plus de donner des rponses et non des rsultats cest--dire de fournir la rponse directement dans les rsultats de recherche et non plus simplement de pointer un lien vers une ou des ressources qui donnent ou contiennent cette rponse.

10 blue links.

Carrousel, rock bands, jazz musicians, 26

Google knowledge graph27

Ce type dinformation apparat de plus en plus lorsque lon fait des recherches sur des entits , des personnes, des lieux, des vnements historiques, des artistes, des compagnies27

Google+28

Profil Google+ validrel="publisher"

Comment les marques peuvent en profiter?Profil Google+ validAssocier son profil Google+ son site web en le validant pour crer votre propre entit/identit auprs de Google.28

Authorshiprel= "author"Crez un lien entre votre profil Google+ et votre site avec rel= "author" Crez un lien de retour vers votre site dans votre profil Google+Vrifiez avec loutilde test des donnes structurs de Google29

Comme individu vous pouvez faire un peu la mme chose.

Crez un lien entre votre profil Google+ et votre site avec rel= "author" Crez un lien de retour vers votre site dans votre profil Google+Vrifiez avec loutilde test des donnes structurs de Google

29

Outils et geekeries30

30

Google webmaster tools - GWT

31

Loutil GWT propose dsormais un tableau de bord sur les donnes structures.Book, product, web page, creative work, software application, place, etc.31

Outil de test des donnes structures

32

Loutil GWT propose dsormais un tableau de bord sur les donnes structures.

Cet outil permet de tester vos extraits enrichis et de les visualiser de la mme faon quils apparatront dans les rsultats de recherches.

Vous donne des informations sur les donnes enrichies extraites de la page

Permet de tester une adresse ou bien du code HTML

Fonctionne avec tous les types dextraits prsentement soutenus par Google ainsi quavec les profils dauteurs baliss avec rel=author

32

Schema creatorhttp://schema-creator.org/

33

Plusieurs outils sont maintenant disponibles pour crer des schmas de base reconnus par Google.

33

Microdata Generatorhttp://microdatagenerator.org/

34

Pour le rfrencement local, Local Business Microdata Generator: http://microdatagenerator.org34

WordpressSchema Creator Plugin

35

Schema Creator by Raven35

Drupalhttp://semantic-drupal.com/

36

Drupal dispose d'une fonctionnalit pour publier des donnes RDF. Guide disponible: http://semantic-drupal.com/36

Bing Webmaster Tools Markup Validation Tool

37

Validateur de balisage Bing

Vrifiez le balisage que vous avez ajout vos pages avec ce validateur de balisage.

Permet dobtenir un rapport qui affiche les balisages qui ont t dcouverts par le moteur, y compris Microdata, Microformats, RDFa, Schema.org, et OpenGraph. Pour commencer, il suffit de vous connecter ou de vous inscrire sur les Outils pour webmasters de Bing.37

Sindice: Un moteur de recherche smantique

38

Des millions de sites Web marquent leur contenu en utilisant RDF, microformats, microdonnes grande diffusion, Schema.org, RDFa, OpenGraph et plus encore.

Sindice vous aide trouver, comprendre et intgrer avec leur contenu.

Un bon moteur de "triplets", pour retrouver sur le nuage de l'information dj enrichie, RDF,38

Protgditeur ontologique

39

diteur ontologique open-source - Ontology editor and knowledge-base framework.39

Datalift

40

Datalift porte les donnes brutes structures venant de plusieurs formats (bases de donnes, CSV, XML) vers des donnes smantiques interconnectes sur le Web de donnes.40

Rfrences41

41

Rfrences (1)DfinitionWeb smantique WikipediaVue densemble et introductionSEO, the Semantic Web and Information DiscoverySchema.org Why Youre Behind if Youre Not Using ItFormats de donnes et vocabulairesOntologie et vocabulaire pour le e-commerce: Good RelationsOpen Graph ProtocolLe concept du Open Graph ProtocolRDFaMicroformatsSchema.org Les nouveaux schmas pour schema.org proposs par le W3CKnowledge GraphGoogle Knowledge Graph Limpact du Knowledge Graph pour les marques: What the New Google Plus Knowledge Graph Update Means For Brands42

42

Rfrences (2)OutilsFacebook Object DebuggerRaven Schema CreatorLocal Business Microdata GeneratorPlugin WordPress Schema CreatorGuide dutilisation de Drupal pour le web smantiqueOutil de test des donnes structures de GoogleValidateur de balisage de Bing Webmaster ToolsSindice Moteur de recherche smantiqueProtg diteur ontologique open-source Ontology editor and knowledge-base framework.Datalift Porte les donnes brutes structures venant de plusieurs formats (bases de donnes, CSV, XML) vers des donnes smantiques interconnectes sur leWeb de donnes.43

43

Rfrences (3)PlusArticle du Wall Street Journal sur le web smantiqueW3C Web smantiqueGoogle Rich SnippetsConvertir 100$CAN en 100$US sur GoogleRecherche Knowledge Graph de type carroussel: Jazz MusiciansRecherche Knowledge Graph: Marie Curierel=publisherrel author44

44

Merci !45

45