• 1. Outils de recherche et de veille surl'actualité (news, médias sociaux...)14 octobre 2014Marie-Laure Malingre, Alexandre SerresURFIST de Rennes
  • 2. 2Plus de 30 outils à utiliser
  • 3. 3SOMMAIRE PLAN• Quelques repères– 1/ Introduction : données,enjeux… sur la recherched’information d’actualités– 2/ Les outils : périmètre,typologies, principes• Comment cerner etsurveiller un sujetd’actualité sur le Web ?– 3/ Méthodologie de recherche– 4/ Quelle actualité du sujet– 5/ Comment trouver desjournaux, des journalistes,des sites de presse ?– 6/ Quels médias, quelles sourcessur le sujet ?– 7/ Quels acteurs concernés ?– 8/ Quelles données factuelles ?– 9/ Quelles interventionspubliques filmées ?– 10/ Quel impact dans lablogosphère et les réseauxsociaux ?– 11/ Quelle évolution dans letraitement du sujet sur le web ?
  • 4. Introduction : données, enjeux,questions sur la recherched’information d’actualités
  • 5. INTRODUCTION : repères sur les pratiquesmédiatiques en FranceSource : Baromètre TNS-SOFRES 2013 5
  • 6. 6INTRODUCTION : repères sur les pratiquesmédiatiques en France• Un intérêt important pourl’actualité, mais en légèrebaisse : 69 % des Français• Médias utilisés pour « avoirdes nouvelles » : (en 2013)• La télévision : 69 %• La radio : 33 %• Internet : 27 % (+ 20%depuis 2004)• La presse écrite : 24 % ;• Forte progression d’Internet :• pour approfondir un sujet (+25%)• avoir plusieurs points de vueSource :Baromètre des médias 2014, TNS-SOFRES(+24%)• Quelle confianceenvers les médias ?• Crédibilité globalemoyenne• La radio : média jugé leplus crédible (58 %)• Confiance en légèrehausse envers Internet :• Confiance : 37 % (35 en2013)
  • 7. 7INTRODUCTION : données sur les sitesd’information• Sites de presse et d’information parmi lesplus visités :• le Figaro et le Monde, en octobre 2014• 14ème et 15ème sites les plus consultés en France, selon Alexa• 5ème et 6ème (sur les sites français) ,selon l’OJD• Près de la moitié des internautes européens consultent lessites d’information (voir l’étude de Comscore, janvier 2012) :• Novembre 2011 : sur les 379 millions d’Européens ayantconsulté internet, + de 181 millions de visiteurs uniquessur les sites d’information• Internet premier média d’information pour unepart croissante de la population
  • 8. 8INTRODUCTION : quelles sources de traficvers les sites d’actualité ?• En France, en 2012:• Etude d’AT Internet,en août 2012, sur 19sites d’actualitéfrançais• Google : 39,7 % !• Facebook et Twitterà l’origine de < 4 % du trafic
  • 9. En France, janvier 2014 :• Google : 39 %• Facebook : 7,1%INTRODUCTION :quelles sources de trafic vers les sites d’actualité ?Source :JournalduNet
  • 10. 10INTRODUCTION : les outils de recherchecomme sources de trafic• « Effet Saint-Matthieu » :• Renforcement de la visibilitédes principaux sitesd’information français (LeMonde, le Figaro, NouvelObs…) sur Google News• Selon une étude (octobre2012) de Résonéo
  • 11. Les outils : périmètre,typologies, principes
  • 12. 12Cartographie des producteurs Périmètred’information médiatique en lignehttp://www.ardepmp.com/IMG/pdf/producteurs_d-info_en_ligne.pdf
  • 13. 13PérimètreDiversification des portes d’entréed’un article >Article de Marco Bertolini : Ecrirepour la presse web
  • 14. 14• 2 champs principaux :– Les outils de recherche sur les médias d’actualité• Les articles de presse• les dépêches d’agence, les communiqués• les ressources audio-visuelles– Les outils de recherche sur les ressources duweb social > « l’information en temps réel »• blogs• Twitter• …Périmètre
  • 15. 15• Prise en compte et mixage éventuel de 4types de spécialisations :– Le contenu :• Recherche sur l’information d’actualité– Le type de ressource internet :• Portails de presse, moteurs d’actualités, moteurs de blogs,de tweets, plateformes de curation…– Le média :• Texte, images, podcasts, vidéos…– La fonction :• Indexation, filtrage de l’information• Analyse de l’informationPérimètre
  • 16. Typologie et principes des outils16• Annuaires, répertoires, portails– Annuaires de presse– Portails spécialisés– Navigation et recherche dans une sélection deressources• Moteurs de recherche d’actualités– Modules spécialisés des moteurs de recherche duweb– Outils ciblés– Indexation automatique d’un corpus spécialisé
  • 17. Typologie et principes des outils17• Agrégateurs et bases de données depresse– Accès à des sources spécifiques de presse ouà un ensemble de sources de presse agrégéessur des plateformes unifiées• Outils d’analyse de l’actualité– Fonctionnalités spécifiques de traitement del’information d’actualité• Extraction, synthèse, cartographie, visualisation detendances, de relations…
  • 18. Typologie et principes des outils18• Outils et ressources du journalisme dedonnées :– Journalisme centré sur la recherche, l’exploration,le traitement et la visualisation d’ensembles dedonnées.– S’intègre dans le mouvement du big data,visant àmettre à disposition des collections diversifiées dedonnées– Sites ressources proposant des corpus dedonnées– Outils de traitement et de visualisation
  • 19. Typologie et principes des outils19• Outils du web social– Moteurs de blogs :• Recherche de blogs via les moteurs généralistes duweb• Outils spécialisés, permettant la recherche de blogs– Recherche sur les réseaux sociaux• Outils dédiés à la recherche sur Twitter, sur Facebook…• Moteurs de recherche temps réel sur les réseaux sociaux> métamoteurs
  • 20. Méthodologie de recherche sur unsujet d’actualité
  • 21. 21Démarche méthodologique• Défricher le sujet, trouver des mots-clés• Voir les derniers événements, l’actualité du sujet :• les moteurs de recherche d’actualités, les outils d’analyse (GoogleNews, NewsBrief)• Trouver des journaux, des journalistes, des sites de presse :• Les annuaires et portails spécialisés de presse• Qui parle de quoi ? Recherches sur les médias, les sources :• Les moteurs de recherche d’actualités, les outils d’analyse (GoogleNews, Pickanews)• Quels sont les acteurs concernés par le sujet ?• Les agrégateurs de presse (Europresse), les outils d’analyse del’actualité (NewsExplorer)• Quelles données brutes relatives à un sujet ?• Les sites et outils de data journalism
  • 22. 22• Retrouver des vidéos et des déclarations d’acteurs du sujet• Utiliser Voxalead News• Quel impact dans la blogosphère ?• Quel impact sur Twitter, les réseaux sociaux, les plateformesdu web social ?• Les outils de recherche dans les réseaux sociaux (Twitter Search,Topsy)• Quelle évolution dans le traitement du sujet ?• Google Trends, News Explorer• Retrouver des archives sur le sujet• Archives Google News• Faire de la veille sur le sujet• Les alertes, les flux RSS, les pages personnalisables, les outils decurationDémarche méthodologique
  • 23. Cerner un sujet d’actualité sur le web :Quelle actualité du sujet ?
  • 24. 24Les moteurs de recherche d’actualités• Modules ou services proposés par lesoutils de recherche• Agrégation de multiples sourcesd’actualité :• Presse, blogs, sites web…• Revues de presse automatisées• Services gratuits : alertes…• Nombreux moteurs d’actualité :• Précurseur : Google News• Modules spécialisés : Yahoo News,• Concurrence aiguë, enjeux économiquesimportants• Problèmes et conflits juridiques
  • 25. • Google News (Actualités) :- Créé à la suite du 11/09/01, en décembre 2001 (par Krishna Bharat)- Lancement officiel en 2003. Diffusion en continu d’infos sur l’actualité- Sélection de 55 000 sources indexées tous pays confondus• + de 500 sources sur la version française- Plus de 72 versions nationales en 30 langues différentes- Automatisation complète ; collecte et analyse de chaque source parun robot ; classement automatique des informations dans desrubriques prédéfinies- Visibilité des sites de presse dans Google News : étude 2012 de lasociété Resoneo, cf. Abondance, novembre 2012- Google et l’édition de presse- Nombreuses controverses au cours des dernières années- Actions d’apaisement de Google en direction des acteurs de la25presseLes moteurs d’actualités : Google News
  • 26. 26Les moteurs d’actualités : Google News• Google News (Actualités) :- Fonds pour l’innovation numérique de la presse de100 millions d’euros16 millions d’euros à23 médias de la pressefrançaise en 2013(près de 2 millionschacun)Source : Libération Ecrans
  • 27. 27Les moteurs d’actualités : Google News• Google News (Actualités) (source Café référencement :Google Actualités : quoi de neuf en 2014 ? )• Le public :• 1 Mrd d’utilisateurs voient des résultats News sur Google chaquesemaine• 6 Mrds de clics envoyés vers les sites de news chaque mois• L’algorithme• Classement selon : sujet, cluster, période de l’année, de la journée,signaux sociaux• Utilisation du News sitemap• Respect du fichier Robots.txt• Trafic• Baisse de trafic en visiteurs uniques sur Google News• Augmentation du trafic news sur google.fr via les résultats d’actualité• Indexation par le spider Google (il n’y a plus de spider spécifique)
  • 28. 28Les moteurs d’actualités : Google News• Google News (Actualités) :• Quoi de neuf pour 2014 ? (source :http://www.cafe-referencement.com/, rubrique GoogleActualités)• Google News en version Web App Mobile, lancée en décembre2013• Une version pour tablette• Lancement aux USA d’une possibilité pour les éditeurs d’envoyerun flux Choix des rédactions pour des catégories spécifiques enplus du flux global• Nouvel outil pour les éditeurs : Media Tools• Autres fonctions récentes : « In-Depth Articles », blocs d’actualitéextensibles
  • 29. 29Les moteurs d’actualités : Google News• Google News : 10 critères principaux de pertinence– Source : Actualités du site Abondance ( + 10 critères négatifs)– 1. L'autorité d'un site sur un sujet précis.– 2. La présence des mots clés demandés dans le titre de la page.– 3. L'autorité du nom de domaine en termes SEO.– 4. Les partages sociaux.– 5. Le fait d'être parmi les premiers à publier un article sur lesujet.– 6. Le nombre de citations par d'autres sites.– 7. Le fait que l'article soit unique et original.– 8. Le taux de clics dans les résultats de Google News.– 9. La qualité du contenu.– 10. L'utilisation d'un Sitemap spécifique de Google News
  • 30. 30Les moteurs d’actualités : Google NewsGoogle Actualités Onebox Actualités de Google web
  • 31. 31Les moteurs d’actualités : Google News• Les fonctionnalités :– La personnalisation :• Choix dans l’affichage desrubriques• Création de rubriquespersonnelles• Recherches d’informationslocales• Paramétrer la fréquencedes sources– La veille :• Syndication de fils RSS• Abonnement gratuit auxalertes :– par thèmes...
  • 32. 32Les moteurs d’actualités : Google NewsMenu déroulant pourla recherche avancéedepuis la fenêtre de saisiede la recherche simple
  • 33. 33Les moteurs d’actualités : Google News• Syntaxe de recherche :• intitle: et allintitle: : dans le titre des articles• intext: et allintext: : dans le texte des articles• inurl: : dans un site particulier• source: : sur une source précise• Source:Libération• location: : dans un pays précis• Location:Algérie• + date d’ajout dans Google Actualités• Option prédéfinie, archives ou intervalle personnalisé
  • 34. 34Les moteurs d’actualités : Google News• Recherche d’articles sur lesujet de la transitionénergétique– Requête sur la phrase« transition énergétique »– Personnalisation desrubriques Actualité (colonnede gauche) : sélectionne lescontenus récents dans ledomaine• Créer une alerte (en bas de lapage)– Nécessite un compte Google
  • 35. 35Les moteurs d’actualité : News Brief• NewsBrief : l’information en temps réel• Moteur développé par l’Union Européenne• Collecte sur + 4300 sources :• 1600 portails d’information, 20 flux d’actualités commerciales,sites spécialisés ; en 60 langues• Surveillance quotidienne :• Mises à jour toutes les 10 mns• Classement des informations• Graphique des 10 derniers événements marquants• Clustérisation : par thèmes, par Directions Générales del’UE• Possibilité d’abonnements RSS, mais pas par rubriques• Index de > 20 millions d’articles
  • 36. 36News Brief : voir l’actualité du sujet• Sur NewsBrief :• Voir si la transition énergétiqueest à la une (Dépêches)• Vérifier si le sujet était présent àla une la veille (Dernières 24heures)• Voir les Domaines de politiqueseuropéennes (EU Policy Areas) etles Thèmes dans lesquels le sujetde la transition énergétique estprésent• Consulter la liste des sources(Sources list)
  • 37. 37News Brief : voir l’actualité du sujet• Sur NewsBrief :• Requête avancée• Retrouver les articlesconsacrés à la transitionénergétique parus :• dans Le Monde, Libération,Alternatives économiques,Huffington Post• depuis le 1/10/14• Intérêt principal deNewsBrief :– Les événements les plusrécents, l’actualité« chaude »
  • 38. 38Europe Media Monitor et NewsBrief• Europe Media Monitor : portails d’information du JointResearch Center (JRC) de la Commission Européenne• Collecte, analyse, cartographie… de très nombreusessources d’information, en 60 langues• Trois portails complémentaires :• NewsBrief : actualité en temps réel• NewsExplorer : analyse de l’information• MediSys : information médicale• + EMM-Labs
  • 39. 39• QWANT :Les moteurs d’actualité : Qwant• Moteur généraliste frrançais lancé en janvier 2013• JM Rozan, Société Pertimm, E. Leandri +entrée de Axel Springeren 2014• Positionnement comme moteur de recherche de découverte• 500 millions de recherches en 2013 (1200 milliards pourGoogle), 1,2 milliard / estimations pour 2014• Fondé sur plusieurs technologies big data• Politique annoncée de respect de la vie privée• Contenus : texte, photos, vidéos, actualité, presse• Présent dans 25 pays et accessible en 15 langues• Possibilité de géolocaliser une recherche• Prise en compte du contexte social des contenus : Twitter,(Voir JDN)Facebook, Google+ et LinkedIn ; utilisation de filtres
  • 40. 40• QWANT :Les moteurs d’actualité : Qwant• Originalité dans la présentation des résultats•Affichage sur une seule page en 5 colonnes :• Web, actualités, Qnowledge graph, social, shopping• Onglet Médias• Lancement du “carnet de notes” avec système de Follower
  • 41. 41Les moteurs d’actualités : autres outils• Anglophones :• Yahoo News• Topix : 2004, agrégateurd’actualités localisées• Européens :• Eufeeds / EuropeanJournalism Centre• Francophones :– Yahoo France Actualités– Webplanete news :• 884 sources d’informationfrancophones– Twikle :• Agrégateur d'actualités et decontenus lancé en octobre2012• Indexe les contenus les pluspartagés sur les réseauxsociaux• Recherche dans les tweets
  • 42. 42Faire de la veille sur un sujet d’actualité :les alertes• Répétition automatique d’une requête à chaque miseà jour d’une source d’information• Résultats adressés périodiquement à l’utilisateur– par messagerie ou sous forme de flux RSS• L’alerte permet, sans avoir à réinterroger la sourced’information, de surveiller :– L’évolution d’un thème– Les travaux d’un auteur ou d’une institution– Les nouveaux articles de la revue que l’on suit• Sur le sujet de la transition énergétique :– Créer une alerte sur Google Actualités
  • 43. Comment trouver des journaux, desjournalistes, des sites de presse ?
  • 44. 44Trouver des journaux et sites de presse3. Recherches d’actualités : Annuaires de la presse et des médias• Pour trouver des journaux dans le monde entier :– Newspapermap.com (http://newspapermap.com/FR.html) :• annuaire cartographique de la presse mondiale• Plus de 10 000 journaux géolocalisés• Option de traduction par Google Translate• Guide Presse :– annuaire de la presse francophone en ligne• Journaux et magazines• Giga-Presse :– Annuaire francophone de la presse en ligne• 612 journaux francophones sélectionnés• Giga Presse Internationale :10 000 journaux et magazines internationaux dans la rubrique« Monde » (beaucoup sont extraits de l’ODP)> Exercice : rechercher des titres de magazines professionnels français surl’environnement et l’énergie
  • 45. 45Trouver des journaux et sites de presse3. Recherches d’actualités : Annuaires de la presse et des médiasRetrouver des « Unes » de journaux :• SPQR :– Les unes du jour des journaux régionaux français surle site du Syndicat de la Presse quotidiennerégionale• Newseum :– Plateforme américaine– Partenariat avec plus de 2000 journaux dans lemonde– Tri par région, carte, « unes » archivées
  • 46. 46Trouver des journalistes• Categorynet.com (portail de la presse et des médias) :– Créé en 1998 par Greg Manset ; entreprise de presse etréseau de journalistes• Comprend un annuaire de liens– Pour trouver des annuaires de journalistes• AnnuaireJournalistes Réseau de pigistes :– Annuaire de près de 8700 journalistes freelance– Possibilité de recherche par thématiques> Exercice : trouver des journalistes spécialiséssur les questions d’énergie etd’environnement
  • 47. 47Autres annuaires et portails de la presse etdes médias3. Recherches d’actualités : Annuaires de la presse et des médias• PQR :– Portail du Syndicat de la PQR– Toutes les informations sur la PQR• Info.presse.fr :– Portail commercial tous publics ; vente d’abonnements– Plus de 1000 titres de presse disponibles à l’abonnement
  • 48. Cerner un sujet d’actualité sur le Web :quels médias, quelles sources sur lesujet ?
  • 49. Recherche sur les sources avec Google Actualités49• Google News (Actualités) :– Filtrage possible sur la source > untitre particulier– Filtrage sur le lieu– Personnalisation relative auxsources (compte Google)• Personnalisation en augmentant lafréquence pour la catégorie choisie oucréée (énergie)• Ajuster la source / Ajuster lafréquence d’une source d’actualité,avec un compte Google• Paramètres : personnalisation sur lesblogs / les communiqués de presse– Après connexion, création d’unerubrique personnalisée Energie parrequête, filtrage sur le pays dessources, sur l’édition ou la langueRubrique Energie surles sources françaises
  • 50. 50• Pickanews :Un moteur d’actualités : Pickanews– Edité par Press Index, société spécialisée sur la veille et lesmédias• Lancé en mai 2010– Moteur plurimédia sur + de 50 000 sources d’information enEurope :• Presse écrite : > 30 000 titres• Web : > 40 000 sites d'information et blogs• Radio et TV : > 200 chaînes de radio et télévision• Réseaux sociaux : 3 (Facebook, Twitter, YouTube)– Outil à la fois gratuit et payant :• Consultation gratuite des résumés• Abonnements payants pour texte intégral des articles,fonctions de veille...
  • 51. 51Un moteur d’actualités : Pickanews• Fonctionnalités gratuites intéressantes :• Filtrages possibles sur :• Les médias• La période (2 derniers mois)• Le sujet• Un titre de presse• Un pays• Graphiques sur :• L'évolution des citations• La ventilation des résultats par types de média• Le top des citations :• Le top des sources• Recherches sur un nom, une marque, une sociétéPour en savoir plus, voir Veille presse avec Pickanews
  • 52. 52Recherche sur les médias et les sources• Sur Pickanews :• Faire une recherche sur la transition énergétique en France• Tester différentes requêtes• Identifier :• les médias• les sources sur internet• Les radios• Les télévisions• Les journaux• qui ont le plus parlé du sujet depuis deux mois• Repérer les périodes où l’on a le plus parlé du sujet• Retrouver des émissions de radios• Chercher les articles de la presse locale sur le sujet
  • 53. 53Recherche sur les sources avec VoxEurop3. Recherches d’actualités : Annuaires de la presse et des médias• VoxEurop :– Site d’information créé par un consortium de 4 magazineseuropéens, spécialisés dans l’actualité internationale (dont« Courrier international »)– Créé en 2009 à Paris, sous le nom PressEurop– Soutien de la Commission européenne– Sélection d’articles dans plus de 200 titres de la presseinternationale– Charte éditoriale : « participer au développement du débatdémocratique informé au sein de l’UE »• TP sur VoxEurop :– Chercher des articles de la presse européenne sur latransition énergétique
  • 54. 54Les agrégateurs de presse• Forte croissance desagrégateurs de presse etde veille médias depuisquelques années(Etude SerdaLab 2009/2010L’information numériqueprofessionnelle en France : Lemarché et les tendances en 2009-2010.)• Diversification desprestations proposées– Services d’agrégation et derecherche dans les contenuspresse– Prestations de services autourde ces contenus– Secteur de la e-réputation• Extension du périmètredes sources– Presse, internet, télévision,radio• Personnalisation del’offre• Quelques grandsacteurs :– Europresse– Factiva
  • 55. 55Les agrégateurs de presse : Europresse• Europresse: www.europresse.com– Agrégateur canadien (Cedrom-SNI)– 10231 sources reconnues– Plus de 3000 titres de presse de près de100 pays (dominante : Etats-Unis,Canada, France ; langue anglaise 80%)– Plus de 25 ans d’archives– Actualité internationale, nationale,régionale, locale + BDD entreprises etprofils biographiques– Presse généraliste / spécialisée,communiqués,blogs thématiques, sitesweb... en accès gratuit : recherche de sourcespossible
  • 56. 56Les agrégateurs de presse : Europresse
  • 57. 57• Recherche sur les sources dansEuropresse :– Filtrage sur les types de sources– Filtrage par source spécifique– Filtrage sur les sources de régionsspécifiques– Filtrage sur la date– Possibilité de tri des résultats parsources– Recherche de journaux sousformat PDF• Faire une recherche sur latransition énergétique etidentifier les sources qui en ontle plus parlé– Presse nationale, régionale, pressespécialisée– TitresLes agrégateurs de presse : Europresse
  • 58. 58Les agrégateurs de presse : Factiva• FACTIVA / Dow Jones : http://www.factiva.com/– “Factiva propose aux entreprises actualités etinformations essentielles avec des outils et services delivraison de contenu. La base Factiva (...) inclutl’association exclusive Wall Street Journal, FinancialTimes®, DJ et Reuters, AFP, AP… » (Journal du Net)– 35 000 sources , 900 fils d’agences, 200 pays, 28langues : presse papier et web, 35 ans d'archives– Accessible par abonnement
  • 59. 59Les agrégateurs de presse : Factiva• Nombreuses possibilités :– requêtes complexes :– Filtrage sur la langue, les dates..– Affinement sur type de sources, de documents, dates,sujets…– Alertes• Voir Guide Formadoct sur l’utilisation de Factiva(dernière mise à jour décembre 2012)
  • 60. Cerner un sujet d’actualité sur le Web :quels acteurs concernés par le sujet ?
  • 61. 61• Europresse, http://www.europresse.com/• Recherche biographique :• Par nom ou mot clé• Dans différentes sources• Possibilité de rechercheavancée dans une sourcedonnéeEuropresse
  • 62. 62Les outils d’analyse de l’actualité : NewsExplorer• NewsExplorer : analyse multilingue• Produit également par Europe Media Monitor• Couplage avec NewsBrief• Analyse de l’information une fois par jour• Résumé des 20 faits marquants• 21 langues• Nombreuses fonctionnalités :• Carte des lieux de l’actualité• Analyse des actualités : tous les articles sur un sujet…• Chronologie des événements• Fiches sur personnalités• Visualisation des relations entre personnes• Recherche rétrospective sur les événements majeurs d’un pays
  • 63. • NewsExplorer :• Recherches sur le thème de la transitionénergétique :• Nécessité de passer par les mots-clésde l’outil• Chercher le thème dans les sujetsrécemment traités, ou essayerdifférents mots-clés• Explorer les différents clusters63Les outils d’analyse de l’actualité :News Explorer
  • 64. 64Les outils d’analyse de l’actualité :NewsExplorerExemple de requête sur Edward SnowdenExplore Relations :visualisation despersonnes ou desorganisations lesplus fréquemmentassociées à lapersonne affichéeRelated People :personnes les plusfréquemmentmentionnéesdans les clusters surle sujet,avec le nombre dementionsAssociatedPeople :personnesmentionnéesen même temps quela personne affichéedans le cluster
  • 65. 65Les outils d’analyse de l’actualité :NewsExplorerOther Names :noms d’organisations ou d’événementsles plus mentionnés autour d’unévénement, d’une date…Quotes from :citations de la personne,dans différentes languesQuotes about :citations à propos de la personne,dans différentes languesRelatedStories :autres clustersd’actualités,dans lesquels lapersonne est leplus souventcitée
  • 66. 66Les outils d’analyse de l’actualité :News Silobreaker• News Silobreaker :– Outil d’analyse en temps réel de l’actualité– Possibilité de requêtes avancées– Analyse des relations (Network) entre des entitésnommées (personnes, pays, villes…) :• Cartographie des relations de co-occurrence entreentités• Analyse du volume de contenus– Analyse de tendances (Trends) :• Nombre d’articles sur un sujet, une entité…– Analyse des points chauds (Hot Spots)• Voir article de C. Deschamps
  • 67. Les outils d’analyse de l’actualité :Les outils de visualisation de l’actualité :News SilobreakerNewsmap• Newsmap :– Application de visualisation de l’actualité– Développée par un ingénieur designeraméricain, Markos Wescamp– Représentation des actualités de 15 pays,sous forme de vignettes proportionnelles aunombre d’articles ;– Accès aux articles de presse
  • 68. Les outils de cartographie de l’actualité :Infomous :Infomous– Permet de naviguer visuellement dans différentes sources– Détection des tendances de l’actualité•Fonctionnement :– Collecte des informations, à partir de différentes sources :• Fils RSS• Site web• Requête sur un mot-clé : sur Twitter, Facebook, Google…– Génération de cartes sémantiques à partir de ces sources :• Représentation des principaux mots-clés, des liens• Affichage de la source
  • 69. InfomousLes outils de cartographie de l’actualité :Infomous
  • 70. Les outils de cartographie de l’actualité :InfomousInfomous• Possibilité de créer soi-même des nuages de mots-clés :
  • 71. Quelles données brutes sur un sujet ?Le journalisme de données
  • 72. 72• Définition :Chercher des données :le journalisme de données• « Le journalisme de données (data journalism en anglais), oujournalisme de bases de données (database journalism), est unmouvement visant à renouveler le journalisme par l'exploitation et la miseà la disposition du public de données statistiques » (Wikipedia)• Repères :• Des origines anciennes :• La carte du choléra à Londres en 1854, par John Snow.• Diagramme des causes de mortalité au sein de l'armée en Orient parFlorence Nightingale.• Essor récent du journalisme de données, symptôme du « Big Data »• 2006 : 1ère apparition du terme, par Adrian Holovaty, créateurd’EveryBlock• Août 2010 : 1ère conférence internationale du datajournalism• 2010 : utilisation des données massives de Wikileaks, par les grandsquotidiens internationaux (ex. du Guardian)
  • 73. 73Chercher des données :le journalisme de données• Exemples de datajournalisme :• Très nombreux exemples, sur tous les sujets, dans tousles domaines, sur toutes les données• Voir dans le Guide du datajournalisme :• la base de données des salaires des fonctionnairesgouvernementaux développée par The TexasTribune• De la visualisation :• Voir «La carte du déclin du communisme municipal dans les banlieues» sur Le Monde• Datajournalismeet visualisation de données : des exemples• Des analyses de corpus de textes :• L’analyse des discours de la campagne présidentielle de 2012
  • 74. 74Chercher des données :le journalisme de données• Exemples de datajournalisme :• L’utilisation des données d’ameli.direct.fr (voir sur Guide dudatajournalisme)
  • 75. 75Chercher des données :le data journalisme• Guardian DataBlog :• Mise à disposition sur le blog :• de données brutes• d’outils de recherche etd’exploration des données• d’outils de visualisation desdonnées• Exemples :• Elections US• Notes de frais des députésanglais• La révolution ukainienne avec13 000 photos Instagram• Dépenses gouvernementales
  • 76. 76Chercher des données :le data journalisme• OTMedia, Observatoire transmedia• Projet de recherche national (financement ANR)• Novembre 2010 – Novembre 2013• Partenariats multiples : INA, INRIA, AFP, Sorbonne nouvelle…• Exploitation de données des médias• Objectifs :• « …mettre en place une plateforme d’analyse des différents fluxmédiatiques pour détecter, circonscrire, suivre, mesurer, analyseret étudier la propagation des évènements médiatiques et leursdérivés »• Exemple :• « La crise syrienne, une vue de France au printemps 2012 »
  • 77. 77Chercher des données :la visualisation de données mondialesDeux sites de visualisation de statistiquesmondiales :•GapMinder :• Outil de visualisation de statistiques mondiales, sur lasanté publique• Créé par Hans Rosling, professeur de santé publique• Consultation et utilisation interactive de statistiquesmondiales• Exemple du graphique surl’évolution de l’espérance de vie dans le monde, depuis 1800• Nombreux usages pédagogiques• Ressources sur ThotCursus•WorldMapper :• Données démographiques• Cartes interactives
  • 78. 78• Ressources :Chercher des données :le data journalisme• Guide du datajournalisme• définition et repères sur le datajournalism• Exemples, études de cas, modes defonctionnement• GlobalVoices,un manuel du journalisme de données• INA global : le journalisme de données• Géoconfluences : Datajournalismeet visualisation de données• Liste du Guardian Datablog
  • 79. Cerner un sujet d’actualité sur le Web :quelles interventions publiques filmées ?
  • 80. 80Les moteurs d’actualités : recherches vidéos• Apport des outils de recherche vidéo pourretrouver de l’information d’actualité• Voxalead News, http://voxaleadnews.labs.exalead.com/• Création en collaboration avec Vecsys et le CNRS-LIMSI dansle cadre du projet Quaero.• Recherche dans les vidéos et fichiers audios de chaînesd’information• Affichage possible de l’actualité récente par graphiques et tags• Chaînes : CNN, france 24, iTélé, LCI, BBC, BFM, Europe 1, etc.• Adaptation du moteur de recherche Exalead• Recherche dans un grand nombre de podcasts (plus de 150 000mis à jour quotidiennement)• 9 langues : Français, Anglais, Mandarin, Arabe, Russe, Espagnol,Italien, Allemand et Hollandais.
  • 81. 81Les moteurs d’actualités : recherches vidéos• Combine des technologies dereconnaissance de la parole etd’indexation texte• Transcription et séquençage :permet de sélectionner unpassage précis de la vidéo• Affinement : chaînes spécifiques,termes associés, personnes,organisme, évènement,localisation• Différents types d’affichage etd’accès
  • 82. 82Les moteurs d’actualités : recherches vidéosRecherchepar motdans lavidéoVoxaleadRequête sur Keith AlexanderTexte de la vidéo et séquençage: passages cliquables amènentdirectement à l’endroit choisidans la vidéo (déficiencespossibles dans la transcription)
  • 83. Les moteurs d’actualités : recherches vidéosTexMix• Projet INRIA, IRISA, CNRS, INSA, Quaero, UniversitéRennes 1• Structuration, navigation dans une collection dejournaux TV83• Le principe de l’application• Segmentation thématique à partir de transcription de la parole• Caractérisation des segments obtenus• Extraction de mots clés• Enrichissement des séquences par des informations sur lespersonnes ou les locutions citées
  • 84. 84Les moteurs d’actualités : recherches vidéos• Les modules de recherche de vidéos des moteursgénéralistes• Exalead Vidéo• Google Vidéo• Yahoo Vidéo• Les plateformes spécialisées• Youtube• Blinkx
  • 85. Cerner un sujet d’actualité sur le Web :quel impact dans la blogosphère et lesréseaux sociaux?
  • 86. 86• Tendances :Outils de recherche de blogs– Baisse d’intérêt des grands moteurs de recherche pour les blogs :• Exemples de Google Blog Search ou de Technorati : plus de recherchevraiment spécifique sur les blogs• Sur Google, intégration récente de l’onglet Blog dans Google Actualités– Un métamoteur intéressant : IceRocket– Quelques petits moteurs de recherche :• Un moteur personnalisable : Keyblog• Les annuaires de blogs :– Une liste d’annuaires de blogs : LesAnnuaires, sectionBlogs– Quelques annuaires francophones, tous publics :• Annuaire de Blogs ADB :– 50 000 blogs recensés• Tout le monde en blogue– Des outils propres aux plateformes de blogs :• L’annuaire des blogs sur OverBlog• Pour les blogs scientifiques :– Hypothèses : en SHS
  • 87. 87Moteurs de recherche de blogs : IceRocket• Module spécialisé du métamoteur IceRocketIceRocket, outil de veille : recherche dans les blogs, les actualités,Twitter, Facebook• Pour la recherche sur les blogs– Recherche avancée : auteur, recherche de posts, sur le titre du post,sur le tag du post, filtrage sur blog spécifique, sur lien du post, sur ladate– Présentation des résultats de la recherche par dates– + résultats des posts publiés dans un intervalle de dates– Tri des résultats par langue– Fil RSS de la recherche– Fonction Trends > graphique de la popularité des mots clés utilisés
  • 88. 88Recherche sur Twitter• Méthodes de recherche des tweets :– Moteur de Twitter : Twitter Search• >1000 tweets reçus par seconde (2010)• Traitement de 12 000 requêtes par seconde– Moteurs de recherche spécialisés, en tempsréel : Topsy, SnapBird, twXplorer– Moteurs de recherche généralistes : Google…• Intégration des tweets dans les résultats– Applications autour de Twitter
  • 89. 89Recherche sur Twitter : Twitter Search• Moteur de Twitter,racheté en 2008• Nombreusesfonctionnalités :• Interface de recherchebooléenne• Recherche sur leshashtags• Recherche sur unutilisateur• Recherche géographique• Recherche sur lessmileys
  • 90. 90Recherche sur Twitter• Recherche sur Twitter Search :– Termes de requêtes :• Hashtag : #transitionenergetique• Mot clé : transition energetique• Observer les réactions sur Twitter• Chercher un compte Twitter spécialisé• Comparer les résultats avec Topsy
  • 91. 91Recherches booléennesRecherchesur unsite, unutilisateurRecherche sur Twitter : TopsyClassementparpertinence,par dateRecherche suranciens tweets
  • 92. 92Recherche sur Twitter : Topsy• Plusieurs possibilitésde filtrage desrésultats :• Par périodes depublication• Par types de supports• Par « Experts » :utilisateurs ayant leplus cité le mot-clé
  • 93. 93• twXplorer :Recherche sur Twitter : twXplorer– Nouvel outil spécialisé sur Twitter, lancé en 2013– Développé par le Knight Lab, de la Northwestern University of Illinois– Outil puissant, toujours en phase beta– 13 langues proposées– Nécessité de se connecter avec son compte Twitter– Requête sur un mot-clé ou un hashtag :• Sélection des 500 derniers tweets sur le sujet• Exclusion des doublons• Affichage des 100 premiers tweets– Tableau de bord avec des possibilités d’affinement :• Sur des termes, des hashtags– Affichage des liens contenus dans les tweets– Voir “twXplorer nouveau moteur de recherche pour Twitter” et “twXplorer,la recherche intelligente sur Twitter”
  • 94. 94Recherche sur Twitter : twXplorer• Le tableau de bord de twXplorer :
  • 95. Moteurs de recherche en temps réel• Information de dernière minute, rapidité d’indexation• Essor des moteurs en temps réel, avec :95– Syndication de contenus, News des médias, Réseaux sociaux,Twitter et micro-blogging• Nombreux moteurs autonomes, intervention desgéants Google, Yahoo, Bing• Demande d’instantanéité :– Mais effets pervers du temps réel
  • 96. Moteurs de recherche en temps réel• Principaux critères, selon Comparatif de 14moteurs, de C. Deschamps :96– Nombre et type de sources collectées (« multimoteurs »)– Représentation graphique des données :• Graphiques de tendances…– Possibilité d’abonnement aux flux RSS par requêtes– Défilement de l’information en temps réel
  • 97. 97Moteurs de recherche en temps réel• Suivi de l’actualité en temps réel :– Exemple sur SocialMention, Samepoint, 48ers…• Suivi d’un thème sur Twitter, les réseaux sociaux…• Outils de veille sur un sujet, une personne…• Analyse, représentation de l’information
  • 98. 98Moteurs de recherche en temps réel :Social Mention Search• Social Mention, moteur social de recherche entemps réel, veille sur les réseaux sociaux– Diversité et nombre de sources indexées :• Blogs• Microblogging• Commentaires de blogs• Plateformes de partage de signets• Sites de news généralistes• Sites d’événements• Images / Vidéos / Audio• Questions-réponses• Réseaux sociaux
  • 99. 99• Interface derechercheMoteurs de recherche en temps réel :Social Mention Search– Interface de recherchesimple• Filtrage possible par lescatégories de sources• Filtrage par les sourceselles-mêmes
  • 100. 110000Moteurs de recherche en temps réel :Social Mention Search• Interface de recherche– Interface de recherche avancée• Affichée à la suite d’une première requête
  • 101. Cerner un sujet d’actualité sur le Web :Quelle évolution dans le traitement ?
  • 102. 102Repérer les tendances : Google Trends• Google Trends– Permet de voir l’évolution de la fréquence des termes de recherche– Exemple sur la transition énergétique :
  • 103. 103Repérer les tendances : Google Trends• Google Trends : fonctionnalités– Chiffres indiqués :• Pas le nombre exact de requêtes• mais le rapport entre la quantité de recherches pour un termedonné, par rapport au nombre total de recherches effectuéessur Google au cours de la même période– Filtrages possibles sur :• Les modules de Google (Web, Actualités, Images…)• Les dates• Les pays• Les catégories• Les mots-clés associés
  • 104. 104Repérer les tendances : Google TrendsExemple sur « energy transition »
  • 105. 105Suivre une épidémie : Google Flu• Google Flu Trends :– Suivi en temps réel de deux épidémiesmondiales : la grippe et la dengue– Application de Big Data développée parGoogle :• Analyse des millions de requêtes des internautessur la grippe et la dengue• Localisation, détection des tendances• Application reconnue par les épidémiologistes
  • 106. Recherche d’archives avec Google News Archive106• La recherche sur les archives :• Sur Google News :– Archives de presse : http://news.google.com/newspapers– Lancé en 2006, généralisé en 2008– Recherche dans 200 ans d’archives de journaux– Mais en 2011 : arrêt du projet de numérisation des archives– Actuellement, restent disponibles : 3,5 millions depublications issus de plus de 2000 journaux dans le monde,remontant jusqu’à 1752
  • 107. • European Library :• Données des bibliothèques nationales européennes• Accès à leurs ressources numériques et bibliographiques• Rubrique “Historic Newspapers” pour les archives de journaux107Recherche d’archives : European LIbrary
  • 108. Ressources• Pour retrouver les ressources explorées :– Liste Diigo « Veille Actualités »
    Please download to view
  • All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
    ...

    Outils de recherche et de veille sur l'actualité

    by urfist-de-rennes

    on

    Report

    Download: 0

    Comment: 0

    17,579

    views

    Comments

    Description

    Support du stage "Outils de recherche et de veille sur l'actualité", organisé par l'URFIST de Rennes, le 14 octobre 2014 (enrichissement et mise à jour du support précédent : datajournalisme, twitter, texmix...)
    Download Outils de recherche et de veille sur l'actualité

    Transcript

    • 1. Outils de recherche et de veille surl'actualité (news, médias sociaux...)14 octobre 2014Marie-Laure Malingre, Alexandre SerresURFIST de Rennes
  • 2. 2Plus de 30 outils à utiliser
  • 3. 3SOMMAIRE PLAN• Quelques repères– 1/ Introduction : données,enjeux… sur la recherched’information d’actualités– 2/ Les outils : périmètre,typologies, principes• Comment cerner etsurveiller un sujetd’actualité sur le Web ?– 3/ Méthodologie de recherche– 4/ Quelle actualité du sujet– 5/ Comment trouver desjournaux, des journalistes,des sites de presse ?– 6/ Quels médias, quelles sourcessur le sujet ?– 7/ Quels acteurs concernés ?– 8/ Quelles données factuelles ?– 9/ Quelles interventionspubliques filmées ?– 10/ Quel impact dans lablogosphère et les réseauxsociaux ?– 11/ Quelle évolution dans letraitement du sujet sur le web ?
  • 4. Introduction : données, enjeux,questions sur la recherched’information d’actualités
  • 5. INTRODUCTION : repères sur les pratiquesmédiatiques en FranceSource : Baromètre TNS-SOFRES 2013 5
  • 6. 6INTRODUCTION : repères sur les pratiquesmédiatiques en France• Un intérêt important pourl’actualité, mais en légèrebaisse : 69 % des Français• Médias utilisés pour « avoirdes nouvelles » : (en 2013)• La télévision : 69 %• La radio : 33 %• Internet : 27 % (+ 20%depuis 2004)• La presse écrite : 24 % ;• Forte progression d’Internet :• pour approfondir un sujet (+25%)• avoir plusieurs points de vueSource :Baromètre des médias 2014, TNS-SOFRES(+24%)• Quelle confianceenvers les médias ?• Crédibilité globalemoyenne• La radio : média jugé leplus crédible (58 %)• Confiance en légèrehausse envers Internet :• Confiance : 37 % (35 en2013)
  • 7. 7INTRODUCTION : données sur les sitesd’information• Sites de presse et d’information parmi lesplus visités :• le Figaro et le Monde, en octobre 2014• 14ème et 15ème sites les plus consultés en France, selon Alexa• 5ème et 6ème (sur les sites français) ,selon l’OJD• Près de la moitié des internautes européens consultent lessites d’information (voir l’étude de Comscore, janvier 2012) :• Novembre 2011 : sur les 379 millions d’Européens ayantconsulté internet, + de 181 millions de visiteurs uniquessur les sites d’information• Internet premier média d’information pour unepart croissante de la population
  • 8. 8INTRODUCTION : quelles sources de traficvers les sites d’actualité ?• En France, en 2012:• Etude d’AT Internet,en août 2012, sur 19sites d’actualitéfrançais• Google : 39,7 % !• Facebook et Twitterà l’origine de < 4 % du trafic
  • 9. En France, janvier 2014 :• Google : 39 %• Facebook : 7,1%INTRODUCTION :quelles sources de trafic vers les sites d’actualité ?Source :JournalduNet
  • 10. 10INTRODUCTION : les outils de recherchecomme sources de trafic• « Effet Saint-Matthieu » :• Renforcement de la visibilitédes principaux sitesd’information français (LeMonde, le Figaro, NouvelObs…) sur Google News• Selon une étude (octobre2012) de Résonéo
  • 11. Les outils : périmètre,typologies, principes
  • 12. 12Cartographie des producteurs Périmètred’information médiatique en lignehttp://www.ardepmp.com/IMG/pdf/producteurs_d-info_en_ligne.pdf
  • 13. 13PérimètreDiversification des portes d’entréed’un article >Article de Marco Bertolini : Ecrirepour la presse web
  • 14. 14• 2 champs principaux :– Les outils de recherche sur les médias d’actualité• Les articles de presse• les dépêches d’agence, les communiqués• les ressources audio-visuelles– Les outils de recherche sur les ressources duweb social > « l’information en temps réel »• blogs• Twitter• …Périmètre
  • 15. 15• Prise en compte et mixage éventuel de 4types de spécialisations :– Le contenu :• Recherche sur l’information d’actualité– Le type de ressource internet :• Portails de presse, moteurs d’actualités, moteurs de blogs,de tweets, plateformes de curation…– Le média :• Texte, images, podcasts, vidéos…– La fonction :• Indexation, filtrage de l’information• Analyse de l’informationPérimètre
  • 16. Typologie et principes des outils16• Annuaires, répertoires, portails– Annuaires de presse– Portails spécialisés– Navigation et recherche dans une sélection deressources• Moteurs de recherche d’actualités– Modules spécialisés des moteurs de recherche duweb– Outils ciblés– Indexation automatique d’un corpus spécialisé
  • 17. Typologie et principes des outils17• Agrégateurs et bases de données depresse– Accès à des sources spécifiques de presse ouà un ensemble de sources de presse agrégéessur des plateformes unifiées• Outils d’analyse de l’actualité– Fonctionnalités spécifiques de traitement del’information d’actualité• Extraction, synthèse, cartographie, visualisation detendances, de relations…
  • 18. Typologie et principes des outils18• Outils et ressources du journalisme dedonnées :– Journalisme centré sur la recherche, l’exploration,le traitement et la visualisation d’ensembles dedonnées.– S’intègre dans le mouvement du big data,visant àmettre à disposition des collections diversifiées dedonnées– Sites ressources proposant des corpus dedonnées– Outils de traitement et de visualisation
  • 19. Typologie et principes des outils19• Outils du web social– Moteurs de blogs :• Recherche de blogs via les moteurs généralistes duweb• Outils spécialisés, permettant la recherche de blogs– Recherche sur les réseaux sociaux• Outils dédiés à la recherche sur Twitter, sur Facebook…• Moteurs de recherche temps réel sur les réseaux sociaux> métamoteurs
  • 20. Méthodologie de recherche sur unsujet d’actualité
  • 21. 21Démarche méthodologique• Défricher le sujet, trouver des mots-clés• Voir les derniers événements, l’actualité du sujet :• les moteurs de recherche d’actualités, les outils d’analyse (GoogleNews, NewsBrief)• Trouver des journaux, des journalistes, des sites de presse :• Les annuaires et portails spécialisés de presse• Qui parle de quoi ? Recherches sur les médias, les sources :• Les moteurs de recherche d’actualités, les outils d’analyse (GoogleNews, Pickanews)• Quels sont les acteurs concernés par le sujet ?• Les agrégateurs de presse (Europresse), les outils d’analyse del’actualité (NewsExplorer)• Quelles données brutes relatives à un sujet ?• Les sites et outils de data journalism
  • 22. 22• Retrouver des vidéos et des déclarations d’acteurs du sujet• Utiliser Voxalead News• Quel impact dans la blogosphère ?• Quel impact sur Twitter, les réseaux sociaux, les plateformesdu web social ?• Les outils de recherche dans les réseaux sociaux (Twitter Search,Topsy)• Quelle évolution dans le traitement du sujet ?• Google Trends, News Explorer• Retrouver des archives sur le sujet• Archives Google News• Faire de la veille sur le sujet• Les alertes, les flux RSS, les pages personnalisables, les outils decurationDémarche méthodologique
  • 23. Cerner un sujet d’actualité sur le web :Quelle actualité du sujet ?
  • 24. 24Les moteurs de recherche d’actualités• Modules ou services proposés par lesoutils de recherche• Agrégation de multiples sourcesd’actualité :• Presse, blogs, sites web…• Revues de presse automatisées• Services gratuits : alertes…• Nombreux moteurs d’actualité :• Précurseur : Google News• Modules spécialisés : Yahoo News,• Concurrence aiguë, enjeux économiquesimportants• Problèmes et conflits juridiques
  • 25. • Google News (Actualités) :- Créé à la suite du 11/09/01, en décembre 2001 (par Krishna Bharat)- Lancement officiel en 2003. Diffusion en continu d’infos sur l’actualité- Sélection de 55 000 sources indexées tous pays confondus• + de 500 sources sur la version française- Plus de 72 versions nationales en 30 langues différentes- Automatisation complète ; collecte et analyse de chaque source parun robot ; classement automatique des informations dans desrubriques prédéfinies- Visibilité des sites de presse dans Google News : étude 2012 de lasociété Resoneo, cf. Abondance, novembre 2012- Google et l’édition de presse- Nombreuses controverses au cours des dernières années- Actions d’apaisement de Google en direction des acteurs de la25presseLes moteurs d’actualités : Google News
  • 26. 26Les moteurs d’actualités : Google News• Google News (Actualités) :- Fonds pour l’innovation numérique de la presse de100 millions d’euros16 millions d’euros à23 médias de la pressefrançaise en 2013(près de 2 millionschacun)Source : Libération Ecrans
  • 27. 27Les moteurs d’actualités : Google News• Google News (Actualités) (source Café référencement :Google Actualités : quoi de neuf en 2014 ? )• Le public :• 1 Mrd d’utilisateurs voient des résultats News sur Google chaquesemaine• 6 Mrds de clics envoyés vers les sites de news chaque mois• L’algorithme• Classement selon : sujet, cluster, période de l’année, de la journée,signaux sociaux• Utilisation du News sitemap• Respect du fichier Robots.txt• Trafic• Baisse de trafic en visiteurs uniques sur Google News• Augmentation du trafic news sur google.fr via les résultats d’actualité• Indexation par le spider Google (il n’y a plus de spider spécifique)
  • 28. 28Les moteurs d’actualités : Google News• Google News (Actualités) :• Quoi de neuf pour 2014 ? (source :http://www.cafe-referencement.com/, rubrique GoogleActualités)• Google News en version Web App Mobile, lancée en décembre2013• Une version pour tablette• Lancement aux USA d’une possibilité pour les éditeurs d’envoyerun flux Choix des rédactions pour des catégories spécifiques enplus du flux global• Nouvel outil pour les éditeurs : Media Tools• Autres fonctions récentes : « In-Depth Articles », blocs d’actualitéextensibles
  • 29. 29Les moteurs d’actualités : Google News• Google News : 10 critères principaux de pertinence– Source : Actualités du site Abondance ( + 10 critères négatifs)– 1. L'autorité d'un site sur un sujet précis.– 2. La présence des mots clés demandés dans le titre de la page.– 3. L'autorité du nom de domaine en termes SEO.– 4. Les partages sociaux.– 5. Le fait d'être parmi les premiers à publier un article sur lesujet.– 6. Le nombre de citations par d'autres sites.– 7. Le fait que l'article soit unique et original.– 8. Le taux de clics dans les résultats de Google News.– 9. La qualité du contenu.– 10. L'utilisation d'un Sitemap spécifique de Google News
  • 30. 30Les moteurs d’actualités : Google NewsGoogle Actualités Onebox Actualités de Google web
  • 31. 31Les moteurs d’actualités : Google News• Les fonctionnalités :– La personnalisation :• Choix dans l’affichage desrubriques• Création de rubriquespersonnelles• Recherches d’informationslocales• Paramétrer la fréquencedes sources– La veille :• Syndication de fils RSS• Abonnement gratuit auxalertes :– par thèmes...
  • 32. 32Les moteurs d’actualités : Google NewsMenu déroulant pourla recherche avancéedepuis la fenêtre de saisiede la recherche simple
  • 33. 33Les moteurs d’actualités : Google News• Syntaxe de recherche :• intitle: et allintitle: : dans le titre des articles• intext: et allintext: : dans le texte des articles• inurl: : dans un site particulier• source: : sur une source précise• Source:Libération• location: : dans un pays précis• Location:Algérie• + date d’ajout dans Google Actualités• Option prédéfinie, archives ou intervalle personnalisé
  • 34. 34Les moteurs d’actualités : Google News• Recherche d’articles sur lesujet de la transitionénergétique– Requête sur la phrase« transition énergétique »– Personnalisation desrubriques Actualité (colonnede gauche) : sélectionne lescontenus récents dans ledomaine• Créer une alerte (en bas de lapage)– Nécessite un compte Google
  • 35. 35Les moteurs d’actualité : News Brief• NewsBrief : l’information en temps réel• Moteur développé par l’Union Européenne• Collecte sur + 4300 sources :• 1600 portails d’information, 20 flux d’actualités commerciales,sites spécialisés ; en 60 langues• Surveillance quotidienne :• Mises à jour toutes les 10 mns• Classement des informations• Graphique des 10 derniers événements marquants• Clustérisation : par thèmes, par Directions Générales del’UE• Possibilité d’abonnements RSS, mais pas par rubriques• Index de > 20 millions d’articles
  • 36. 36News Brief : voir l’actualité du sujet• Sur NewsBrief :• Voir si la transition énergétiqueest à la une (Dépêches)• Vérifier si le sujet était présent àla une la veille (Dernières 24heures)• Voir les Domaines de politiqueseuropéennes (EU Policy Areas) etles Thèmes dans lesquels le sujetde la transition énergétique estprésent• Consulter la liste des sources(Sources list)
  • 37. 37News Brief : voir l’actualité du sujet• Sur NewsBrief :• Requête avancée• Retrouver les articlesconsacrés à la transitionénergétique parus :• dans Le Monde, Libération,Alternatives économiques,Huffington Post• depuis le 1/10/14• Intérêt principal deNewsBrief :– Les événements les plusrécents, l’actualité« chaude »
  • 38. 38Europe Media Monitor et NewsBrief• Europe Media Monitor : portails d’information du JointResearch Center (JRC) de la Commission Européenne• Collecte, analyse, cartographie… de très nombreusessources d’information, en 60 langues• Trois portails complémentaires :• NewsBrief : actualité en temps réel• NewsExplorer : analyse de l’information• MediSys : information médicale• + EMM-Labs
  • 39. 39• QWANT :Les moteurs d’actualité : Qwant• Moteur généraliste frrançais lancé en janvier 2013• JM Rozan, Société Pertimm, E. Leandri +entrée de Axel Springeren 2014• Positionnement comme moteur de recherche de découverte• 500 millions de recherches en 2013 (1200 milliards pourGoogle), 1,2 milliard / estimations pour 2014• Fondé sur plusieurs technologies big data• Politique annoncée de respect de la vie privée• Contenus : texte, photos, vidéos, actualité, presse• Présent dans 25 pays et accessible en 15 langues• Possibilité de géolocaliser une recherche• Prise en compte du contexte social des contenus : Twitter,(Voir JDN)Facebook, Google+ et LinkedIn ; utilisation de filtres
  • 40. 40• QWANT :Les moteurs d’actualité : Qwant• Originalité dans la présentation des résultats•Affichage sur une seule page en 5 colonnes :• Web, actualités, Qnowledge graph, social, shopping• Onglet Médias• Lancement du “carnet de notes” avec système de Follower
  • 41. 41Les moteurs d’actualités : autres outils• Anglophones :• Yahoo News• Topix : 2004, agrégateurd’actualités localisées• Européens :• Eufeeds / EuropeanJournalism Centre• Francophones :– Yahoo France Actualités– Webplanete news :• 884 sources d’informationfrancophones– Twikle :• Agrégateur d'actualités et decontenus lancé en octobre2012• Indexe les contenus les pluspartagés sur les réseauxsociaux• Recherche dans les tweets
  • 42. 42Faire de la veille sur un sujet d’actualité :les alertes• Répétition automatique d’une requête à chaque miseà jour d’une source d’information• Résultats adressés périodiquement à l’utilisateur– par messagerie ou sous forme de flux RSS• L’alerte permet, sans avoir à réinterroger la sourced’information, de surveiller :– L’évolution d’un thème– Les travaux d’un auteur ou d’une institution– Les nouveaux articles de la revue que l’on suit• Sur le sujet de la transition énergétique :– Créer une alerte sur Google Actualités
  • 43. Comment trouver des journaux, desjournalistes, des sites de presse ?
  • 44. 44Trouver des journaux et sites de presse3. Recherches d’actualités : Annuaires de la presse et des médias• Pour trouver des journaux dans le monde entier :– Newspapermap.com (http://newspapermap.com/FR.html) :• annuaire cartographique de la presse mondiale• Plus de 10 000 journaux géolocalisés• Option de traduction par Google Translate• Guide Presse :– annuaire de la presse francophone en ligne• Journaux et magazines• Giga-Presse :– Annuaire francophone de la presse en ligne• 612 journaux francophones sélectionnés• Giga Presse Internationale :10 000 journaux et magazines internationaux dans la rubrique« Monde » (beaucoup sont extraits de l’ODP)> Exercice : rechercher des titres de magazines professionnels français surl’environnement et l’énergie
  • 45. 45Trouver des journaux et sites de presse3. Recherches d’actualités : Annuaires de la presse et des médiasRetrouver des « Unes » de journaux :• SPQR :– Les unes du jour des journaux régionaux français surle site du Syndicat de la Presse quotidiennerégionale• Newseum :– Plateforme américaine– Partenariat avec plus de 2000 journaux dans lemonde– Tri par région, carte, « unes » archivées
  • 46. 46Trouver des journalistes• Categorynet.com (portail de la presse et des médias) :– Créé en 1998 par Greg Manset ; entreprise de presse etréseau de journalistes• Comprend un annuaire de liens– Pour trouver des annuaires de journalistes• AnnuaireJournalistes Réseau de pigistes :– Annuaire de près de 8700 journalistes freelance– Possibilité de recherche par thématiques> Exercice : trouver des journalistes spécialiséssur les questions d’énergie etd’environnement
  • 47. 47Autres annuaires et portails de la presse etdes médias3. Recherches d’actualités : Annuaires de la presse et des médias• PQR :– Portail du Syndicat de la PQR– Toutes les informations sur la PQR• Info.presse.fr :– Portail commercial tous publics ; vente d’abonnements– Plus de 1000 titres de presse disponibles à l’abonnement
  • 48. Cerner un sujet d’actualité sur le Web :quels médias, quelles sources sur lesujet ?
  • 49. Recherche sur les sources avec Google Actualités49• Google News (Actualités) :– Filtrage possible sur la source > untitre particulier– Filtrage sur le lieu– Personnalisation relative auxsources (compte Google)• Personnalisation en augmentant lafréquence pour la catégorie choisie oucréée (énergie)• Ajuster la source / Ajuster lafréquence d’une source d’actualité,avec un compte Google• Paramètres : personnalisation sur lesblogs / les communiqués de presse– Après connexion, création d’unerubrique personnalisée Energie parrequête, filtrage sur le pays dessources, sur l’édition ou la langueRubrique Energie surles sources françaises
  • 50. 50• Pickanews :Un moteur d’actualités : Pickanews– Edité par Press Index, société spécialisée sur la veille et lesmédias• Lancé en mai 2010– Moteur plurimédia sur + de 50 000 sources d’information enEurope :• Presse écrite : > 30 000 titres• Web : > 40 000 sites d'information et blogs• Radio et TV : > 200 chaînes de radio et télévision• Réseaux sociaux : 3 (Facebook, Twitter, YouTube)– Outil à la fois gratuit et payant :• Consultation gratuite des résumés• Abonnements payants pour texte intégral des articles,fonctions de veille...
  • 51. 51Un moteur d’actualités : Pickanews• Fonctionnalités gratuites intéressantes :• Filtrages possibles sur :• Les médias• La période (2 derniers mois)• Le sujet• Un titre de presse• Un pays• Graphiques sur :• L'évolution des citations• La ventilation des résultats par types de média• Le top des citations :• Le top des sources• Recherches sur un nom, une marque, une sociétéPour en savoir plus, voir Veille presse avec Pickanews
  • 52. 52Recherche sur les médias et les sources• Sur Pickanews :• Faire une recherche sur la transition énergétique en France• Tester différentes requêtes• Identifier :• les médias• les sources sur internet• Les radios• Les télévisions• Les journaux• qui ont le plus parlé du sujet depuis deux mois• Repérer les périodes où l’on a le plus parlé du sujet• Retrouver des émissions de radios• Chercher les articles de la presse locale sur le sujet
  • 53. 53Recherche sur les sources avec VoxEurop3. Recherches d’actualités : Annuaires de la presse et des médias• VoxEurop :– Site d’information créé par un consortium de 4 magazineseuropéens, spécialisés dans l’actualité internationale (dont« Courrier international »)– Créé en 2009 à Paris, sous le nom PressEurop– Soutien de la Commission européenne– Sélection d’articles dans plus de 200 titres de la presseinternationale– Charte éditoriale : « participer au développement du débatdémocratique informé au sein de l’UE »• TP sur VoxEurop :– Chercher des articles de la presse européenne sur latransition énergétique
  • 54. 54Les agrégateurs de presse• Forte croissance desagrégateurs de presse etde veille médias depuisquelques années(Etude SerdaLab 2009/2010L’information numériqueprofessionnelle en France : Lemarché et les tendances en 2009-2010.)• Diversification desprestations proposées– Services d’agrégation et derecherche dans les contenuspresse– Prestations de services autourde ces contenus– Secteur de la e-réputation• Extension du périmètredes sources– Presse, internet, télévision,radio• Personnalisation del’offre• Quelques grandsacteurs :– Europresse– Factiva
  • 55. 55Les agrégateurs de presse : Europresse• Europresse: www.europresse.com– Agrégateur canadien (Cedrom-SNI)– 10231 sources reconnues– Plus de 3000 titres de presse de près de100 pays (dominante : Etats-Unis,Canada, France ; langue anglaise 80%)– Plus de 25 ans d’archives– Actualité internationale, nationale,régionale, locale + BDD entreprises etprofils biographiques– Presse généraliste / spécialisée,communiqués,blogs thématiques, sitesweb... en accès gratuit : recherche de sourcespossible
  • 56. 56Les agrégateurs de presse : Europresse
  • 57. 57• Recherche sur les sources dansEuropresse :– Filtrage sur les types de sources– Filtrage par source spécifique– Filtrage sur les sources de régionsspécifiques– Filtrage sur la date– Possibilité de tri des résultats parsources– Recherche de journaux sousformat PDF• Faire une recherche sur latransition énergétique etidentifier les sources qui en ontle plus parlé– Presse nationale, régionale, pressespécialisée– TitresLes agrégateurs de presse : Europresse
  • 58. 58Les agrégateurs de presse : Factiva• FACTIVA / Dow Jones : http://www.factiva.com/– “Factiva propose aux entreprises actualités etinformations essentielles avec des outils et services delivraison de contenu. La base Factiva (...) inclutl’association exclusive Wall Street Journal, FinancialTimes®, DJ et Reuters, AFP, AP… » (Journal du Net)– 35 000 sources , 900 fils d’agences, 200 pays, 28langues : presse papier et web, 35 ans d'archives– Accessible par abonnement
  • 59. 59Les agrégateurs de presse : Factiva• Nombreuses possibilités :– requêtes complexes :– Filtrage sur la langue, les dates..– Affinement sur type de sources, de documents, dates,sujets…– Alertes• Voir Guide Formadoct sur l’utilisation de Factiva(dernière mise à jour décembre 2012)
  • 60. Cerner un sujet d’actualité sur le Web :quels acteurs concernés par le sujet ?
  • 61. 61• Europresse, http://www.europresse.com/• Recherche biographique :• Par nom ou mot clé• Dans différentes sources• Possibilité de rechercheavancée dans une sourcedonnéeEuropresse
  • 62. 62Les outils d’analyse de l’actualité : NewsExplorer• NewsExplorer : analyse multilingue• Produit également par Europe Media Monitor• Couplage avec NewsBrief• Analyse de l’information une fois par jour• Résumé des 20 faits marquants• 21 langues• Nombreuses fonctionnalités :• Carte des lieux de l’actualité• Analyse des actualités : tous les articles sur un sujet…• Chronologie des événements• Fiches sur personnalités• Visualisation des relations entre personnes• Recherche rétrospective sur les événements majeurs d’un pays
  • 63. • NewsExplorer :• Recherches sur le thème de la transitionénergétique :• Nécessité de passer par les mots-clésde l’outil• Chercher le thème dans les sujetsrécemment traités, ou essayerdifférents mots-clés• Explorer les différents clusters63Les outils d’analyse de l’actualité :News Explorer
  • 64. 64Les outils d’analyse de l’actualité :NewsExplorerExemple de requête sur Edward SnowdenExplore Relations :visualisation despersonnes ou desorganisations lesplus fréquemmentassociées à lapersonne affichéeRelated People :personnes les plusfréquemmentmentionnéesdans les clusters surle sujet,avec le nombre dementionsAssociatedPeople :personnesmentionnéesen même temps quela personne affichéedans le cluster
  • 65. 65Les outils d’analyse de l’actualité :NewsExplorerOther Names :noms d’organisations ou d’événementsles plus mentionnés autour d’unévénement, d’une date…Quotes from :citations de la personne,dans différentes languesQuotes about :citations à propos de la personne,dans différentes languesRelatedStories :autres clustersd’actualités,dans lesquels lapersonne est leplus souventcitée
  • 66. 66Les outils d’analyse de l’actualité :News Silobreaker• News Silobreaker :– Outil d’analyse en temps réel de l’actualité– Possibilité de requêtes avancées– Analyse des relations (Network) entre des entitésnommées (personnes, pays, villes…) :• Cartographie des relations de co-occurrence entreentités• Analyse du volume de contenus– Analyse de tendances (Trends) :• Nombre d’articles sur un sujet, une entité…– Analyse des points chauds (Hot Spots)• Voir article de C. Deschamps
  • 67. Les outils d’analyse de l’actualité :Les outils de visualisation de l’actualité :News SilobreakerNewsmap• Newsmap :– Application de visualisation de l’actualité– Développée par un ingénieur designeraméricain, Markos Wescamp– Représentation des actualités de 15 pays,sous forme de vignettes proportionnelles aunombre d’articles ;– Accès aux articles de presse
  • 68. Les outils de cartographie de l’actualité :Infomous :Infomous– Permet de naviguer visuellement dans différentes sources– Détection des tendances de l’actualité•Fonctionnement :– Collecte des informations, à partir de différentes sources :• Fils RSS• Site web• Requête sur un mot-clé : sur Twitter, Facebook, Google…– Génération de cartes sémantiques à partir de ces sources :• Représentation des principaux mots-clés, des liens• Affichage de la source
  • 69. InfomousLes outils de cartographie de l’actualité :Infomous
  • 70. Les outils de cartographie de l’actualité :InfomousInfomous• Possibilité de créer soi-même des nuages de mots-clés :
  • 71. Quelles données brutes sur un sujet ?Le journalisme de données
  • 72. 72• Définition :Chercher des données :le journalisme de données• « Le journalisme de données (data journalism en anglais), oujournalisme de bases de données (database journalism), est unmouvement visant à renouveler le journalisme par l'exploitation et la miseà la disposition du public de données statistiques » (Wikipedia)• Repères :• Des origines anciennes :• La carte du choléra à Londres en 1854, par John Snow.• Diagramme des causes de mortalité au sein de l'armée en Orient parFlorence Nightingale.• Essor récent du journalisme de données, symptôme du « Big Data »• 2006 : 1ère apparition du terme, par Adrian Holovaty, créateurd’EveryBlock• Août 2010 : 1ère conférence internationale du datajournalism• 2010 : utilisation des données massives de Wikileaks, par les grandsquotidiens internationaux (ex. du Guardian)
  • 73. 73Chercher des données :le journalisme de données• Exemples de datajournalisme :• Très nombreux exemples, sur tous les sujets, dans tousles domaines, sur toutes les données• Voir dans le Guide du datajournalisme :• la base de données des salaires des fonctionnairesgouvernementaux développée par The TexasTribune• De la visualisation :• Voir «La carte du déclin du communisme municipal dans les banlieues» sur Le Monde• Datajournalismeet visualisation de données : des exemples• Des analyses de corpus de textes :• L’analyse des discours de la campagne présidentielle de 2012
  • 74. 74Chercher des données :le journalisme de données• Exemples de datajournalisme :• L’utilisation des données d’ameli.direct.fr (voir sur Guide dudatajournalisme)
  • 75. 75Chercher des données :le data journalisme• Guardian DataBlog :• Mise à disposition sur le blog :• de données brutes• d’outils de recherche etd’exploration des données• d’outils de visualisation desdonnées• Exemples :• Elections US• Notes de frais des députésanglais• La révolution ukainienne avec13 000 photos Instagram• Dépenses gouvernementales
  • 76. 76Chercher des données :le data journalisme• OTMedia, Observatoire transmedia• Projet de recherche national (financement ANR)• Novembre 2010 – Novembre 2013• Partenariats multiples : INA, INRIA, AFP, Sorbonne nouvelle…• Exploitation de données des médias• Objectifs :• « …mettre en place une plateforme d’analyse des différents fluxmédiatiques pour détecter, circonscrire, suivre, mesurer, analyseret étudier la propagation des évènements médiatiques et leursdérivés »• Exemple :• « La crise syrienne, une vue de France au printemps 2012 »
  • 77. 77Chercher des données :la visualisation de données mondialesDeux sites de visualisation de statistiquesmondiales :•GapMinder :• Outil de visualisation de statistiques mondiales, sur lasanté publique• Créé par Hans Rosling, professeur de santé publique• Consultation et utilisation interactive de statistiquesmondiales• Exemple du graphique surl’évolution de l’espérance de vie dans le monde, depuis 1800• Nombreux usages pédagogiques• Ressources sur ThotCursus•WorldMapper :• Données démographiques• Cartes interactives
  • 78. 78• Ressources :Chercher des données :le data journalisme• Guide du datajournalisme• définition et repères sur le datajournalism• Exemples, études de cas, modes defonctionnement• GlobalVoices,un manuel du journalisme de données• INA global : le journalisme de données• Géoconfluences : Datajournalismeet visualisation de données• Liste du Guardian Datablog
  • 79. Cerner un sujet d’actualité sur le Web :quelles interventions publiques filmées ?
  • 80. 80Les moteurs d’actualités : recherches vidéos• Apport des outils de recherche vidéo pourretrouver de l’information d’actualité• Voxalead News, http://voxaleadnews.labs.exalead.com/• Création en collaboration avec Vecsys et le CNRS-LIMSI dansle cadre du projet Quaero.• Recherche dans les vidéos et fichiers audios de chaînesd’information• Affichage possible de l’actualité récente par graphiques et tags• Chaînes : CNN, france 24, iTélé, LCI, BBC, BFM, Europe 1, etc.• Adaptation du moteur de recherche Exalead• Recherche dans un grand nombre de podcasts (plus de 150 000mis à jour quotidiennement)• 9 langues : Français, Anglais, Mandarin, Arabe, Russe, Espagnol,Italien, Allemand et Hollandais.
  • 81. 81Les moteurs d’actualités : recherches vidéos• Combine des technologies dereconnaissance de la parole etd’indexation texte• Transcription et séquençage :permet de sélectionner unpassage précis de la vidéo• Affinement : chaînes spécifiques,termes associés, personnes,organisme, évènement,localisation• Différents types d’affichage etd’accès
  • 82. 82Les moteurs d’actualités : recherches vidéosRecherchepar motdans lavidéoVoxaleadRequête sur Keith AlexanderTexte de la vidéo et séquençage: passages cliquables amènentdirectement à l’endroit choisidans la vidéo (déficiencespossibles dans la transcription)
  • 83. Les moteurs d’actualités : recherches vidéosTexMix• Projet INRIA, IRISA, CNRS, INSA, Quaero, UniversitéRennes 1• Structuration, navigation dans une collection dejournaux TV83• Le principe de l’application• Segmentation thématique à partir de transcription de la parole• Caractérisation des segments obtenus• Extraction de mots clés• Enrichissement des séquences par des informations sur lespersonnes ou les locutions citées
  • 84. 84Les moteurs d’actualités : recherches vidéos• Les modules de recherche de vidéos des moteursgénéralistes• Exalead Vidéo• Google Vidéo• Yahoo Vidéo• Les plateformes spécialisées• Youtube• Blinkx
  • 85. Cerner un sujet d’actualité sur le Web :quel impact dans la blogosphère et lesréseaux sociaux?
  • 86. 86• Tendances :Outils de recherche de blogs– Baisse d’intérêt des grands moteurs de recherche pour les blogs :• Exemples de Google Blog Search ou de Technorati : plus de recherchevraiment spécifique sur les blogs• Sur Google, intégration récente de l’onglet Blog dans Google Actualités– Un métamoteur intéressant : IceRocket– Quelques petits moteurs de recherche :• Un moteur personnalisable : Keyblog• Les annuaires de blogs :– Une liste d’annuaires de blogs : LesAnnuaires, sectionBlogs– Quelques annuaires francophones, tous publics :• Annuaire de Blogs ADB :– 50 000 blogs recensés• Tout le monde en blogue– Des outils propres aux plateformes de blogs :• L’annuaire des blogs sur OverBlog• Pour les blogs scientifiques :– Hypothèses : en SHS
  • 87. 87Moteurs de recherche de blogs : IceRocket• Module spécialisé du métamoteur IceRocketIceRocket, outil de veille : recherche dans les blogs, les actualités,Twitter, Facebook• Pour la recherche sur les blogs– Recherche avancée : auteur, recherche de posts, sur le titre du post,sur le tag du post, filtrage sur blog spécifique, sur lien du post, sur ladate– Présentation des résultats de la recherche par dates– + résultats des posts publiés dans un intervalle de dates– Tri des résultats par langue– Fil RSS de la recherche– Fonction Trends > graphique de la popularité des mots clés utilisés
  • 88. 88Recherche sur Twitter• Méthodes de recherche des tweets :– Moteur de Twitter : Twitter Search• >1000 tweets reçus par seconde (2010)• Traitement de 12 000 requêtes par seconde– Moteurs de recherche spécialisés, en tempsréel : Topsy, SnapBird, twXplorer– Moteurs de recherche généralistes : Google…• Intégration des tweets dans les résultats– Applications autour de Twitter
  • 89. 89Recherche sur Twitter : Twitter Search• Moteur de Twitter,racheté en 2008• Nombreusesfonctionnalités :• Interface de recherchebooléenne• Recherche sur leshashtags• Recherche sur unutilisateur• Recherche géographique• Recherche sur lessmileys
  • 90. 90Recherche sur Twitter• Recherche sur Twitter Search :– Termes de requêtes :• Hashtag : #transitionenergetique• Mot clé : transition energetique• Observer les réactions sur Twitter• Chercher un compte Twitter spécialisé• Comparer les résultats avec Topsy
  • 91. 91Recherches booléennesRecherchesur unsite, unutilisateurRecherche sur Twitter : TopsyClassementparpertinence,par dateRecherche suranciens tweets
  • 92. 92Recherche sur Twitter : Topsy• Plusieurs possibilitésde filtrage desrésultats :• Par périodes depublication• Par types de supports• Par « Experts » :utilisateurs ayant leplus cité le mot-clé
  • 93. 93• twXplorer :Recherche sur Twitter : twXplorer– Nouvel outil spécialisé sur Twitter, lancé en 2013– Développé par le Knight Lab, de la Northwestern University of Illinois– Outil puissant, toujours en phase beta– 13 langues proposées– Nécessité de se connecter avec son compte Twitter– Requête sur un mot-clé ou un hashtag :• Sélection des 500 derniers tweets sur le sujet• Exclusion des doublons• Affichage des 100 premiers tweets– Tableau de bord avec des possibilités d’affinement :• Sur des termes, des hashtags– Affichage des liens contenus dans les tweets– Voir “twXplorer nouveau moteur de recherche pour Twitter” et “twXplorer,la recherche intelligente sur Twitter”
  • 94. 94Recherche sur Twitter : twXplorer• Le tableau de bord de twXplorer :
  • 95. Moteurs de recherche en temps réel• Information de dernière minute, rapidité d’indexation• Essor des moteurs en temps réel, avec :95– Syndication de contenus, News des médias, Réseaux sociaux,Twitter et micro-blogging• Nombreux moteurs autonomes, intervention desgéants Google, Yahoo, Bing• Demande d’instantanéité :– Mais effets pervers du temps réel
  • 96. Moteurs de recherche en temps réel• Principaux critères, selon Comparatif de 14moteurs, de C. Deschamps :96– Nombre et type de sources collectées (« multimoteurs »)– Représentation graphique des données :• Graphiques de tendances…– Possibilité d’abonnement aux flux RSS par requêtes– Défilement de l’information en temps réel
  • 97. 97Moteurs de recherche en temps réel• Suivi de l’actualité en temps réel :– Exemple sur SocialMention, Samepoint, 48ers…• Suivi d’un thème sur Twitter, les réseaux sociaux…• Outils de veille sur un sujet, une personne…• Analyse, représentation de l’information
  • 98. 98Moteurs de recherche en temps réel :Social Mention Search• Social Mention, moteur social de recherche entemps réel, veille sur les réseaux sociaux– Diversité et nombre de sources indexées :• Blogs• Microblogging• Commentaires de blogs• Plateformes de partage de signets• Sites de news généralistes• Sites d’événements• Images / Vidéos / Audio• Questions-réponses• Réseaux sociaux
  • 99. 99• Interface derechercheMoteurs de recherche en temps réel :Social Mention Search– Interface de recherchesimple• Filtrage possible par lescatégories de sources• Filtrage par les sourceselles-mêmes
  • 100. 110000Moteurs de recherche en temps réel :Social Mention Search• Interface de recherche– Interface de recherche avancée• Affichée à la suite d’une première requête
  • 101. Cerner un sujet d’actualité sur le Web :Quelle évolution dans le traitement ?
  • 102. 102Repérer les tendances : Google Trends• Google Trends– Permet de voir l’évolution de la fréquence des termes de recherche– Exemple sur la transition énergétique :
  • 103. 103Repérer les tendances : Google Trends• Google Trends : fonctionnalités– Chiffres indiqués :• Pas le nombre exact de requêtes• mais le rapport entre la quantité de recherches pour un termedonné, par rapport au nombre total de recherches effectuéessur Google au cours de la même période– Filtrages possibles sur :• Les modules de Google (Web, Actualités, Images…)• Les dates• Les pays• Les catégories• Les mots-clés associés
  • 104. 104Repérer les tendances : Google TrendsExemple sur « energy transition »
  • 105. 105Suivre une épidémie : Google Flu• Google Flu Trends :– Suivi en temps réel de deux épidémiesmondiales : la grippe et la dengue– Application de Big Data développée parGoogle :• Analyse des millions de requêtes des internautessur la grippe et la dengue• Localisation, détection des tendances• Application reconnue par les épidémiologistes
  • 106. Recherche d’archives avec Google News Archive106• La recherche sur les archives :• Sur Google News :– Archives de presse : http://news.google.com/newspapers– Lancé en 2006, généralisé en 2008– Recherche dans 200 ans d’archives de journaux– Mais en 2011 : arrêt du projet de numérisation des archives– Actuellement, restent disponibles : 3,5 millions depublications issus de plus de 2000 journaux dans le monde,remontant jusqu’à 1752
  • 107. • European Library :• Données des bibliothèques nationales européennes• Accès à leurs ressources numériques et bibliographiques• Rubrique “Historic Newspapers” pour les archives de journaux107Recherche d’archives : European LIbrary
  • 108. Ressources• Pour retrouver les ressources explorées :– Liste Diigo « Veille Actualités »
  • Fly UP