Navigation visuelle personnalisée dans des masses de données Visualisation du jeu de données IMDB

  • Published on
    14-Mar-2016

  • View
    28

  • Download
    0

DESCRIPTION

Navigation visuelle personnalise dans des masses de donnes Visualisation du jeu de donnes IMDB. Romain Vuillemot LIRIS. Plan de lexpos. Navigation personnalise dans des masses de donnes Modle de reprsentation visuelle Plateforme de tests VizOD Cas du jeu de donnes IMDB - PowerPoint PPT Presentation

Transcript

Plan de lexposNavigation personnalise dans des masses de donnesModle de reprsentation visuellePlateforme de tests VizODCas du jeu de donnes IMDBUne visualisation du jeu de donnesPersonnalisationConcours InfoVis07INSA de LyonPlan de lexposNavigation personnalise dans des masses de donnesModle de reprsentation visuellePlateforme de tests VizODCas du jeu de donnes IMDBUne visualisation du jeu de donnesPersonnalisationConcours InfoVis07INSA de LyonPrsentation2006-2009 : Allocataire moniteur LIRIS/INSA LyonEncadr par Batrice Rumpler & Jean-Marie PinonNavigation personnalise dans de grands ensembles de documents :Modle et reprsentation visuelleBut : amliorer laccs visuel de grands ensembles de donnesIde : rutiliser la connaissance du profil utilisateur dans la prsentation et linteraction avec les rsultatsINSA de LyonExemplePrsentation linaire par pagerank dcroissanthttp://www.google.comhttp://www.kartoo.comCartographie 2D smantique des rsultatsINSA de LyonModle de reprsentation des donnes[ VRP07 ] Romain Vuillemot, Batrice Rumpler, et Jean-Marie Pinon. Lhyper-accs au moyen du profil utilisateur. A paratre dans h2ptm07 : Collaborer, changer, Inventer : Expriences de rseaux, Octobre 2007, Hammamet, Tunisie.ExtractionIndexation/structuration des donnes, requtes dinterrogation, transformation en structure interne, ..DispositionReprsentation dans un espace 2D/3D/hyperbolique, colorisation, ajout de symboles..RenduSupport de rendu (image, vido), cadre applicatif, interactions..INSA de LyonRutilisation du profil utilisateurRutilisation du profil/connaissances de lutilisateur :Choix de la disposition et de la reprsentationRseau, arbre, position spatiale, couleurs, symboles,..Choix du rendu2D/3D, cadre applicatif, ..ProfilsINSA de LyonRutilisation du profil utilisateurRutilisation du profil/connaissances de lutilisateur :Choix de la disposition et de la reprsentationRseau, arbre, position spatiale, couleurs, symboles,..Choix du rendu2D/3D, cadre applicatif, ..ProfilsRle du serveur de tests VizODINSA de LyonVizOD : serveur de testsVisualization-On-DemandServeur de testReprend le paradigme du on-demand (choix de librairies graphiques, structures de donnes, ..) permettant la personnalisation.Capitalisation Connaissances (valuations, design, ..)Traces dutilisation Temps de calculs.Installation (en cours) de librairiesProviennent de nombreux domaines : informatique, biologie, chimie, .. quil faut homogniser.Exmples : LGL (Java), Graphviz (C++) , Tulip (C++)INSA de LyonVizOD : architectureArchitecture :On centralise ce qui demande du tempsConstruction de la structure de reprsentationDisposition (spatialisation) de la structureOn dcentralise ce qui demande de la ractivitReformulation de la dispositionRendu/Point de vue sur les donnesRsum : on gnre des images que lon rinjecte dans lenvironnement applicatif de lutilisateurINSA de LyonVizOD : architectureINSA de LyonVizOD : perspectivesDun point de vue techniqueIdentifier les choix de personnalisation (librairies, mtaphores visuelles, ..)Identifier et dfinir les stratgies dintgration dans des cadres applicatifsAugmenter lexhaustivit en gnralDfinir des critres de personnalisationSimilarits avec les profils de slection (construction, structure du profil, ..)?Dfinition dun profil visuel?Vers un profil commun?INSA de LyonPlan de lexposNavigation personnalise dans des masses de donnesModle de reprsentation visuellePlateforme de tests VizODCas du jeu de donnes IMDBUne visualisation du jeu de donnesPersonnalisationConcours InfoVis07INSA de LyonReprsentations existantesVisualisation analytiqueSpotfire : outil danalyse permettant de rpondre des scnarios ou en faire mergerUsers who watch all the most popular movies do not like other movies as muchhttp://www.spotfire.com/Strangers can recommend movies to each other!Peu performant dans le cas de MDDNcessit dutiliser dautres formes de reprsentation (mtaphores visuelles) et d interaction ( post-Wimp, multimodale, ..)INSA de LyonUne visualisation de IMDBBase de donnes IMDB (24 tables, 25k 4,5M de champs). Peut-on avoir une vue quantitative sur les donnes?Par exemple sous forme darbre : une racine artificielle, chaque fils sera une table et chaque feuille une entre dans la tableRpond la question : quelle est la proportion des diffrentes tables?Etapes de reprsentation visuelleRequtes dextraction des donnes (SELECT ALL ..)Construction dun arbre (ajout dune racine artificielle)Conversion en GML (Graph Modeling Language)Disposition avec LGL (Ajout de composantes spatiales au graphe) par auto-organisation.Rendu avec LGL (Conversion du graphe spatialis en image)AffichageINSA de LyonRsolution : 1/10 000me Temps de calcul : 39sMachine : Linux (distribution Fedora/Red Hat 4.0.2-8) avec un noyau 2.6.16, 512 Mo de Ram, un processeur AMD AthlonTMXP 2500+ (1.8 GHz) dot de 512 KB de mmoire cache. Librairie LGL.INSA de LyonRsolution : 1/1000me Temps de calcul : 374sMachine : Linux (distribution Fedora/Red Hat 4.0.2-8) avec un noyau 2.6.16, 512 Mo de Ram, un processeur AMD AthlonTMXP 2500+ (1.8 GHz) dot de 512 KB de mmoire cache. Librairie LGL.INSA de LyonAnalyse de la reprsentationAspects positifsOn a une vue globale et immdiateMais uniquement quantitativeUtilisation des capacits de ltre humain :Clustering, classification, ..Ne requiert pas de lourd apprentissageAspects ngatifsPas temps rel : attente par lutilisateur Anticiper le comportement de lutilisateurNavigation difficileIdentifier les ressources disponibles (crans, espaces, ..)Il faut coordonner!BILAN : dfinir une stratgie (objectif , qualit de rsultat, ..) en identifiant le contexte dusage (ressources dinteraction disponibles, environnement) : utiliser le profil utilisateur.INSA de LyonExemples de personnalisationDisposition:Couleurs des artes : historique en rougeIcnes sur les sommets : affiche de filmsSymboles sur les sommets : chiffresUtiliser lespace : rapprocher des films ayant le mme castingRendu (travaux en cours)Choix de lapplication, choix de linteraction, ..Stratgie daccs aux donnes (travaux en cours)Overview, zoom & details [Shn96] Focus+ContextApproches multi-rsolutions [Shn96] Ben Shneiderman. The eyes have it : A task by data type taxonomy for information visualizations. Proceedings of the 1996 IEEE Symposium on Visual Languages, page 336, Washington, DC, USA, 1996. IEEE Computer Society.INSA de LyonExemple de coordinationAssister la tche de lutilisateur avec une visualisation personnalise des donnes.Coordonner les vuesCouleur, formes, distances, ..A partir de plusieurs points de vue, reprsentationsApproches multi-rsolution Pour gagner du tempsAgrgation smantiqueAgrgation visuelleINSA de LyonBilan de la personnalisationDeux approches de personnalisation mergent :Ct reprsentation et interaction (voir modle) : Choix de mtaphore visuelle, denvironnement, de rsolution, .. Ct donnes : Ajout de donnes invisibles ou implicites dans la reprsentation : Historique, traces, autres utilisateurs, ..Ces donnes pourront tre personnalises dans leur reprsentation.Choix dune approche? Approches mixtes?Travaux en coursINSA de LyonConfrence InfoVisConfrence IEEE (cre en 1995) sur la visualisation dinformationhttp://www.infovis.org/InfoVis Contest (associ InfoVis depuis 2003)2004 : bibliography2006 : U.S. Census Data2007 : INSA de LyonInfoVis07 ContestThe (2007) data set consists of about Hollywood movies including actors, actresses, awards, and similar. This year's focus is on the design aspects of the visualization in addition to its exploratory and analytical aspects, and entrants are encourages to augment the data set with any publicly available data.http://conferences.computer.org/infovis/infovis2007/contest.htmlCest une question trs ouvertePossibilit dutiliser MovieLens, prfrences des utilisateurs, ..INSA de LyonDes ides?IMDB dataset dj trs utilis (structure en graphe, requtes bases de donnes, small world)Autres Pistes?Visualiser le jeu de donnes de manire personalise? Quels critres?Visualiser la personnalisation du jeu de donnes?Visualisation la propagation dune requte?Visualiser les prfrences/valuations?Autres ides? (deadline le 13 juillet 2007)INSA de LyonFinDes questions?INSA de LyonConcours infovis = trec

Recommended

View more >