Upload
galvin-dudley
View
34
Download
0
Embed Size (px)
DESCRIPTION
Navigation visuelle personnalisée dans des masses de données Visualisation du jeu de données IMDB. Romain Vuillemot LIRIS. Plan de l’exposé. Navigation personnalisée dans des masses de données Modèle de représentation visuelle Plateforme de tests VizOD Cas du jeu de données IMDB - PowerPoint PPT Presentation
Citation preview
ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon
Navigation visuelle personnalisée
dans des masses de donnéesVisualisation du jeu de données IMDB
Romain VuillemotRomain VuillemotLIRISLIRIS
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
2
Plan de l’exposé
Navigation personnalisée dans des masses de Navigation personnalisée dans des masses de donnéesdonnées Modèle de représentation visuelleModèle de représentation visuelle Plateforme de tests VizODPlateforme de tests VizOD
Cas du jeu de données IMDBCas du jeu de données IMDB Une visualisation du jeu de donnéesUne visualisation du jeu de données PersonnalisationPersonnalisation Concours InfoVis’07Concours InfoVis’07
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
3
Plan de l’exposé
Navigation personnalisée dans des masses de Navigation personnalisée dans des masses de donnéesdonnées Modèle de représentation visuelleModèle de représentation visuelle Plateforme de tests VizODPlateforme de tests VizOD
Cas du jeu de données IMDBCas du jeu de données IMDB Une visualisation du jeu de donnéesUne visualisation du jeu de données PersonnalisationPersonnalisation Concours InfoVis’07Concours InfoVis’07
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
4
Présentation 2006-2009 :2006-2009 : Allocataire moniteur LIRIS/INSA Lyon Allocataire moniteur LIRIS/INSA Lyon Encadré parEncadré par Béatrice Rumpler & Jean-Marie Pinon Béatrice Rumpler & Jean-Marie Pinon
« Navigation personnalisée « Navigation personnalisée dans de grands ensembles de documents :dans de grands ensembles de documents :
Modèle et représentation visuelle »Modèle et représentation visuelle »
But :But : améliorer l’accès visuel à de grands ensembles de améliorer l’accès visuel à de grands ensembles de donnéesdonnées
Idée :Idée : réutiliser la connaissance du profil utilisateur dans la réutiliser la connaissance du profil utilisateur dans la présentation et l’interaction avec les résultatsprésentation et l’interaction avec les résultats
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
5
Exemple
Présentation linéaire Présentation linéaire par pagerank par pagerank décroissantdécroissant
http://www.google.comhttp://www.google.com http://www.kartoo.comhttp://www.kartoo.com
Cartographie 2D Cartographie 2D sémantique des sémantique des résultatsrésultats
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
6
Modèle de représentation des données
[ VRP07 ] Romain Vuillemot, Béatrice Rumpler, et Jean-Marie Pinon. L’hyper-accès au moyen du profil utilisateur. A paraître dans h2ptm’07 : Collaborer, Échanger, Inventer : Expériences de réseaux, Octobre 2007, Hammamet, Tunisie.
ExtractionExtraction Indexation/structuration des données, requêtes d’interrogation, transformation en Indexation/structuration des données, requêtes d’interrogation, transformation en
structure interne, ..structure interne, ..
DispositionDisposition Représentation dans un espace 2D/3D/hyperbolique, colorisation, ajout de symboles..Représentation dans un espace 2D/3D/hyperbolique, colorisation, ajout de symboles..
RenduRendu Support de rendu (image, vidéo), cadre applicatif, interactions..Support de rendu (image, vidéo), cadre applicatif, interactions..
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
7
Réutilisation du profil utilisateur
Réutilisation du profil/connaissances de l’utilisateur :Réutilisation du profil/connaissances de l’utilisateur : Choix de la disposition et de la représentationChoix de la disposition et de la représentation
Réseau, arbre, position spatiale, couleurs, symboles,..Réseau, arbre, position spatiale, couleurs, symboles,.. Choix du renduChoix du rendu
2D/3D, cadre applicatif, ..2D/3D, cadre applicatif, ..
Profils
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
8
Réutilisation du profil utilisateur
Réutilisation du profil/connaissances de l’utilisateur :Réutilisation du profil/connaissances de l’utilisateur : Choix de la disposition et de la représentationChoix de la disposition et de la représentation
Réseau, arbre, position spatiale, couleurs, symboles,..Réseau, arbre, position spatiale, couleurs, symboles,.. Choix du renduChoix du rendu
2D/3D, cadre applicatif, ..2D/3D, cadre applicatif, ..
Profils
Rôle du serveur de tests VizOD
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
9
VizOD : serveur de tests « Visualization-On-Demand »« Visualization-On-Demand »
ServeurServeur de test de test Reprend le Reprend le paradigme du paradigme du on-demandon-demand (choix de librairies (choix de librairies
graphiques, structures de données, ..) permettant la graphiques, structures de données, ..) permettant la personnalisation.personnalisation.
CapitalisationCapitalisation Connaissances (évaluations, design, ..)Connaissances (évaluations, design, ..) Traces d’utilisation Traces d’utilisation Temps de calculs.Temps de calculs.
Installation (en cours) de Installation (en cours) de librairieslibrairies Proviennent de nombreux domaines : informatique, biologie, Proviennent de nombreux domaines : informatique, biologie,
chimie, .. qu’il faut homogénéiser.chimie, .. qu’il faut homogénéiser. Exmples : LGLExmples : LGL (Java), (Java), GraphvizGraphviz (C++) , (C++) , TulipTulip (C++) (C++)
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
10
VizOD : architecture
Architecture :Architecture : On On centralisecentralise ce qui demande du temps ce qui demande du temps
Construction de la structure de représentationConstruction de la structure de représentation Disposition (spatialisation) de la structureDisposition (spatialisation) de la structure
On On décentralisedécentralise ce qui demande de la réactivité ce qui demande de la réactivité Reformulation de la dispositionReformulation de la disposition Rendu/Point de vue sur les donnéesRendu/Point de vue sur les données
Résumé : on génère des images que l’on réinjecte Résumé : on génère des images que l’on réinjecte dans l’environnement applicatif de l’utilisateurdans l’environnement applicatif de l’utilisateur
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
11
VizOD : architecture
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
12
VizOD : perspectives D’un point de vue techniqueD’un point de vue technique
Identifier les choix de personnalisation Identifier les choix de personnalisation (librairies, métaphores visuelles, ..)(librairies, métaphores visuelles, ..)
Identifier et définir les stratégies Identifier et définir les stratégies d’intégration dans des cadres d’intégration dans des cadres applicatifsapplicatifs
Augmenter l’exhaustivité en généralAugmenter l’exhaustivité en général
Définir des critères de personnalisationDéfinir des critères de personnalisation Similarités avec les profils de sélection Similarités avec les profils de sélection
(construction, structure du profil, ..)?(construction, structure du profil, ..)? Définition d’un profil visuel?Définition d’un profil visuel? Vers un profil commun?Vers un profil commun?
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
13
Plan de l’exposé
Navigation personnalisée dans des masses de Navigation personnalisée dans des masses de donnéesdonnées Modèle de représentation visuelleModèle de représentation visuelle Plateforme de tests VizODPlateforme de tests VizOD
Cas du jeu de données IMDBCas du jeu de données IMDB Une visualisation du jeu de donnéesUne visualisation du jeu de données PersonnalisationPersonnalisation Concours InfoVis’07Concours InfoVis’07
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
14
Représentations existantes Visualisation analytiqueVisualisation analytique
Spotfire :Spotfire : outil d’analyse outil d’analyse permettant de répondre à des permettant de répondre à des scénarios ou en faire émergerscénarios ou en faire émerger
Users who watch all the most Users who watch all the most popular movies do not like popular movies do not like other movies as muchother movies as much http://www.spotfire.com/
Strangers can recommend movies to each other!Strangers can recommend movies to each other! Peu performant dans le cas de MDDPeu performant dans le cas de MDD
Nécessité d’utiliser d’autres formes de Nécessité d’utiliser d’autres formes de représentation (métaphores visuelles) et d’ représentation (métaphores visuelles) et d’ interaction ( post-Wimp, multimodale, ..)interaction ( post-Wimp, multimodale, ..)
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
15
Une visualisation de IMDB Base de données IMDB (24 tables, Base de données IMDB (24 tables, 25k à25k à 4,5M de champs). 4,5M de champs).
Peut-on avoir une vue quantitative sur les données?Peut-on avoir une vue quantitative sur les données? Par exemple sous forme d’arbre : une racine artificielle, Par exemple sous forme d’arbre : une racine artificielle,
chaque fils sera une table et chaque feuille une entrée chaque fils sera une table et chaque feuille une entrée dans la tabledans la table Répond à la question : quelle est la proportion des différentes Répond à la question : quelle est la proportion des différentes
tables?tables?
Etapes de représentation visuelleEtapes de représentation visuelle1.1. Requêtes d’extractionRequêtes d’extraction des données (SELECT ALL ..) des données (SELECT ALL ..)2.2. Construction d’un arbre Construction d’un arbre (ajout d’une racine artificielle)(ajout d’une racine artificielle)3.3. Conversion en GMLConversion en GML (Graph Modeling Language) (Graph Modeling Language)4.4. Disposition avec LGLDisposition avec LGL (Ajout de composantes spatiales au graphe) par (Ajout de composantes spatiales au graphe) par
auto-organisation.auto-organisation.5.5. Rendu avec LGLRendu avec LGL (Conversion du graphe spatialisé en image) (Conversion du graphe spatialisé en image)6.6. AffichageAffichage
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
16
Résolution : 1/10 000ème Temps de calcul : 39sMachine : Linux (distribution Fedora/Red Hat 4.0.2-8) avec un noyau 2.6.16, 512 Mo de Ram, un processeur AMD AthlonTMXP 2500+ (1.8 GHz) doté de 512 KB de mémoire cache. Librairie LGL.
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
17
Résolution : 1/1000ème Temps de calcul : 374sMachine : Linux (distribution Fedora/Red Hat 4.0.2-8) avec un noyau 2.6.16, 512 Mo de Ram, un processeur AMD AthlonTMXP 2500+ (1.8 GHz) doté de 512 KB de mémoire cache. Librairie LGL.
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
18
Analyse de la représentation Aspects positifsAspects positifs
On a une vue globale et immédiateOn a une vue globale et immédiate Mais uniquement quantitativeMais uniquement quantitative
Utilisation des capacités de l’être humain :Utilisation des capacités de l’être humain : Clustering, classification, ..Clustering, classification, .. Ne requiert pas de lourd apprentissageNe requiert pas de lourd apprentissage
Aspects négatifsAspects négatifs Pas temps réel Pas temps réel : a: attente par l’utilisateur ttente par l’utilisateur
Anticiper le comportement de l’utilisateurAnticiper le comportement de l’utilisateur Navigation difficileNavigation difficile
Identifier les ressources disponibles (écrans, espaces, ..)Identifier les ressources disponibles (écrans, espaces, ..) Il faut coordonner!Il faut coordonner!
BILAN :BILAN : définir une stratégie (objectif , qualité de résultat, ..) définir une stratégie (objectif , qualité de résultat, ..) en identifiant le contexte d’usage (ressources d’interaction en identifiant le contexte d’usage (ressources d’interaction disponibles, environnement) : disponibles, environnement) : utiliser le profil utilisateurutiliser le profil utilisateur..
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
19
Exemples de personnalisation Disposition:Disposition:
Couleurs des arêtes : historique en rougeCouleurs des arêtes : historique en rouge Icônes sur les sommets : affiche de filmsIcônes sur les sommets : affiche de films Symboles sur les sommets : chiffresSymboles sur les sommets : chiffres Utiliser l’espace : rapprocher des films ayant le même castingUtiliser l’espace : rapprocher des films ayant le même casting
Rendu (travaux en cours)Rendu (travaux en cours) Choix de l’application, choix de l’interaction, ..Choix de l’application, choix de l’interaction, ..
Stratégie d’accès aux données (travaux en cours)Stratégie d’accès aux données (travaux en cours) Overview, zoom & details Overview, zoom & details [Shn96] [Shn96] Focus+ContextFocus+Context Approches multi-résolutionsApproches multi-résolutions
[Shn96][Shn96] Ben Shneiderman. The eyes have it : A task by data type taxonomy for Ben Shneiderman. The eyes have it : A task by data type taxonomy for information visualizations. Proceedings of the 1996 IEEE Symposium on Visual information visualizations. Proceedings of the 1996 IEEE Symposium on Visual Languages, page 336, Washington, DC, USA, 1996. IEEE Computer Society.Languages, page 336, Washington, DC, USA, 1996. IEEE Computer Society.
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
20
Exemple de coordination Assister la tâche de Assister la tâche de
l’utilisateurl’utilisateur avec une avec une visualisation personnalisée des visualisation personnalisée des données.données.
CoordonnerCoordonner les vues les vues Couleur, formes, distances, ..Couleur, formes, distances, .. A partir de plusieurs points de A partir de plusieurs points de
vue, représentationsvue, représentations
Approches multi-résolution Approches multi-résolution Pour gagner du tempsPour gagner du temps
Agrégation sémantiqueAgrégation sémantique Agrégation visuelleAgrégation visuelle
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
21
Bilan de la personnalisation Deux approches de personnalisation émergent :Deux approches de personnalisation émergent :
Côté représentation et interaction (voir modèle) : Côté représentation et interaction (voir modèle) : Choix de métaphore visuelle, d’environnement, de résolution, .. Choix de métaphore visuelle, d’environnement, de résolution, ..
Côté données : Côté données : Ajout de données « invisibles » ou « implicites » dans la Ajout de données « invisibles » ou « implicites » dans la
représentation : représentation : • Historique, traces, autres utilisateurs, ..Historique, traces, autres utilisateurs, ..• Ces données pourront être personnalisées dans leur représentation.Ces données pourront être personnalisées dans leur représentation.
Choix d’une approche? Approches mixtes?Choix d’une approche? Approches mixtes? Travaux en coursTravaux en cours
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
22
Conférence InfoVis Conférence IEEE (créée en 1995) sur la Conférence IEEE (créée en 1995) sur la
visualisation d’informationvisualisation d’information http://www.infovis.org/http://www.infovis.org/
InfoVis Contest (associé à InfoVis depuis 2003)InfoVis Contest (associé à InfoVis depuis 2003) 2004 : bibliography2004 : bibliography 2006 : U.S. Census Data2006 : U.S. Census Data 2007 : …2007 : …
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
23
InfoVis’07 ContestThe (2007) The (2007) data setdata set consists of about Hollywood movies consists of about Hollywood movies
including actors, actresses, awards, and similar. including actors, actresses, awards, and similar. This This year'syear's focus focus is on the design aspects of the visualization in addition is on the design aspects of the visualization in addition to its exploratory and analytical aspects, and entrants to its exploratory and analytical aspects, and entrants are are encourages to augment the data set with any publicly encourages to augment the data set with any publicly available data.available data.
http://conferences.computer.org/infovis/infovis2007/contest.htmlhttp://conferences.computer.org/infovis/infovis2007/contest.html
C’est une question très ouverteC’est une question très ouverte Possibilité d’utiliser MovieLens, préférences des Possibilité d’utiliser MovieLens, préférences des
utilisateurs, ..utilisateurs, ..
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
24
Des idées? IMDB dataset déjà très utilisé (structure en IMDB dataset déjà très utilisé (structure en
graphe, requêtes bases de données, small world)graphe, requêtes bases de données, small world) Autres Pistes?Autres Pistes?
Visualiser le jeu de données de manière Visualiser le jeu de données de manière personalisée? Quels critères?personalisée? Quels critères?
VisualiserVisualiser la personnalisation du jeu de données? la personnalisation du jeu de données? Visualisation la propagation d’une requête?Visualisation la propagation d’une requête? Visualiser les préférences/évaluations?Visualiser les préférences/évaluations?
Autres idées? (deadline le 13 juillet 2007)Autres idées? (deadline le 13 juillet 2007)
06/0
6/20
07Ro
mai
n Vu
illem
ot
AC
I MA
SSES
DE
DO
NN
EES
- PR
OJE
T M
D33
/04-
07 -
APM
D: A
CC
ES P
ERSO
NN
ALI
SE A
DES
MA
SSES
DE
DO
NN
EES
INSA
de
Lyon
25
Fin Des questions?Des questions?