Upload
amelie-bonnin
View
106
Download
0
Embed Size (px)
Citation preview
Laboratoire d'InfoRmatique en Image et Systèmes d'information
Panorama de travaux autour de l’intégrationde données spatio-temporelles dans les hypercubes
Anne Tchounikine, Maryvonne Miquel, Robert Laurini, Taher Ahmed, Sandro Bimonte, Virginie Baillot
LIRIS – UMR CNRS 5205Laboratoire d'InfoRmatique en Images et Systèmes d'information
2/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
Nos thématiques de recherche
• Acquisition des données
• Nettoyage, correction, filtrage
• Réconciliation syntaxique,
sémantique
• Agrégation
• Modélisation
multidimensionnelle
• Stockage
• Optimisation, indexation
• Maintenance
• Modèles d’analyse
• Algèbre OLAP
• Fouille de données
• Interface
Médical
Environnemental
Grille de calculSpatio-temporel
3/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
Spatial OLAP
• Définition
– Plateforme visuelle supportant l’analyse et l’exploration rapides et faciles des données
selon une approche multidimensionnelle à plusieurs niveaux d’agrégation via un
affichage cartographique, tabulaire ou en diagramme statistique [Bédard]
• Motivation
– 80% ~ des données transactionnelles contiennent une information spatiale
– L’exploitation de cette information passe par :
• Sa représentation graphique
• La prise en compte d’opérateurs spécifiques (spatiaux)
– …qui augmentent les capacités décisionnelles :
• Information synthétique, visuelle
• Analyse de l’influence des facteurs géographiques, environnementaux
4/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
SOLAP
• Dimension spatiale
– Ex : nb de patients de profil (…) présentant la pathologie (…) par région
• Mesure spatiale
– Ex : ensemble des régions où apparaissent des profils de patients (…)
• Problématiques
– Définition de modèles/des algèbres intégrant :
• des mesures spatiales
• des dimensions spatiales
• des données continues (2)
– Interface
• navigation cartographique adaptée (3)
• représentation cartographique du résultat
• des référentiels instables (1)
• des données hétérogènes
• des opérateurs spatiaux
5/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
Dimension spatiale
Médicaments
Produit-code produit-nom produit…
Année-code année
Classe-code type-nom type
-Nombre d’unités
Conso
Département-num dept-nom departement
Région-num région-nom région
Temps
Mois-code mois
Localisation
Hôpital-num hôpital-nom hôpital-Nb lits…
6/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
Mesure spatiale
- dept- nombre depts
Pathologie-nom-…
Pathologie
Mois-code mois
Jour-code jour
Temps
Incidence-intervalle
Incidence
Surveillance
7/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
Référentiel instable : dimension spatiale évolutive (1)
• Problématique
– L’hétérogénéité des données est aussi liée à leur structuration
– La nature et l’organisation des données évoluent au cours du temps
– Un référentiel unique ne s’impose pas toujours
– Les informations liées à l’évolution temporelle des données font partie du processus
décisionnel
• Exemples
– Dimensions non spatiales
• Organisation d’un service, nomenclature,…
– Dimensions spatiales
• Découpage politique (RFA/RDA, Europe…)…
• Découpage multi-critères (foresterie*, ...)…
*[M. Miquel, Y. Bédard, A. Brisebois. Conception d'entrepôts de données géospatiales à partir de sources hétérogènes, exemple d'application en foresterie. Revue ISI-NIS, Special Issue Data warehousing, Volume 7-n°3/2002]
8/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
Modèle multidimensionnel m3
• Version de membre– Évolution des instances d’une dimension
• Dimension évolutive– Évolution de la structure hiérarchique des membres
• Relations de mapping– Conservation des liens de transitions entre versions de membre
• Indice de confiance– Description de la confiance associée aux mappings
• Version de structure– État valide et invariant de la structure multidimensionnelle sur un intervalle de temps
• Modes temporels de présentation– Modes qui peuvent être choisis pour représenter les résultats de requêtes
multidimensionnelles
• Table de faits intégrant les différents modes temporels de présentation – Construite automatiquement à partir d’une table de fait traditionnelle, des dimensions
et des relations de mapping
[M. Body, M. Miquel, Y. Bédard, A. Tchounikine, “Handling Evolutions in Multidimensional Structure” IEEE International Conference on Data Engineering, ICDE, March 5-8 2003, Bangalore, Inde]
9/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
P1
P2
PF12
PF2
PF3
<P1,PF1, {( xx2
1 ,em)},{( xx ,em)} >;
<P1,PF2, {( xx3
1 ,em)}{( xx
3
2 ,em)}> ;
<P1,PF3, {( xx6
1 ,em)}{( xx
2
1 ,em)} >;
<P2,PF2, {( xx2
1 ,em)}{( xx
3
1 ,em)} > ;
<P2,PF3, {( xx2
1 ,em)}{( xx
2
1 ,em)} >
Sales [01/2001 ; Now]
Dept.Paul [01/2002 ; Now]
Dept.Jones [01/2001 ; 12/2001]
[01/2003 ; Now] [01/2001 ; 12/2002]
Dept.Bill [01/2002 ; Now]
[01/2003 ; Now]
<Dpt.Jones_id, Dpt.Bill_id, {( xx 4.0 , am)}, {( xx , em)}> <Dpt.Jones_id, Dpt.Paul_id, {( xx 6.0 , am)}, {( xx , em)} >
10/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
11/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
Entrepôt de données continues (2)
• Problématique
– Observer les phénomènes naturels naturellement
– Besoin d’analyser les données à des granularités spatiales et temporelles très fines
– Problème des valeurs manquantes
12/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
Entrepôt de données continues
[T. Ahmed. Multidimensional Structures Dedicated to Continuous Spatio-temporal Phenomena. Proceeding of the 22nd British National Conference on Databases (BNCOD), 2005]temps
valeurs
résultat
valeursobservées valeurs
estimées
Espace d’étude
Capteurs depollution
input
cubecontinu
application de méthodesd’interpolation spatiales
et temporelles
cube discret
Base dedonnées
13/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
Interface de navigation : GéOlap (3)
• Fonctionnalités
– Fenêtre pour la selection des mesures et des dimensions
– Fenêtres multi-modales synchronisées
• tabulaire, graphique, cartographique
– opérateurs classiques OLAP disponibles sur chaque mode
14/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
GéOlap
15/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
16/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
Gé-W-Olap
Webform
SOAP
HTTP
XML-ASOAP
HTTP
discover, execute
XML
Serveur .netClient web
Ms Analysis Services
17/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
Mesure spatiale et objet spatial complexe (multi-facettes)
- dept- nombre depts
Département-map-nom dept-population-superficie-classe SP
Pathologie-nom-…
Pathologie
Mois-code mois
Jour-code jour
Temps
Incidence-intervalle
Incidence
Surveillance
18/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
Représentation visuelle
• Principes de « la graphique » [J. Bertin]
19/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
Extension de l’algèbre OLAP aux opérateurs SIG
roll-up
Opérateurs OLAP
drill-down
rotate
clipping
Opérateurs SIG
distance
touch
Opérateurs SOLAP
select
min, max, sum, count, ..
group-by
Opérateurs SQL
…
…
where
20/20
Laboratoire d'InfoRmatique en Image et Systèmes d'information
Conclusions
• Richesses des problématiques et des applications
– Modèles, algèbres, stockage et optimisation, hétérogénéités des sources, interface …
– Santé, phénomènes naturels, environnement, gestion du risque/prévention, …
• Objet spatial
– Différentes « facettes »
• géométrique, descriptive, métrique
• discret, continu
– Différentes représentations cartographiques
• zonal, ponctuel, linéaire
• variables visuelles
• représentation multiple et généralisation
• Solutions non spécifiques
– Objet spatial vs objet « complexe »
– Objet spatial vs objet multimedia
– Objet spatial vs objet multi-représentation