20
Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de l’intégration de données spatio-temporelles dans les hypercubes Anne Tchounikine, Maryvonne Miquel, Robert Laurini, Taher Ahmed, Sandro Bimonte, Virginie Baillot LIRIS – UMR CNRS 5205 Laboratoire d'InfoRmatique en Images et Systèmes d'information [email protected]

Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

Embed Size (px)

Citation preview

Page 1: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

Laboratoire d'InfoRmatique en Image et Systèmes d'information

Panorama de travaux autour de l’intégrationde données spatio-temporelles dans les hypercubes

Anne Tchounikine, Maryvonne Miquel, Robert Laurini, Taher Ahmed, Sandro Bimonte, Virginie Baillot

LIRIS – UMR CNRS 5205Laboratoire d'InfoRmatique en Images et Systèmes d'information

[email protected]

Page 2: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

2/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

Nos thématiques de recherche

• Acquisition des données

• Nettoyage, correction, filtrage

• Réconciliation syntaxique,

sémantique

• Agrégation

• Modélisation

multidimensionnelle

• Stockage

• Optimisation, indexation

• Maintenance

• Modèles d’analyse

• Algèbre OLAP

• Fouille de données

• Interface

Médical

Environnemental

Grille de calculSpatio-temporel

Page 3: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

3/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

Spatial OLAP

• Définition

– Plateforme visuelle supportant l’analyse et l’exploration rapides et faciles des données

selon une approche multidimensionnelle à plusieurs niveaux d’agrégation via un

affichage cartographique, tabulaire ou en diagramme statistique [Bédard]

• Motivation

– 80% ~ des données transactionnelles contiennent une information spatiale

– L’exploitation de cette information passe par :

• Sa représentation graphique

• La prise en compte d’opérateurs spécifiques (spatiaux)

– …qui augmentent les capacités décisionnelles :

• Information synthétique, visuelle

• Analyse de l’influence des facteurs géographiques, environnementaux

Page 4: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

4/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

SOLAP

• Dimension spatiale

– Ex : nb de patients de profil (…) présentant la pathologie (…) par région

• Mesure spatiale

– Ex : ensemble des régions où apparaissent des profils de patients (…)

• Problématiques

– Définition de modèles/des algèbres intégrant :

• des mesures spatiales

• des dimensions spatiales

• des données continues (2)

– Interface

• navigation cartographique adaptée (3)

• représentation cartographique du résultat

• des référentiels instables (1)

• des données hétérogènes

• des opérateurs spatiaux

Page 5: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

5/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

Dimension spatiale

Médicaments

Produit-code produit-nom produit…

Année-code année

Classe-code type-nom type

-Nombre d’unités

Conso

Département-num dept-nom departement

Région-num région-nom région

Temps

Mois-code mois

Localisation

Hôpital-num hôpital-nom hôpital-Nb lits…

Page 6: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

6/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

Mesure spatiale

- dept- nombre depts

Pathologie-nom-…

Pathologie

Mois-code mois

Jour-code jour

Temps

Incidence-intervalle

Incidence

Surveillance

Page 7: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

7/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

Référentiel instable : dimension spatiale évolutive (1)

• Problématique

– L’hétérogénéité des données est aussi liée à leur structuration

– La nature et l’organisation des données évoluent au cours du temps

– Un référentiel unique ne s’impose pas toujours

– Les informations liées à l’évolution temporelle des données font partie du processus

décisionnel

• Exemples

– Dimensions non spatiales

• Organisation d’un service, nomenclature,…

– Dimensions spatiales

• Découpage politique (RFA/RDA, Europe…)…

• Découpage multi-critères (foresterie*, ...)…

*[M. Miquel, Y. Bédard, A. Brisebois. Conception d'entrepôts de données géospatiales à partir de sources hétérogènes, exemple d'application en foresterie. Revue ISI-NIS, Special Issue Data warehousing, Volume 7-n°3/2002]

Page 8: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

8/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

Modèle multidimensionnel m3

• Version de membre– Évolution des instances d’une dimension

• Dimension évolutive– Évolution de la structure hiérarchique des membres

• Relations de mapping– Conservation des liens de transitions entre versions de membre

• Indice de confiance– Description de la confiance associée aux mappings

• Version de structure– État valide et invariant de la structure multidimensionnelle sur un intervalle de temps

• Modes temporels de présentation– Modes qui peuvent être choisis pour représenter les résultats de requêtes

multidimensionnelles

• Table de faits intégrant les différents modes temporels de présentation – Construite automatiquement à partir d’une table de fait traditionnelle, des dimensions

et des relations de mapping

[M. Body, M. Miquel, Y. Bédard, A. Tchounikine, “Handling Evolutions in Multidimensional Structure” IEEE International Conference on Data Engineering, ICDE, March 5-8 2003, Bangalore, Inde]

Page 9: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

9/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

P1

P2

PF12

PF2

PF3

<P1,PF1, {( xx2

1 ,em)},{( xx ,em)} >;

<P1,PF2, {( xx3

1 ,em)}{( xx

3

2 ,em)}> ;

<P1,PF3, {( xx6

1 ,em)}{( xx

2

1 ,em)} >;

<P2,PF2, {( xx2

1 ,em)}{( xx

3

1 ,em)} > ;

<P2,PF3, {( xx2

1 ,em)}{( xx

2

1 ,em)} >

Sales [01/2001 ; Now]

Dept.Paul [01/2002 ; Now]

Dept.Jones [01/2001 ; 12/2001]

[01/2003 ; Now] [01/2001 ; 12/2002]

Dept.Bill [01/2002 ; Now]

[01/2003 ; Now]

<Dpt.Jones_id, Dpt.Bill_id, {( xx 4.0 , am)}, {( xx , em)}> <Dpt.Jones_id, Dpt.Paul_id, {( xx 6.0 , am)}, {( xx , em)} >

Page 10: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

10/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

Page 11: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

11/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

Entrepôt de données continues (2)

• Problématique

– Observer les phénomènes naturels naturellement

– Besoin d’analyser les données à des granularités spatiales et temporelles très fines

– Problème des valeurs manquantes

Page 12: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

12/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

Entrepôt de données continues

[T. Ahmed. Multidimensional Structures Dedicated to Continuous Spatio-temporal Phenomena. Proceeding of the 22nd British National Conference on Databases (BNCOD), 2005]temps

valeurs

résultat

valeursobservées valeurs

estimées

Espace d’étude

Capteurs depollution

input

cubecontinu

application de méthodesd’interpolation spatiales

et temporelles

cube discret

Base dedonnées

Page 13: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

13/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

Interface de navigation : GéOlap (3)

• Fonctionnalités

– Fenêtre pour la selection des mesures et des dimensions

– Fenêtres multi-modales synchronisées

• tabulaire, graphique, cartographique

– opérateurs classiques OLAP disponibles sur chaque mode

Page 14: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

14/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

GéOlap

Page 15: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

15/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

Page 16: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

16/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

Gé-W-Olap

Webform

SOAP

HTTP

XML-ASOAP

HTTP

discover, execute

XML

Serveur .netClient web

Ms Analysis Services

Page 17: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

17/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

Mesure spatiale et objet spatial complexe (multi-facettes)

- dept- nombre depts

Département-map-nom dept-population-superficie-classe SP

Pathologie-nom-…

Pathologie

Mois-code mois

Jour-code jour

Temps

Incidence-intervalle

Incidence

Surveillance

Page 18: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

18/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

Représentation visuelle

• Principes de « la graphique » [J. Bertin]

Page 19: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

19/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

Extension de l’algèbre OLAP aux opérateurs SIG

roll-up

Opérateurs OLAP

drill-down

rotate

clipping

Opérateurs SIG

distance

touch

Opérateurs SOLAP

select

min, max, sum, count, ..

group-by

Opérateurs SQL

where

Page 20: Laboratoire d'InfoRmatique en Image et Systèmes d'information Panorama de travaux autour de lintégration de données spatio-temporelles dans les hypercubes

20/20

Laboratoire d'InfoRmatique en Image et Systèmes d'information

Conclusions

• Richesses des problématiques et des applications

– Modèles, algèbres, stockage et optimisation, hétérogénéités des sources, interface …

– Santé, phénomènes naturels, environnement, gestion du risque/prévention, …

• Objet spatial

– Différentes « facettes »

• géométrique, descriptive, métrique

• discret, continu

– Différentes représentations cartographiques

• zonal, ponctuel, linéaire

• variables visuelles

• représentation multiple et généralisation

• Solutions non spécifiques

– Objet spatial vs objet « complexe »

– Objet spatial vs objet multimedia

– Objet spatial vs objet multi-représentation