12
Mehrdad Salehi, Mehrdad Salehi, candidat au candidat au doctorat doctorat Directeur: Directeur: Dr. Yvan Bédard Dr. Yvan Bédard Codirecteur: Codirecteur: Dr. Mir Abolfazl Dr. Mir Abolfazl Mostafavi Mostafavi Conseiller: Conseiller: Dr. Jean Brodeur Dr. Jean Brodeur Chaire de recherche industrielle en bases de données Chaire de recherche industrielle en bases de données géospatiales décisionnelles géospatiales décisionnelles Le 28 avril 2005 Le 28 avril 2005 Université Laval Université Laval Problèmes de cohérence dans les bases de données géospatiales multidimensionnelles

Problèmes de cohérence dans les bases de données géospatiales multidimensionnelles

  • Upload
    caraf

  • View
    30

  • Download
    0

Embed Size (px)

DESCRIPTION

Problèmes de cohérence dans les bases de données géospatiales multidimensionnelles. Mehrdad Salehi, candidat au doctorat Directeur: Dr. Yvan Bédard Codirecteur: Dr. Mir Abolfazl Mostafavi Conseiller: Dr. Jean Brodeur. - PowerPoint PPT Presentation

Citation preview

Page 1: Problèmes de cohérence dans les bases de données géospatiales multidimensionnelles

Mehrdad Salehi, Mehrdad Salehi, candidat au candidat au doctoratdoctoratDirecteur:Directeur: Dr. Yvan Bédard Dr. Yvan BédardCodirecteur:Codirecteur: Dr. Mir Abolfazl Dr. Mir Abolfazl MostafaviMostafaviConseiller:Conseiller: Dr. Jean Brodeur Dr. Jean Brodeur

Chaire de recherche industrielle en bases de données Chaire de recherche industrielle en bases de données géospatiales décisionnellesgéospatiales décisionnelles

Le 28 avril 2005Le 28 avril 2005

Université LavalUniversité Laval

Problèmes de cohérence dans les bases de données

géospatiales multidimensionnelles

Page 2: Problèmes de cohérence dans les bases de données géospatiales multidimensionnelles

Mise en ContexteBases de données géospatiales multidimensionnelles

Combinaison des données géospatiales et d’une structure Combinaison des données géospatiales et d’une structure multidimensionnelle.multidimensionnelle.

Un des systèmes les plus efficaces pour la prise de Un des systèmes les plus efficaces pour la prise de décision.décision.

Un système de prise de décision doit fournir desUn système de prise de décision doit fournir des résultats fiables.résultats fiables.

Les incohérences dans la structure GMD causent Les incohérences dans la structure GMD causent des résultats pouvant être dommageables.des résultats pouvant être dommageables.

Page 3: Problèmes de cohérence dans les bases de données géospatiales multidimensionnelles

Types de problèmes dans les bases de données

géospatiales multidimensionnelles1.1. Incohérences au niveau de la définition de la granularité Incohérences au niveau de la définition de la granularité

dans les dimensions.dans les dimensions.

2.2. Incohérences engendrées par la façon d’agréger les Incohérences engendrées par la façon d’agréger les objets géospatiaux. objets géospatiaux.

3.3. Incohérences causées par l’évolution temporelle du Incohérences causées par l’évolution temporelle du schéma de dimensions.schéma de dimensions.

4.4. Incohérences causées par l’évolution temporelle des Incohérences causées par l’évolution temporelle des instances de chaque dimension.instances de chaque dimension.

5.5. L’incompatibilité des fonctions d’agrégation avec L’incompatibilité des fonctions d’agrégation avec les mesures et les dimensions. les mesures et les dimensions.

Page 4: Problèmes de cohérence dans les bases de données géospatiales multidimensionnelles

Incohérences au niveau de la définition de la granularité dans les

dimensions1.1. Différence entre les définitions sémantiques et Différence entre les définitions sémantiques et géométriques des niveaux:géométriques des niveaux:

structure sémantique de la dimension:structure sémantique de la dimension: Département Département Faculté Faculté Université Université

structure géométrique de la dimension: structure géométrique de la dimension: Pavillon Pavillon Université Université

2.2. Définition de la granularité sans considérer les Définition de la granularité sans considérer les mesures :mesures :

niveaux de dimension: niveaux de dimension: Ville Ville État État

mesure:mesure: nombre d’accidents, nombre d’accidents, il faut alors définir les niveaux de dimension : il faut alors définir les niveaux de dimension : (Ville, (Ville, Village) Village) État État

3.3. Différence dans la définition des hiérarchies:Différence dans la définition des hiérarchies:Ville Ville Province Province Pays , Ville Pays , Ville Région Région Pays Pays

Page 5: Problèmes de cohérence dans les bases de données géospatiales multidimensionnelles

Incohérences engendrées par l’agrégation des objets géospatiaux

Les objets agrégés sont calculés durant deux étapes Les objets agrégés sont calculés durant deux étapes successives:successives:

Étape 1: Classification des objets plus détaillés.Étape 1: Classification des objets plus détaillés. 1.1. Sémantique des objets.Sémantique des objets.2.2. Distribution de la géométrie des objets. Distribution de la géométrie des objets. 3.3. Contraintes d’intégrité spatiale entre les objets.Contraintes d’intégrité spatiale entre les objets.4.4. Conditions de Conditions de “Summarizability”.“Summarizability”.

Étape 2: Calcul des objets agrégés.Étape 2: Calcul des objets agrégés.1.1. Cohérence entre les objets agrégés dans le même niveau d’une Cohérence entre les objets agrégés dans le même niveau d’une

dimension.dimension.2.2. Cohérence entre les objets dans la même dimension mais de différents Cohérence entre les objets dans la même dimension mais de différents

niveaux d’agrégation.niveaux d’agrégation.3.3. Cohérence entre les objets agrégés dans différents niveaux dans Cohérence entre les objets agrégés dans différents niveaux dans

différentes dimensions. différentes dimensions.

Page 6: Problèmes de cohérence dans les bases de données géospatiales multidimensionnelles

Étape 1: Classification des objets plus détaillés (1/2)

Il faut considérer différents aspects:Il faut considérer différents aspects:

1.1. La sémantique des objets: La sémantique des objets:

2.2. La distribution spatiale des objets:La distribution spatiale des objets:

Bâtiment CommercialBâtiment Commercial

Bâtiment RésidentielBâtiment Résidentiel

200 m200 m

Page 7: Problèmes de cohérence dans les bases de données géospatiales multidimensionnelles

Étape 1: Classification des objets plus détaillés (2/2)

3.3. Les contraintes d’intégrité spatiale entre les objets:Les contraintes d’intégrité spatiale entre les objets:

4.4. Les conditions de Les conditions de ““SummarizabilitySummarizability””

Route Route BâtimentBâtiment

Route Route BâtimentBâtiment

IncohérenceIncohérence : À cause de la route on doit avoir deux classifications : À cause de la route on doit avoir deux classifications

Deux classifications ne peuvent pas avoir des membres Deux classifications ne peuvent pas avoir des membres

communscommuns

Page 8: Problèmes de cohérence dans les bases de données géospatiales multidimensionnelles

Étape 2: Calcul des objets agrégésIl faut considérer différents aspects: Il faut considérer différents aspects: 1.1. La cohérence entre les objets agrégés dans le même niveau La cohérence entre les objets agrégés dans le même niveau

d’une dimension:d’une dimension:

2.2. La cohérence entre les objets agrégés dans différents niveaux La cohérence entre les objets agrégés dans différents niveaux dans différentes dimensions: dans différentes dimensions:

3.3. La cohérence entre les objets dans la même dimension La cohérence entre les objets dans la même dimension mais de différents niveaux d’agrégation: mais de différents niveaux d’agrégation:

DeuxDeux blocs de bâtiments ne doivent pasblocs de bâtiments ne doivent pasêtre superposés être superposés

RouteRoute Bloc de bâtiment Bloc de bâtiment

Bloc de bâtiment ne doit pas superposer la route Bloc de bâtiment ne doit pas superposer la route

Le bloc de bâtiment ne doit pas superposer les Le bloc de bâtiment ne doit pas superposer les bâtiments bâtiments

Page 9: Problèmes de cohérence dans les bases de données géospatiales multidimensionnelles

Incohérences causées par l’évolution temporelle du schéma des

dimensionsLa structure des dimensions peut changer dans le La structure des dimensions peut changer dans le temps. Ce changement peut créer des résultats temps. Ce changement peut créer des résultats incohérents avec les objets agrégés précédemment. incohérents avec les objets agrégés précédemment.

1.1. Ajouter ou enlever un niveau:Ajouter ou enlever un niveau: T1: Quartier T1: Quartier Ville Ville Province Province pays , T2 : Quartier pays , T2 : Quartier Province Province

payspays Les objets agrégés (les dimensions et les mesures) La nouvelle situation Les objets agrégés (les dimensions et les mesures) La nouvelle situation ont été calculés dans cette situationont été calculés dans cette situation

2.2. ““RelateRelate”” ou ou ““un-relateun-relate”” entre deux niveaux: entre deux niveaux: T1: Quartier Ville Province pays , T2: Quartier Ville Province pays Région Région

Les objets agrégés (les dimensions et les mesures) La nouvelle situation Les objets agrégés (les dimensions et les mesures) La nouvelle situation ont été calculés dans cette situationont été calculés dans cette situation

3.3. Changement sémantiques dans les dimensions:Changement sémantiques dans les dimensions: T1: Région: Nord et Sud , T2: Région: Est et Ouest T1: Région: Nord et Sud , T2: Région: Est et Ouest

Les objets agrégés (les dimensions et les mesures) La nouvelle situation Les objets agrégés (les dimensions et les mesures) La nouvelle situation ont été calculés dans cette situationont été calculés dans cette situation

Page 10: Problèmes de cohérence dans les bases de données géospatiales multidimensionnelles

Incohérences causées par l’évolution temporelle des instances

de dimensions2.2. Évolution sémantique des instances de dimensions qui cause Évolution sémantique des instances de dimensions qui cause

une re-classification et qui change la partition précédente:une re-classification et qui change la partition précédente:

Classification a été faite dans cette situation La nouvelle situation et son incohérence avec les Classification a été faite dans cette situation La nouvelle situation et son incohérence avec les classifications précédente classifications précédente

2.2. Évolution géométrique des instances qui affecte l’objet agrégé Évolution géométrique des instances qui affecte l’objet agrégé dans l’étape précédente:dans l’étape précédente:

Bâtiment CommercialBâtiment Commercial

Bâtiment RésidentielBâtiment RésidentielT1:T1:

T1:T1: T2:T2:

Évolution géométrique n’a pas affecté les classifications, mais elle a affecté le calcul d’objets Évolution géométrique n’a pas affecté les classifications, mais elle a affecté le calcul d’objets agrégés.agrégés.

Bâtiment RésidentielBâtiment Résidentiel

Bâtiment RésidentielBâtiment RésidentielT2:T2:

Page 11: Problèmes de cohérence dans les bases de données géospatiales multidimensionnelles

L’incompatibilité des fonctions d’agrégation avec les mesures et les

dimensions Il n’est pas toujours possible d’utiliser toutes les fonctions Il n’est pas toujours possible d’utiliser toutes les fonctions

d'agrégation pour une mesure en une dimension:d'agrégation pour une mesure en une dimension: DimensionsDimensions: Temps, Nombre de voies, Région administrative : Temps, Nombre de voies, Région administrative MesureMesure: Longueur de route: Longueur de route

Fait 1Fait 1: Longueur des routes qui avaient plus de deux voies à Québec en : Longueur des routes qui avaient plus de deux voies à Québec en 2003. 2003.

Fait 2Fait 2: Longueur des routes qui avaient plus de deux voies à Québec en : Longueur des routes qui avaient plus de deux voies à Québec en 2004.2004.

Il n’est pas permit d’utiliser la fonction “SUM” pour les mesures “Longueur de Longueur de routeroute” dans la dimension “Temps”, car elle produit des résultats redondants.

Page 12: Problèmes de cohérence dans les bases de données géospatiales multidimensionnelles

Notre Objectif

Développer une méthode pour diminuer les incohérences lors Développer une méthode pour diminuer les incohérences lors du peuplement des bases de données géospatiales du peuplement des bases de données géospatiales multidimensionnelles, pour fournir aux utilisateurs, des multidimensionnelles, pour fournir aux utilisateurs, des systèmes décisionnels fiablessystèmes décisionnels fiables..