35
Sémantisation des données pour le monde environnemental Danielle Ziébelin Philippe Genoud LIG STEAMER Université de Grenoble [email protected] 1

Sémantisation des données pour le monde environnemental

Embed Size (px)

DESCRIPTION

Sémantisation des données pour le monde environnemental. Danielle Ziébelin Philippe Genoud LIG STEAMER Université de Grenoble [email protected]. Données environnementales. Que sont les données environnementales : Collections : spécimens, échantillons, prélèvements … Études Écologiques - PowerPoint PPT Presentation

Citation preview

Page 1: Sémantisation des données pour le monde environnemental

1

Sémantisation des données pour le monde

environnemental

Danielle ZiébelinPhilippe Genoud

LIG STEAMER Université de [email protected]

Page 2: Sémantisation des données pour le monde environnemental

2

Données environnementales

• Que sont les données environnementales :– Collections : spécimens, échantillons, prélèvements …– Études Écologiques– Séquences génomiques– Analyses d’images, LIDAR– Monitoring de la biodiversité

• Quels sont les traitements :– identifier, comparer, évaluer les populations ou des

quantités, localiser et dater des données et/ou des analyses

• Les données de la biodiversité sont – Globalement distribuées et volumineuses– Hautement hétérogènes au niveau de leur structure et leur

contenu– Augmentent rapidement

Page 3: Sémantisation des données pour le monde environnemental

3

Le web sémantique peut aider à l’intégration et au partage de données

• Métadonnées– Directive Inspire– Directive SEIS (Shared Environmental Information System )– Iso 19115, 19119,19110 …

• Vocabulaires contrôlés– LTRE (Linked Thesaurus fRamework for Environement), – EARTh (Environmental Applications)– Thésaurus Ecoplanète (ministère Ecologie), – Thesaurus AnaEE-France, – EnVoc (en relation avec Convention sur la biodiversité),– …

• Ontologies– OBOE (Extensible Observation Ontology)– SERONTO (Socio-Ecological Research and Observation oNTOlogy)– SWEET (Semantic Web for Earth and Environmental Terminology)– SSN ontology (Semantic Sensor Network Ontology)– Envo (Environment Ontology),– …

Page 4: Sémantisation des données pour le monde environnemental

4

Charactéristiques communes des architectures du web sémantiques (1)

Collecter de nouvelles données

Web

Applications WEB applications pour des utilisateurs avec un GUI adapté

Accéder à des ressources :

données ou des connaissances

Services WEB configurés pour ajouter de l’information

Quelles sont les ressources en eaux

que je peux allouer à un projet d’extraction pétrolière et gazière ?

Quelle est l’évolution de

cet écosystème

(eau, sol) par rapport au

réchauffement climatique ?

Page 5: Sémantisation des données pour le monde environnemental

5

Plan

• Introduction et objectifs• Architecture• Données et modèles de données• Ontologies• Lier les données• Requêtes sémantiques• Conclusions

Page 6: Sémantisation des données pour le monde environnemental

Exemple d’Architecture MAP-EON

6

RDF Graph

MapEON serverLOD Cloud

Query Processor (SPARQL)

Adaptator1 Adaptatorn

Data Loader

Ontology manager

Ontology Loader

OWL reasonerOWL DL

ontologies

MapEON Client

Triplestore

Page 7: Sémantisation des données pour le monde environnemental

7

Exemple d’architecture ObsBD

“Lightweight Ontology-Based Tools for Managing Observational Data” Shawn Bowers, Riley Englin, Carlos Fonseca, Paul Jewell, Lauren Joplin, Patrick Mosca, Tyler Pacheco, Jacob Troxel, Tyler Weeks, Proceedings of the First International Workshop on Semantics for Biodiversity Montpellier, France, May 27, 2013

Page 8: Sémantisation des données pour le monde environnemental

8

Technologies de Web Sémantique

•Données et Ontologies– Ontologies (RDFS/OWL )– Annotations (RDF)– Déduction (Pellet, Hermit,

BraidComposer …)– Requêtes (SPARQL)

• Services– WFS - WPS– Web services sémantiques

Page 9: Sémantisation des données pour le monde environnemental

9

Plan

• Introduction et objectifs• Architecture• Données et modèles de données• Ontologies• Lier les données• Requêtes sémantiques• Conclusions

Page 10: Sémantisation des données pour le monde environnemental

10

Données de MAP-EON • tabular data (excel file)

Measure

MeasureDescriptor

location

site type

Site Measures Set

Region

Page 11: Sémantisation des données pour le monde environnemental

11

Modèle de données de l’application

Quelques classes et relations qui décrivent les concepts utilisés dans l’application

Page 12: Sémantisation des données pour le monde environnemental

Owl class defining the rdf:type of the individual

Graphe RDFLes données sont transformées en un graphe RDF qui utilise le

vocabulaire défini dans le modèle d’application.

12

subject predicate objectobject property

individual(resource

identified by an URI)

RDF Resource Description Framework (W3C standard)

individual

literal valuedata property

rdf:type

:region

:has

Mea

sure

Set

:contains

:value

:descriptor

:symbol:unit

wgs84_pos:lon

wgs84_pos:lat

rdf:type

rdf:type

rdf:type

rdf:type

rdf:type

RDFS and OWL add semantic to RDF

Page 13: Sémantisation des données pour le monde environnemental

13

Exemple d’ontologie de Domaine

Hydrologic Ontology for Discovery (http://his.cuahsi.org/ontologyfiles.html)The purpose of this ontology is to support the discovery of time-series data collected at a fixed point, including physical, chemical, and biological measurements.

• Le graphe peut être enrichi en exploitant une ontologie de domaine

Page 14: Sémantisation des données pour le monde environnemental

14

Modèle de l’application + Ontologie de domaine

:region

:has

Mea

sure

Set

:contains

:value

:descriptor

:symbol:unit

wgs84_pos:lon

wgs84_pos:lat

rdf:type

rdf:type

rdf:type

rdf:type

rdf:type

domain ontology

rdf:type

• Le graphe peut être enrichi par des éléments de l’ontologie de domaine

Page 15: Sémantisation des données pour le monde environnemental

Weight Mass Unit

Biomass

usesStandard

Gram

is-a

Bio.EntityTree

Leaf LitterTree Leaf Wet Weight Dry Weight

Observation

Measurement

Site Species Ind Mass

GCE6 Picea Rubens 1 75.13

GCE6 Picea Rubens 2 179.81

GCE7 Picea Rubens 1 443.20

… … … …

Data

Structural Metadata

<attribute id=“att.4”> <attributeName> Mass </attributeName></attribute>

hasMeasurement

OBOE Semantic Annotation

Domain-Specific Ontology

is-a is-ais-a

is-a

has-part

hasCharacteristicis-a

part-of is-a

ofEntity

usesStandardofCharacteristic

SONet: Scientific

Observations Network

Dr. Mark SchildhauerDirector of Computing

NCEAS, UCSB USA

Page 16: Sémantisation des données pour le monde environnemental

Ontologie d’observations : OBOE

16

hasValue

Multiples modèles pour les observations : Exemples O&M, PATO/EQ, ODM, OBOE“core concepts” décrit : Entities, properties measured, units, protocols, etc.

Extensible OBservation Ontology (OBOE)

Entity

Characteristic

Observation

Measurement

Protocol Standard

hasMeasurement

ofCharacteristic

usesProtocol usesStandard

ofEntity

hasContext

1..1*

1..1

*

*

*

1..11..1

1..1**

**

Value

1..1

Observations et mesures : ISO 19156O&M : dépences directes • Feature ISO 19109• Geometry ISO 19107• Temporal ISO 19108• Coverage (fields) ISO 19123• Metadata ISO 19115-12• Meta-model ISO 19150-2• Basic datatypes ISO 19103

O&Min OWL | Simon CoxCox, OGC Abstract Specification – Topic 20: Observations and Measurements 2.0ISO 19156:2011 Geographic Information – Observations and measurements

Page 17: Sémantisation des données pour le monde environnemental

17

Plan

• Introduction et objectifs• Architecture• Données et modèles de données• Ontologies• Lier les données• Requêtes sémantiques• Conclusions

Page 18: Sémantisation des données pour le monde environnemental

18

Types d’ontologies : différents objectifsCatherine Roussey (ISTREA)

• Ontologies terminologiques :– Interopérabilité lexicale

• Ontologies de données : – Interopérabilité sur les données

• Ontologie Logique – Interopérabilité d’objets

Page 19: Sémantisation des données pour le monde environnemental

19

Types d’ontologies : différents objectifsCatherine Roussey (IRSTEA)

• Ontologies terminologiques : Interopérabilité lexicale

Concept/ Class

Term

Object/Instance

Relation

hasLabel

Property

Semantic Relation

Object Relation

Linguistic Relation

Textual DefinitionLogical Definition

isInstanceOf

hasArgument

hasName hasArgument

hasArgument

hasN

ame

hasName

*

*

*

1

** 11

* *

**

*

Page 20: Sémantisation des données pour le monde environnemental

20

Types d’ontologies : différents objectifsCatherine Roussey (IRSTEA)

Concept / Class

Term

Object/Instance

Relation

hasLabel

Property

Semantic Relation

Object Relation

Linguistic Relation

Textual DefinitionLogical Definition

isInstanceOf

hasArgument

hasName hasArgument

hasArgument

hasN

ame

hasName

*

*

1

** 11

* *

**

*

• Ontologies de données : Interopérabilité sur les données

Page 21: Sémantisation des données pour le monde environnemental

21

Types d’ontologies : différents objectifsCatherine Roussey (IRSTEA)

• Ontologie Logique : Interopérabilité d’objets / de concepts

Concept / Class

Term

Object/Instance

Relation

hasLabel

Property

Semantic Relation

Object Relation

Linguistic Relation

Textual DefinitionLogical Definition

isInstanceOf

hasArgument

hasName hasArgument

hasArgument

hasN

ame

hasName

*

*

*

1

** 11

* *

**

Page 22: Sémantisation des données pour le monde environnemental

22

Plan

• Introduction et objectifs• Architecture• Données et modèles de données• Ontologies• Lier les données• Requêtes sémantiques• Conclusions

Page 23: Sémantisation des données pour le monde environnemental

23

:region

:has

Mea

sure

Set

:contains

:descriptor

Individual :region Object Property

Owl class defining the rdf:type of the individual Data Property

legend

Lier les données au LOD cloud• Lien avec l’ontologie de domaine• Lien avec des jeux de données ouvertes

domain ontology

application ontology

rdfs:seeAlso

corresponding geonames resource

rdfs:seeAlso

corresponding DBpedia resource

Page 24: Sémantisation des données pour le monde environnemental

24

Lien avec le LOD cloud• Liens avec les descriptions RDF de geonames

http://sws.geonames.org/5892587/

resource URI

RDF description

geonames resourcedescribing Northwest Territories

Page 25: Sémantisation des données pour le monde environnemental

25

Lier des données de différentes sources

• Lier des entités et les caractéristiques de 2 ontologies : Utilise des axiomes d’inclusion et d’équivalence de OWL– Équivalence :

• propriété owl:equivalentClass • propriété owl:equivalentProperty• propriété owl:sameAs• …

• Généralisation/Spécialisation : • rdfs:subClassOf• rdfs:subPropertyOf

Page 26: Sémantisation des données pour le monde environnemental

26

Querying Data trough Ontology

Query

MultiMedia Source

Observation Data Base

Observation Data Base

Mapping

LocalSchema

LocalSchema

LocalOntology

GlobalOntology

Page 27: Sémantisation des données pour le monde environnemental

27

Caractéristiques communes des architectures du web sémantique

• Intéroperabilité et intégration de différentes ressources

• Données structurées ou non structurées– Documents– Data-bases

• Données spatio-temporelles hétérogènes– Multi-sites avec multi-acteurs– Multi-modèles – Multi-formats

Page 28: Sémantisation des données pour le monde environnemental

28

Plan

• Introduction et objectifs• Architecture• Données et modèles de données• Ontologies• Lier les données• Requêtes sémantiques• Conclusions

Page 29: Sémantisation des données pour le monde environnemental

29

Requêtes sémantiques• Accéder à des informations inférées depuis l’ontologie de

domaine• Accéder à des informations supplémentaires au travers de

données liées (linked data)

Page 30: Sémantisation des données pour le monde environnemental

30

Requêtes sémantiques

• Interroger les données avec des données inférées (SPARQL)

Page 31: Sémantisation des données pour le monde environnemental

31

Plan

• Introduction et objectifs• Architecture• Données et modèles de données• Ontologies• Lier les données• Requêtes sémantiques• Conclusions

Page 32: Sémantisation des données pour le monde environnemental

32

Retour d’expérience sur les pratiques

• Au niveau local : sources de données : – Amélioration de la qualité des données– Publication des sources de donnée avec les

métadonnées– Recherche de documentation et de liaison des

données– Architecture complexe avec des modules

nouveaux : cartographie et du spatio-temporel

• Au niveau communautaire– Standards ISO, OGC– Propriété intellectuelle, information privée et

partagée, accès publique, VGI, licences.– Infrastructures et portails.

Page 33: Sémantisation des données pour le monde environnemental

33

Retour d’expérience : les outils

• Recherche et création de liens– outils existants

• e.g. SILK A Link Discovery Framework for the Web of Data, http://wifo5-03.informatik.uni-mannheim.de/bizer/silk/)

– exploitation de l’information spatiale et temporelle

• Publication des données– outils génériques pour transformer des jeux de

données en RDF• dataLift http://datalift.org/ , • open refine (former google refine) http://openrefine.org/ )

Page 34: Sémantisation des données pour le monde environnemental

34

Travaux connexes

– GEO BON Biodiversity Observation Network within GEOSS Global Earth Observation System of Systems, Portal (global)

• Worldwide voluntary effort • GEOSS Earth Observation infrastructure

– GEO portal : web portal, search registries– GEOSS components and services registry (catalogue)– GEOSS clearinghouse (connects the differents

components)– GEOSS standards and interoperability (catalologue of

standards)– http://www.geoportal.org/web/guest/– http://wiki.ieee-earth.org/Documents/GEOSS_Tutorials/

• GEOSS Water Services

Page 35: Sémantisation des données pour le monde environnemental

35

Travaux connexes

• Shared Environmental Information System (Europe) http://ec.europa.eu/environment/seis/

• Semantic Web for Earth and Environmental Terminology (SWEET), http://sweet.jpl.nasa.gov/sweet/

• Extensible Observation Ontology (OBOE) https://code.ecoinformatics.org/code/semtools/trunk/dev/oboe/oboe.1.1rc1/oboe-core.owl

• SemantEco/SemantAqua : Rensselaer Polytechnic Institute (D. McGuinness) http://tw.rpi.edu/web/project/SemantEco

• ObsDB : Gonzaga University Washington