54
METTRE DE L'INTELLIGENCE DANS LES DONNÉES LIÉES MATHIEU D'AQUIN - @MDAQUIN KNOWLEDGE MEDIA INSTITUTE, THE OPEN UNIVERSITY

Mettre de l'intelligence dans les donnees liees

Embed Size (px)

DESCRIPTION

Seminar at LIRIS, Lyon, France on 02/12/2014

Citation preview

Page 1: Mettre de l'intelligence dans les donnees liees

METTRE DEL'INTELLIGENCEDANS LES DONNÉESLIÉESMATHIEU D'AQUIN - @MDAQUIN

KNOWLEDGE MEDIA INSTITUTE, THE OPENUNIVERSITY

Page 2: Mettre de l'intelligence dans les donnees liees

Le web des données liées c'est bien....

Page 3: Mettre de l'intelligence dans les donnees liees

Le web des données liées c'est bien....Pourvoir en faire quelques chose, c'est mieux !

Page 4: Mettre de l'intelligence dans les donnees liees

LE WEB DES DONNÉES LIÉES C'EST BIEN....

Page 5: Mettre de l'intelligence dans les donnees liees

LE WEB DES DONNÉES LIÉES C'EST BIEN....

Page 6: Mettre de l'intelligence dans les donnees liees

EXEMPLE: DATA.OPEN.AC.UK

Page 7: Mettre de l'intelligence dans les donnees liees

EXEMPLE: DATA.OPEN.AC.UKCours: 600 module de cours + nivaux, crédits, sujets, etc.Publications: 30,000 articles de recherche + auteurs,conférences, etc.Podcasts: 2220 podcasts video et 1500 podcats audio +liens vers les cours, etc.Ressources éducationnelles ouvertes: 640 unités +liens vers les cours, etc.Videos Youtube: 900 videos + liens vers les cours et leschecheursBâtiments: 100 Bâtiments + address et photosBibliothèque: 12,000 livres + liens vers les coursOthers...

Page 8: Mettre de l'intelligence dans les donnees liees

EXEMPLE: DATA.OPEN.AC.UK

Applications: "Study at the OU", "OU Buildings", "OUAnywhere", "Facebook Course Profile", etc.

Page 9: Mettre de l'intelligence dans les donnees liees

EXEMPLE: DATA.OPEN.AC.UK

Un autre exemple d'application, un peu moins simple : inscriptionaux course de différents sujets, a diffèrent endroits

Page 10: Mettre de l'intelligence dans les donnees liees

PLUS D'INTELLIGENCE ?

Données Données liées Web Sémantique

Page 11: Mettre de l'intelligence dans les donnees liees

EXEMPLE: RECOMMANDATIONVersion simple

Page 12: Mettre de l'intelligence dans les donnees liees

EXEMPLE: RECOMMANDATIONQuand les resources sont hétérogènes...

Page 13: Mettre de l'intelligence dans les donnees liees

EXEMPLE: RECOMMANDATIONQuand les resources sont hétérogènes...

Page 14: Mettre de l'intelligence dans les donnees liees

EXEMPLE: RECOMMANDATIONQuand les resources sont hétérogènes...

Page 15: Mettre de l'intelligence dans les donnees liees

EXEMPLE: RECOMMANDATION - DISCOU ( )DISCOU.INFO

d'Aquin etal, demo @ISWC 2012

Page 16: Mettre de l'intelligence dans les donnees liees

EXEMPLE: RECOMMANDATION - DISCOU ( )DISCOU.INFO

Page 17: Mettre de l'intelligence dans les donnees liees

EXEMPLE: RECOMMANDATION - DISCOU ( )DISCOU.INFO

Page 18: Mettre de l'intelligence dans les donnees liees

EXEMPLE: RECOMMANDATION - DISCOU ( )DISCOU.INFO

Page 19: Mettre de l'intelligence dans les donnees liees

EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO

Explaining Patterns with Linked Data

Tiddi et al. @ ESWC 2014 et COLD 2014

Page 20: Mettre de l'intelligence dans les donnees liees

EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO

Expliquer le déséquilibre entre l'éducation des hommes et des femmes dans diffèrents pays

Pays où les hommes ont plus d'éducation ; les femmes ; égalité

Page 21: Mettre de l'intelligence dans les donnees liees

EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO

Expliquer le déséquilibre entre l'éducation des hommes et des femmes dans diffèrents pays

Pays où les hommes ont plus d'éducation en jaune; les femmes en bleue; égalité

en verts

Page 22: Mettre de l'intelligence dans les donnees liees

EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO

Page 23: Mettre de l'intelligence dans les donnees liees

EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO

Page 24: Mettre de l'intelligence dans les donnees liees

(i.e. un chemin de relations, et une valeur) qui sont les plusreprésentative du cluster (maximum F-Score).

Difficulté : On ne connaît pas le graphe à l'avance - il faut leconstruire au fur et à mesure de l'exploration

EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO

Principe :Un algorithme A* qui recherche les règles de la formeX - p1 - p2-...- pn - valeur -> inCluster(X)

Page 25: Mettre de l'intelligence dans les donnees liees

EXEMPLE PLUS AVANCÉ : DEDALO ( )LINKEDU.EU/DEDALO

Aider nous a evaluer Dedalo: linkedu.eu/dedalo/eval/

Page 26: Mettre de l'intelligence dans les donnees liees

GOING METAPour exploiter les données du Web, il ne fait pas seulement

raisonner avec les données, mais aussi raisonner sur lesdonnées.

Page 27: Mettre de l'intelligence dans les donnees liees

EXEMPLE : CATALOGUE LINKEDUP DE DONNÉES WEB LIEES ÀL'ENSEIGNEMENT

data.linkededucation.org/linkedup/catalog/

Page 28: Mettre de l'intelligence dans les donnees liees

ANALYSE DES RELATIONS ENTRE JEUX DE DONNÉES

Avant alignement

Page 29: Mettre de l'intelligence dans les donnees liees

ANALYSE DES RELATIONS ENTRE JEUX DE DONNÉES

Après alignement

d'Aquin et al. @ WebSci2013

Page 30: Mettre de l'intelligence dans les donnees liees

ANALYSE DES RELATIONS ENTRE JEUX DE DONNÉES

Après alignement

Page 31: Mettre de l'intelligence dans les donnees liees

POURQUOI C'EST IMPORTANT ?EXAMPLE DU "DATA HUB" DU PROJET MK:SMART

( )MKSMART.ORG

Page 32: Mettre de l'intelligence dans les donnees liees

EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI

Page 33: Mettre de l'intelligence dans les donnees liees

Triangulation a partir de plusieurs capteurs

EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI

Page 34: Mettre de l'intelligence dans les donnees liees

Simple analyse statistique

EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI

Page 35: Mettre de l'intelligence dans les donnees liees

Simple analyse statistique

EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI

Page 36: Mettre de l'intelligence dans les donnees liees

EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI

Page 37: Mettre de l'intelligence dans les donnees liees

EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI

Page 38: Mettre de l'intelligence dans les donnees liees

EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI

Page 39: Mettre de l'intelligence dans les donnees liees

EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI

Page 40: Mettre de l'intelligence dans les donnees liees

EXEMPLE DE CAPTEURS : MESURER L'UTILISATION DESLOCAUX AVEC DU WIFI

Page 41: Mettre de l'intelligence dans les donnees liees

AU NIVEAU DU "DATA HUB"

Page 42: Mettre de l'intelligence dans les donnees liees

ODRL pour la représentation structurées de licences de

données

POINT DE DÉPART : META-DONNÉESSTRUCTURÉES

Page 43: Mettre de l'intelligence dans les donnees liees

DataNode pour la representation des relations entre jeux dedonnees -

POINT DE DÉPART : META-DONNÉESSTRUCTURÉES

http://purl.org/datanode/ns/

Page 44: Mettre de l'intelligence dans les donnees liees

POINT DE DÉPART : META-DONNÉESSTRUCTURÉES

Page 45: Mettre de l'intelligence dans les donnees liees

Permet la propagation de meta-caractéristiques comme lesdroits et conditions d'utilisation.

POINT DE DÉPART : META-DONNÉESSTRUCTURÉES

Page 46: Mettre de l'intelligence dans les donnees liees

UN DERNIER EXEMPLE DERAISONNEMENT META

MESURER LE BIAIS DANS LE DONNÉES

Selon WikiPedia (anglais): "A statistic is biased if it iscalculated in such a way that it is systematically different

from the population parameter of interest."

Page 47: Mettre de l'intelligence dans les donnees liees

UN DERNIER EXEMPLE DERAISONNEMENT META

MESURER LE BIAIS DANS LE DONNÉES

Selon WikiPedia (anglais): "A statistic is biased if it iscalculated in such a way that it is systematically different

from the population parameter of interest."Hypothèse : Toute donnée sur le web est biaisée - avoir

conscience de ce biais est important

Page 48: Mettre de l'intelligence dans les donnees liees

UN DERNIER EXEMPLE DERAISONNEMENT META

MESURER LE BIAIS DANS LE DONNÉES

Selon WikiPedia (anglais): "A statistic is biased if it iscalculated in such a way that it is systematically different

from the population parameter of interest."Hypothèse : Toute donnée sur le web est biaisée - avoir

conscience de ce biais est important.Mais comment mesurer un biais sans connaître la

population de référence?

Page 49: Mettre de l'intelligence dans les donnees liees

MESURER LE BIAIS DANS LE DONNÉES

Compare les distributions de valeurs dans la projection dujeu de données à tester sur un jeu de données lié avec les

distributions dans l'ensemble du jeu de données.

Utilise le test de Student (test t) pour tester la significationdes différences de distributions.

Tiddi et al. @ EKAW 2014

Page 50: Mettre de l'intelligence dans les donnees liees

MESURER LE BIAIS DANS LE DONNÉES

Sur cet exemple, S est la projection de LMDB (Linked MovieDatabase) sur DBpedia.

Tiddi et al. @ EKAW 2014

Page 51: Mettre de l'intelligence dans les donnees liees

MESURER LE BIAIS DANS LE DONNÉESQuelques résultats peu surprenants...

Tiddi et al. @ EKAW 2014

Page 52: Mettre de l'intelligence dans les donnees liees

MESURER LE BIAIS DANS LE DONNÉESEt d'autres un peu plus...

Tiddi et al. @ EKAW 2014

Page 53: Mettre de l'intelligence dans les donnees liees

CONCLUSION / FUTUR

Le web sémantique avant:La promesse d'un web intelligent, avec du sens etdes raisonnements

Le web sémantique maintenant:Des données, des fois liées

Aller vers de nouvelles forme de raisonnement quis'adaptent aux caractéristiques des données liéeset qui font émerger le sens !

Page 54: Mettre de l'intelligence dans les donnees liees

MERCI

Alessandro Adamou Enrico Daga Ilaria Tiddi

Shuangyan Liu Keerthi Thomas Enrico Motta