49
Les graphes Objectifs Noyau de la chaleur et cartes de Kohonen References Introduction à l’étude des grands graphes Nathalie Villa-Vialaneix http ://www.nathalievilla.org Travail réalisé en collaboration avec Fabrice Rossi Institut de Mathématiques de Toulouse, France - [email protected] 12 novembre 2007 Nathalie Villa Grands graphes

Introduction à l’étude des grands graphes

  • Upload
    tuxette

  • View
    73

  • Download
    1

Embed Size (px)

DESCRIPTION

Séminaire Biopuces, Université Toulouse III 12 novembre 2007

Citation preview

Page 1: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Introduction agrave lrsquoeacutetude des grands graphes

Nathalie Villa-Vialaneixhttp wwwnathalievillaorg

Travail reacutealiseacute en collaboration avec Fabrice Rossi

Institut de Matheacutematiques de Toulouse France -nathalievillamathups-tlsefr

12 novembre 2007

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe Sommets

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe SommetsArecirctes

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 1 Les reacuteseaux sociaux

Graphe construit agrave partir drsquoun corpus drsquoarchives meacutedieacutevales

Agrave partir de 1000 contrats agraires duMoyen-Acircge (1250-1350) on construit un graphe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 2 Reacuteseau drsquointeacuteraction de proteacuteines

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 3 Graphes bipartis (marketing)

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

35

7 615

435

2

4

34

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 1 Les reacuteseaux sociaux

Graphe construit agrave partir drsquoun corpus drsquoarchives meacutedieacutevales

Agrave partir de 1000 contrats agraires(1250-1350) on construit un graphe pondeacutereacute

sommets les paysans trouveacutes dans les contrats

poids nombre de contrats ougrave deux paysans sont citeacutessimultaneacutement

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti Adrien Beacuteatrice

Corinne

1

211

2

1Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 2: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe Sommets

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe SommetsArecirctes

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 1 Les reacuteseaux sociaux

Graphe construit agrave partir drsquoun corpus drsquoarchives meacutedieacutevales

Agrave partir de 1000 contrats agraires duMoyen-Acircge (1250-1350) on construit un graphe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 2 Reacuteseau drsquointeacuteraction de proteacuteines

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 3 Graphes bipartis (marketing)

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

35

7 615

435

2

4

34

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 1 Les reacuteseaux sociaux

Graphe construit agrave partir drsquoun corpus drsquoarchives meacutedieacutevales

Agrave partir de 1000 contrats agraires(1250-1350) on construit un graphe pondeacutereacute

sommets les paysans trouveacutes dans les contrats

poids nombre de contrats ougrave deux paysans sont citeacutessimultaneacutement

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti Adrien Beacuteatrice

Corinne

1

211

2

1Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 3: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe Sommets

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe SommetsArecirctes

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 1 Les reacuteseaux sociaux

Graphe construit agrave partir drsquoun corpus drsquoarchives meacutedieacutevales

Agrave partir de 1000 contrats agraires duMoyen-Acircge (1250-1350) on construit un graphe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 2 Reacuteseau drsquointeacuteraction de proteacuteines

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 3 Graphes bipartis (marketing)

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

35

7 615

435

2

4

34

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 1 Les reacuteseaux sociaux

Graphe construit agrave partir drsquoun corpus drsquoarchives meacutedieacutevales

Agrave partir de 1000 contrats agraires(1250-1350) on construit un graphe pondeacutereacute

sommets les paysans trouveacutes dans les contrats

poids nombre de contrats ougrave deux paysans sont citeacutessimultaneacutement

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti Adrien Beacuteatrice

Corinne

1

211

2

1Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 4: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe Sommets

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe SommetsArecirctes

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 1 Les reacuteseaux sociaux

Graphe construit agrave partir drsquoun corpus drsquoarchives meacutedieacutevales

Agrave partir de 1000 contrats agraires duMoyen-Acircge (1250-1350) on construit un graphe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 2 Reacuteseau drsquointeacuteraction de proteacuteines

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 3 Graphes bipartis (marketing)

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

35

7 615

435

2

4

34

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 1 Les reacuteseaux sociaux

Graphe construit agrave partir drsquoun corpus drsquoarchives meacutedieacutevales

Agrave partir de 1000 contrats agraires(1250-1350) on construit un graphe pondeacutereacute

sommets les paysans trouveacutes dans les contrats

poids nombre de contrats ougrave deux paysans sont citeacutessimultaneacutement

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti Adrien Beacuteatrice

Corinne

1

211

2

1Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 5: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe SommetsArecirctes

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 1 Les reacuteseaux sociaux

Graphe construit agrave partir drsquoun corpus drsquoarchives meacutedieacutevales

Agrave partir de 1000 contrats agraires duMoyen-Acircge (1250-1350) on construit un graphe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 2 Reacuteseau drsquointeacuteraction de proteacuteines

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 3 Graphes bipartis (marketing)

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

35

7 615

435

2

4

34

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 1 Les reacuteseaux sociaux

Graphe construit agrave partir drsquoun corpus drsquoarchives meacutedieacutevales

Agrave partir de 1000 contrats agraires(1250-1350) on construit un graphe pondeacutereacute

sommets les paysans trouveacutes dans les contrats

poids nombre de contrats ougrave deux paysans sont citeacutessimultaneacutement

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti Adrien Beacuteatrice

Corinne

1

211

2

1Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 6: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 1 Les reacuteseaux sociaux

Graphe construit agrave partir drsquoun corpus drsquoarchives meacutedieacutevales

Agrave partir de 1000 contrats agraires duMoyen-Acircge (1250-1350) on construit un graphe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 2 Reacuteseau drsquointeacuteraction de proteacuteines

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 3 Graphes bipartis (marketing)

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

35

7 615

435

2

4

34

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 1 Les reacuteseaux sociaux

Graphe construit agrave partir drsquoun corpus drsquoarchives meacutedieacutevales

Agrave partir de 1000 contrats agraires(1250-1350) on construit un graphe pondeacutereacute

sommets les paysans trouveacutes dans les contrats

poids nombre de contrats ougrave deux paysans sont citeacutessimultaneacutement

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti Adrien Beacuteatrice

Corinne

1

211

2

1Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 7: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 2 Reacuteseau drsquointeacuteraction de proteacuteines

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 3 Graphes bipartis (marketing)

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

35

7 615

435

2

4

34

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 1 Les reacuteseaux sociaux

Graphe construit agrave partir drsquoun corpus drsquoarchives meacutedieacutevales

Agrave partir de 1000 contrats agraires(1250-1350) on construit un graphe pondeacutereacute

sommets les paysans trouveacutes dans les contrats

poids nombre de contrats ougrave deux paysans sont citeacutessimultaneacutement

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti Adrien Beacuteatrice

Corinne

1

211

2

1Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 8: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 3 Graphes bipartis (marketing)

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

35

7 615

435

2

4

34

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 1 Les reacuteseaux sociaux

Graphe construit agrave partir drsquoun corpus drsquoarchives meacutedieacutevales

Agrave partir de 1000 contrats agraires(1250-1350) on construit un graphe pondeacutereacute

sommets les paysans trouveacutes dans les contrats

poids nombre de contrats ougrave deux paysans sont citeacutessimultaneacutement

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti Adrien Beacuteatrice

Corinne

1

211

2

1Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 9: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Qursquoest-ce qursquoun graphe

Exemple 3 Graphes bipartis (recherche drsquoinformations)

triste

vie

amour

La vie nrsquoest pas triste

Elle a des heures tristes

Nous sommes tristes parce que

nous pleurons

Quand il nrsquoy a pas drsquoamour

il nrsquoy a pas de vie

Plaisir drsquoamour ne dure qursquoun moment

chagrin drsquoamour dure toute la vie

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

35

7 615

435

2

4

34

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 1 Les reacuteseaux sociaux

Graphe construit agrave partir drsquoun corpus drsquoarchives meacutedieacutevales

Agrave partir de 1000 contrats agraires(1250-1350) on construit un graphe pondeacutereacute

sommets les paysans trouveacutes dans les contrats

poids nombre de contrats ougrave deux paysans sont citeacutessimultaneacutement

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti Adrien Beacuteatrice

Corinne

1

211

2

1Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 10: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

35

7 615

435

2

4

34

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 1 Les reacuteseaux sociaux

Graphe construit agrave partir drsquoun corpus drsquoarchives meacutedieacutevales

Agrave partir de 1000 contrats agraires(1250-1350) on construit un graphe pondeacutereacute

sommets les paysans trouveacutes dans les contrats

poids nombre de contrats ougrave deux paysans sont citeacutessimultaneacutement

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti Adrien Beacuteatrice

Corinne

1

211

2

1Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 11: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

35

7 615

435

2

4

34

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 1 Les reacuteseaux sociaux

Graphe construit agrave partir drsquoun corpus drsquoarchives meacutedieacutevales

Agrave partir de 1000 contrats agraires(1250-1350) on construit un graphe pondeacutereacute

sommets les paysans trouveacutes dans les contrats

poids nombre de contrats ougrave deux paysans sont citeacutessimultaneacutement

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti Adrien Beacuteatrice

Corinne

1

211

2

1Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 12: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 1 Les reacuteseaux sociaux

Graphe construit agrave partir drsquoun corpus drsquoarchives meacutedieacutevales

Agrave partir de 1000 contrats agraires(1250-1350) on construit un graphe pondeacutereacute

sommets les paysans trouveacutes dans les contrats

poids nombre de contrats ougrave deux paysans sont citeacutessimultaneacutement

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti Adrien Beacuteatrice

Corinne

1

211

2

1Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 13: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti

Adrien

Beacuteatrice

Corinne

Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti Adrien Beacuteatrice

Corinne

1

211

2

1Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 14: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Pondeacuteration des arecirctes

Exemple 2 Agrave partir drsquoun graphe biparti Adrien Beacuteatrice

Corinne

1

211

2

1Les miseacuterables

Lrsquoassommoir

Bel ami

Le deuxiegraveme sexe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 15: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 16: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 17: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Orientation des arecirctes

Exemple 1 Internet (ici laquo blogosphegravere raquo)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 18: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 19: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 20: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Visualiser une eacutevolution

Exemple 1 Eacutevolution temporelle drsquoun caractegravere drsquounepopulation

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 21: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommetsEacutetiquettes qualitatives

A

B

A B

B

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 22: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets ou quantitatives

(05 02)

(13 5)

(15 3) (12 02)

(33 14)

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 23: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 24: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 25: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 1 Interaction de proteacuteines

Deacutetection des inteacuteractions par une approche biologique

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 26: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Eacutetiqueter les sommets

Exemple 2 Dans [Bleakley et al 2007] les auteursreconstruisent les arecirctes drsquoun reacuteseau meacutetabolique

sommets = enzymes arecirctes = relations fonctionnelles

agrave partir de 1 la connaissance partielle du reacuteseau 2 diffeacuterentes eacutetiquettes quantitatives donneacutees drsquoexpression

des gegravenes donneacutees de localisation des enzymes dans lacellule donneacutees de profils phylogeacuteneacutetiques des enzymes

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 27: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 28: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 29: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Preacutesentation du problegraveme

DonneacuteesOn suppose connu un graphe pondeacutereacute non orienteacute G

de sommets x1 xn

drsquoarecirctes pondeacutereacutees par (wij)ij=1n wii = 0 wij = wji etsumnj=1 wij = di (degreacute du sommet xi)

Objectifs

Deux objectifs simultaneacutes 1 classification de sommets drsquoun graphe en groupes de

similariteacute 2 repreacutesentation simplifieacutee du graphe par ses groupes et leurs

relations respectives

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 30: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 31: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 32: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 33: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Applications concregravetes

Reacuteseaux sociaux Identifier des sous-groupes homogegravenesdrsquoindividus (communauteacutes) et la maniegravere dont ils sontstructureacutes entre eux

World Wide Web Recherche drsquoinformations Grouper les sitesWeb par similariteacute pour faciliter lrsquoidentification desites pertinents

Marketing Identifier des groupes drsquoindividus ou des groupes deproduits pour effectuer des conseils drsquoachats auxacheteurs en ligne

Graphes de proteacuteines reacuteseau meacutetabolique Proposer desregroupements theacutematiques de proteacuteinesdrsquoenzymes etc

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 34: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Sommaire

1 Les graphes

2 Objectifs

3 Noyau de la chaleur et cartes de Kohonen

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 35: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 36: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Cartes de Kohonen le principe

Donneacutees initiales (xi) dansun espace de grande dimension

Projection sur une carte de petitedimension en minimisant lrsquoeacutenergieEn =

sumMi=1 h(d(f(xj) i))xj minus pi

2

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 37: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 38: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Adaptation aux graphes

ProblegravemeLrsquoalgorithme de cartes de Kohonen classifie les donneacutees selonleurs distances dans lrsquoespace initial pas de distance entre lessommets drsquoun graphe

Solutions proposeacutees1 Adaptation de lrsquoalgorithme agrave des donneacutees deacutecrites par une

mesure de dissimilariteacute [Kohohen and Somervuo 1998] 2 Utilisation drsquoun noyau

[Lau et al 2006 Villa and Rossi 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 39: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Dissimilariteacutes

Dissimilariteacutes courantes

1 Distance de Jaccard δ(xi xj) =|xk w(xk xj)0 et w(xk xi)0||xk w(xk xj)0|+|xk w(xk xi)0|

2 Plus court chemin δ(xi xj) = Longueur du plus courtchemin entre xi et xj en suivant les arecirctes du graphe

Limites Utilise des informations tregraves locales (partielles) sur lastructure du graphe

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 40: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Laplacien drsquoun graphe

Pour un graphe

de sommets V = x1 xn

pondeacutereacutes par (wij)ij=1n (positifs) tels que pour touti j = 1 n wij = wji et di =

sumnj=1 wij

on reacutesume le graphe par son Laplacian L = (Lij)ij=1n

Lij =

minuswij if i jdi if i = j

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 41: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Proprieacuteteacutes du Laplacien [von Luxburg 2007]

Problegraveme de la coupe optimaleLe problegraveme (optimisation discregravete) de trouver une partition dugraphe en k groupes de sommets A1 Ak qui minimise

12

ksumi=1

sumjisinAi jprimeltAi

wjjprime

est approcheacute par le problegraveme drsquooptimisation continue suivant

minHisinRntimesk

Tr(HT LH

)subject to HT H = I

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 42: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 43: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Spectral clustering

Meacutethode

1 Deacuteterminer les k derniers vecteurs propresu1 uk de L et poser U = [u1 uk ]

2 Utiliser un algorithme de cartes de Kohonen(carte de taille k) sur les lignes de U

Limites du spectral clusteringUtilisation partielle de la structure du graphe tous les vecteurspropres ont le mecircme poids

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 44: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Une version reacutegulariseacutee de L

Reacutegularisation la matrice de diffusion pour β gt 0Kβ = eminusβL =

sum+infink=1

(minusβL)k

k rArr

k β V times V rarr R

(xi xj) rarr Kβij

noyau de diffusion (ou noyau de la chaleur)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 45: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 46: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Inteacuterecircts

1 Interpreacutetation intuitive k β(i j) peut ecirctre interpreacuteteacutee commelrsquoeacutenergie accumuleacutee en i lorsque lrsquoeacutenergie a eacuteteacute injecteacutee en jau temps 0 et que lrsquoeacutenergie circule de maniegravere continue dansles arecirctes du graphe selon une fraction qui deacutepend de β

2 Noyau de la chaleur et RKHS

Graphe rarr Espace de Hilbert de grande dimension(H 〈 〉)

Dans (H 〈 〉) pratiquer un algorithme de classification oucarte de Kohonen (SOM)

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 47: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 48: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Resultats pour une grille 7 times 7 [Boulet et al 2007]

Nathalie Villa Grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References
Page 49: Introduction à l’étude des grands graphes

Les graphesObjectifs

Noyau de la chaleur et cartes de KohonenReferences

Bibliographie

Bleakley K Biau G and Vert J (2007)Supervised reconstruction of biological networks with local modelsBioinformatics 23(13) i57ndashi65

Boulet R Jouve B Rossi F and Villa N (2007)Batch kernel SOM and related laplacian methods for social network analysisNeurocomputingSubmitted

Kohohen T and Somervuo P (1998)Self-Organizing maps of symbol stringsNeurocomputing 21 19ndash30

Lau K Yin H and Hubbard S (2006)Kernel self-organising maps for classificationNeurocomputing 69 2033ndash2040

Villa N and Rossi F (2007)A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graphIn Proceedings of the 6th Workshop on Self-Organizing Maps (WSOM 07) Bielefield Germany

von Luxburg U (2007)A tutorial on spectral clusteringTechnical Report TR-149 Max Planck Institut fuumlr biologische KybernetikAvaliable at httpwwwkybmpgdepublicationsattachmentsluxburg06_TR_v2_41395B15Dpdf

Nathalie Villa Grands graphes

  • Les graphes
  • Objectifs
  • Noyau de la chaleur et cartes de Kohonen
  • References