43
Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR Statistique et Santé Journées 2007 - 26 et 27 novembre 2007

Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Embed Size (px)

Citation preview

Page 1: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines

Emmanuelle Génin

INSERM U535, Univ. Paris Sud, Villejuif

GDR Statistique et Santé Journées 2007 - 26 et 27 novembre 2007

Page 2: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Plan

• Les populations consanguines– Consanguinité aléatoire et non aléatoire– La consanguinité dans le monde– Conséquences sur le plan génétique

• Etudes de liaison génétique en populations consanguines– Validité des méthodes classiques– Les alternatives– Puissance des tests

• Etudes d'association en populations consanguines– Validité des méthodes classiques– Les alternatives– Puissance des tests

Page 3: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Les populations consanguines

• Dans de nombreuses populations humaines, les mariages entre individus apparentés sont fréquents– Grandes populations où ce type d'unions

est favorisé

Page 4: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

La consanguinité dans le monde

From, Bittles, AH (2001) Consanguinity and its relevance to clinical genetics.Clinical Genetics 60 (2), 89-98.

Page 5: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Les populations consanguines

• Dans de nombreuses populations humaines, les mariages entre individus apparentés sont fréquents– Grandes populations où ce type d'unions

est favorisé– Petites populations isolées où le nombre de

conjoints potentiels est réduit• Populations à effet fondateur

– un petit nombre d'ancêtres (les fondateurs)– une période d'isolement puis de croissance exponentielle

• L'isolement peut être– géographique (Finlande, Québec, îles)– religieux (Hutterites, Juifs Ashkenazes)– culturel (Gitans, villages de pêcheurs)

Page 6: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Populations de petite taille et "consanguinité aléatoire"

Une forte probabilité pour que, même au hasard, les mariages se fassent entre individus apparentés

La consanguinité n'est pas due à un choix de ce type d'unions: "Consanguinité aléatoire"

D'après Roberts (1976) dans Etude des Isolats -Editions INED

Tristan da Cunha, Atlantique Sud. 275 habitants20 fondateurs en 1816Pas de mariages entre apparentés dans les 1ères générations.En 1854, le père du 1er individu consanguin pouvait choisir entre7 femmes dont 5 de ses cousines

Page 7: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Conséquences génétiques de la consanguinité

• Modification de la structure génétique de la population– augmentation des homozygotes– déficit en hétérozygotes

• Possibilité pour un individu d'avoir reçu deux allèles provenant d'un même ancêtre

(Identité-par-Descendance, IBD).

Page 8: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Structures familiales

Familles avec des boucles de consanguinité

exemple: cousins germains

2 allèles IBD

Page 9: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Coefficient de consanguinité

• Coefficient de consanguinité F d'un individu: Probabilité pour que ses deux allèles à un locus soient IBD

• Comment peut-on estimer F ?– à partir de la généalogie

Page 10: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Estimer F à partir de la généalogie• Méthode des chemins (Wright, 1922)

Z

A

mn

Z FF 12

1 1

Somme sur toutes les bouclesn & m sont le nb de méioses sur les deux branches de l'ancêtre A aux parents de Z.

Estimation de F dépend de la connaissance généalogique

• Exemple: descendant de cousins germains

16

1

2

1

2

12

4122

ZF

A

Page 11: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Coefficient de consanguinité

• Coefficient de consanguinité F d'un individu: Probabilité pour que ses deux allèles à un locus soient IBD

• Comment peut-on estimer F ?– à partir de la généalogie– à partir des marqueurs génétiques

Page 12: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Estimer F à partir des marqueurs

• Observation des génotypes pour des marqueurs régulièrement espacés sur le génome– IBD non observable– marqueurs non indépendants

• Modèle de Markov caché pour écrire la probabilité de ces observations en fonction– deux paramètres inconnus

F coeff. de consang. de l'individu (prop. de génome IBD) a taux de changement d'état IBD/cM (long. des blocs IBD)

– deux paramètres supposés connus• distance entre les marqueurs• fréquences alléliques

Estimation de (F,a) par maximum de vraisemblance

Leutenegger et al (2003). Am J Hum Genet

Estimation de F dépend de la densité de marqueurs et des fréquences alléliques aux marqueurs

Page 13: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Corrélations Inter- et Intra-Individuelles

• Dans les populations à effet fondateur: des généalogies– grandes et très complexes– de nombreux liens

généalogiques entre 2 individus

• Identité-par-descendance– des allèles d'un même

individu (consanguinité) identité intra

– des allèles chez deux individus différents identité inter Liens généalogiques entre

deux Hutterites (from M. Abney)

Page 14: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Etats d'identité entre les 4 allèles

de deux individus (Gillois 1968, Jacquard 1972, Cotterman

1974)

ind 1

alle

le 1

ind 2

alle

le 2

S1

S2 S8

S4 S7

S5 S6

S3

S9

Intra-IBD

Inter-IBD

Page 15: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Les études génétiques en populations consanguines

• Identification des mutations impliquées dans les maladies monogéniques– récessives (grandes populations ou isolats)

"Homozygosity Mapping"– dominantes (isolats / effet fondateur)

• Etude des gènes impliqués dans les maladies complexes en populations consanguines ?

Page 16: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Les tests de liaison génétique

en populations consanguines

Page 17: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Principe

• Recherche de fragments d'ADN plus partagés par des malades apparentés qu'attendu du fait de leur apparentement

• Dans les grandes populations panmictiques: des échantillons de paires de germains atteints indépendantes

Page 18: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

a c a c

IBD=2

a c a d

IBD=1

a c b d

IBD=0

a b c d

obs. X Y Z

exp. 1/4 1/2 1/4(no linkage)

Comparaison des distributions de paires de germains avec 2, 1 ou 0 allèles IBD observées et attendues

Page 19: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Principe

• Recherche des segments d'ADN plus partagés par des malades apparentés qu'attendu du fait de leur apparentement

• Dans les grandes populations panmictiques: des échantillons de paires de germains atteints indépendantes

• Dans les populations consanguines:– des paires de germains atteints consanguins– des paires non indépendantes (isolats en particulier)

les probabilités IBD attendues sont augmentées

risque de conclure à tort à la liaison

Page 20: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Parental IBD=2 IBD=1 IBD=0 proportion ofrelationship shared alleles

none .25 .50 .25 .500first-cousin .25 .53 .22 .515Double first-cousin .26 .55 .19 .535

Probabilité IBD chez des germains pour différents croisements parentaux

Génin & Clerget-Darpoux (1996). AJHG 59: 1149-1162Leutenegger et al. (2002). Genet. Epidemiol. 23: 413-425

Page 21: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Calcul des proportions IBD dans une population

consanguine • Si la généalogie est disponible:

– Nécessité de tenir compte de l'ensemble de la généalogie

– Problèmes computationels: il faut couper la généalogie en petites unités

• Si la généalogie n'est pas disponible ou fiable:– Contraste entre l'IBD observé en un point donné

et celui observé sur l'ensemble du génome: "genomic control"Genome Mismatch Scanning (Nelson 1993; Durham 1997)

Page 22: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Prise en compte de l'IBD intra dans les tests de

liaison • Les tests classiques ne tiennent compte

que de l'IBD inter (entre les frères et soeurs)

• IBD intra-individuelle aussi possible dans les populations consanguines: 9 états d'identité

Page 23: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Comparaison entre les 9 états d'identité et les 3 états IBD

S1 S8S7 S5S3

S2 S4 S6 S9

IBD=2 IBD=1

IBD=0

Page 24: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Prise en compte de l'IBD intra dans les tests de

liaison • Les tests classiques ne tiennent compte

que de l'IBD inter (entre les frères et soeurs)

• IBD intra-individuelle aussi possible dans les populations consanguines: 9 états d'identité

• Un test pour tenir compte de l'IBD inter et intra dans les paires de germains: basé sur le nombre d'allèles différents (non IBD) dans les paires (Na=1, 2, 3 or 4)

Page 25: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Comparaison entre les 9 états d'identité et les 4 états Na

S1

S8

S7 S5S3 S2

S4 S6 S9

Na=1 Na=2

Na=3 Na=4

Page 26: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

N IBD test Na test10 0.12 0.2720 0.20 0.5230 0.28 0.7140 0.36 0.8450 0.44 0.9260 0.52 0.9670 0.58 0.9880 0.65 0.9990 0.70 1.00

100 0.75 1.00

0.00

0.20

0.40

0.60

0.80

1.00

10 20 30 40 50 60 70 80 90 100

Sample size NP

ow

er

Na

IBD

Sample of N ASP from 1st cousin matingsModel: q=0.20, f1=0.2f2 and f0=0.1f2

Gain de puissance avec le test Na par rapport à l'IBD

Génin & Clerget-Darpoux (1996). AJHG 59: 1149-1162

Page 27: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Tests de liaison en populations consanguines

• La puissance des tests de liaison peut être augmentée en présence de consanguinité si on tient compte conjointement des IBD inter et intra-individuels

• Cependant, une bonne connaissance des coefficients de consanguinité et de parenté est nécessaire

Page 28: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Tests d'association en populations consanguines

Page 29: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Principe

• Comparaison des fréquences génotypiques dans des échantillons de malades et de témoins

Page 30: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Test d'association cas-témoins

AA AB BBCas n10 n11 n12

Témoins n20 n21 n22

Test d'homogénéité entre les deux distributions génotypiques

W2 ~ 2 2df sous H0

Si les fréquences génotypiques sont différentes chez les malades et les témoins Un des allèles du marqueur est plus fréquent

chez les malades Cet allèle “est” ou “est associé à” un allèle de susceptibilité

Page 31: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Principe

• Comparaison des fréquences génotypiques dans des échantillons de malades et de témoins

• Dans les populations panmictiques, les fréquences génot. chez les témoins suivent les proportions de Hardy-Weinberg : ne dépendent que de p

AA AB BBp2 2pq q2 p=1-q=f(A)

Page 32: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Principe

• Comparaison des fréquences génotypiques dans des échantillons de malades et de témoins

• Dans les populations panmictiques, les fréquences génot. chez les témoins suivent les proportions de Hardy-Weinberg : ne dépendent que de p

AA AB BBp2 2pq q2 p=1-q=f(A)

• Dans les populations consanguines: dépend de FAA AB BB

p2+Fpq 2pq-2Fpq q2+Fpq

Si malades et témoins ne sont pas correctement appariés pour F: risque de

fausse conclusion

Page 33: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Augmentation de l'erreur de type 1 du test si F est différent chez cas et témoins

Calcul des distributions génotypiques attendues dans un échantillon de 100 cas et 100 témoins pour un marqueur biallélique (p=0.5) sous H0.Coefficient moyen de consanguinité F1 variable chez les cas.F2= 0 chez les témoins.Erreur de type 1 nominale: 5%

0.00

0.05

0.10

0.15

0.20

0.00 0.05 0.10 0.15

F1

Ty

pe

-on

e e

rro

r

1st-cousins6.5%

Uncle-Niece11.4%

Génin et al. (1996). AJHG 58: 861-866

Page 34: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Robustesse du test d'associationaux corrélations inter-individuelles (isolats)

Bourgain & Génin (2005). Review. EJHG 13: 678-706

• Apparentement possibles entre Cas et Témoins

• Si on ne prend pas en compte cet apparentement: Risque de fausse conclusion

Erreurs de type 1 du test pour une erreur nominale de 5%Echantillon Hutterite de 310 malades atopiques et 391 temoinsSimulations à partir de la généalogie des génotypes des Cas et Témoins pour un SNP (fréquence 0.2/0.8) sous H0. 5,000 réplicats.

L'erreur de type-1 du test est de 12% au lieu de 5%

Page 35: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Quelles solutions ?

• Utiliser des méthodes de permutation pour évaluer les degrés de signification

Page 36: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Quelles solutions ?

• Utiliser des méthodes de permutation pour évaluer les degrés de signification: PAS VALIDE car hypothèse d'indépendance sur les génotypesSur l'exemple Hutterite: erreur de type 1 de 13%

Page 37: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Quelles solutions ?

• Utiliser des méthodes de permutation pour évaluer les degrés de signification: PAS VALIDE

• Utiliser un facteur correctif tel que, quand les fréq. alléliques sont les mêmes chez cas et témoins, suit une distribution 2

2

2

WWcorr

Page 38: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Calcul du facteur correctif

• ne dépend pas des caractéristiques du marqueur mais dépend – des coefficients de consanguinité de tous les

cas et de tous les témoins– des coefficients de parenté entre tous les cas

et tous les témoins

• Si la généalogie est connue: Calcul direct Bourgain et al (2003), AJHG 73:612-626

• Si la généalogie n'est pas connue:Utilisation de marqueurs aléatoires: "Genomic Controls" Devlin & Roeder, Biometrics, 1999

Page 39: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Quelles solutions ?

• Utiliser des méthodes de permutation pour évaluer les degrés de signification: PAS VALIDE

• Utiliser un facteur correctif OK si généalogie connue ou marqueurs aléatoires disponibles

• Utiliser des données familiales: Transmission Disequilibrium Test

Page 40: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Le TDT Spielman et al. 1993

Rejet de l'hypothèse nulle:– déséquilibre de liaison (LD) 0– liaison génétique 1/2ET

AB AA

AA

N parents hétérozygotes AB : nombre de fois où l'allèle A est transmis à l'enfant atteint

Transmis Non transmisObservé U VAttendu (H0) (U+V)/2 (U+V)/2

TDT = (U - V)2 / (U+V) ~ 2(1df) sous H0

Page 41: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Puissance des tests d'association en présence de consanguinité

• La puissance des tests cas/témoins et TDT peut être augmentée en présence de consanguinité.

• Pour Cas/Témoins: le gain de puissance peut être plus grand que pour le TDT mais nécessite d'estimer le facteur correctif – sur la généalogie complète si connue– sur des marqueurs aléatoires

• Pour le TDT: seule l'information sur le malade et ses parents est nécessaire (pas besoin de F ou de la généalogie complète)

Page 42: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Identifier les gènes impliqués dans les maladies complexes en populations consanguines :

Conclusion• Les populations consanguines ont des

caractéristiques génétiques intéressantes (IBD inter et intra) qui peuvent aider pour identifier les facteurs génétiques – dans les maladies monogéniques– dans les maladies multifactorielles

• Les méthodes développées dans les grandes populations ne sont généralement pas appropriées– Hypothèses non vérifiées– Augmentation de l'erreur de type 1 des tests:

Fausses conclusions

Page 43: Recherche des facteurs génétiques de susceptibilité aux maladies en populations consanguines Emmanuelle Génin INSERM U535, Univ. Paris Sud, Villejuif GDR

Un besoin de nouvelles méthodes qui tiennent compte

des particularités de ces populations