Upload
vannhu
View
226
Download
2
Embed Size (px)
Citation preview
© A
J Va
llero
n, 2
013
Faculté de Médecine Pierre et Marie Curie PAES
UE4 : Evaluation des méthodes d’analyse appliquées aux sciences de la vie
Cours 1
A-J Valleron Hôpital Saint Antoine
http://aj.valleron.free.fr/ajv
© A
J Va
llero
n, 2
013
Organisation
– 6 Cours – 10 séances de TD – Concours :
– 20 QCM – calculatrice et documents autorisés.
Introduction
© A
J Va
llero
n, 2
013
Supports écrits – Les transparents du cours (éventuellement actualisés après le cours)
http://aj.valleron.free.fr/ajv/livre_UE4_cours.html NB : c’est le seul support de cours écrit indispensable, et le plus court!
– Le polycopié de TD – Le polycopié de cours
– Livres – cours: UE4 Evaluation des méthodes … (AJ Valleron)
collection PAES, Elsevier – Masson (NB: et non l’ancien « Probabilités et Statistique ») NB: Livre organisé par « fiches ». ajouts, errata sur http://aj.valleron.free.fr/ajv/livre_UE4_cours.html
exercices/ QCM ( Semoun & Valleron) UE4 Evaluation … Collection PAES, Elsevier Masson`
© A
J Va
llero
n, 2
013
1er Cours livre AJV: fiches 1, 2, 3, 25, 26, 27
polycopié : chapitres 2 à 5
• Introduction : • Le programme à travers des exemples.
• Différence entre « Probabilités » et « Statistique • Probabilités: modéliser le hasard • Statistique: réaliser des « inférences »
• Bases nécessaires en calcul des probabilités • Risques absolus, relatifs, attribuables (+++)
• Quantification de la démarche diagnostique • Théorème de Bayes (+ + + +) • Sensibilité, Spécificité, Valeurs Prédictives positives, négatives ( + + + )
© A
J Va
llero
n, 2
013
la variabilité biologique • Variabilité à tous les niveaux d’organisation :
…population base du darwinisme: avantage sélectif pour les individus qui sont le mieux adaptés à l’environnement (implique leur variabilité).
...cellule exemples: durées du cycle cellulaire, tailles des organites…
...génome exemple: séquences codant pour les protéines
• Conséquences en médecine – Cause des maladies : difficile, sauf maladies monogéniques – Diagnostic – Traitement – Pronostic
Introduction
© A
J Va
llero
n, 2
013
Probabilités, Statistique, Biostatistique
• La Statistique • ne pas confondre avec les « statistiques » : tableaux de chiffres, médianes, etc • une partie des mathématiques qui vise à tirer des conclusions générales à partir d’échantillons . C’est l’ « inférence statistique »
• Le calcul des probabilités : • permet d’étudier les lois du hasard, à partir d’hypothèses. • indispensable à la théorie de la Statistique.
• La biostatistique: • partie de la Statistique qui a été développée pour répondre aux problèmes spécifiques des sciences de la vie.
© A
J Va
llero
n, 2
013
Depuis ~30 ans : la révolution informatique - Lois de Moore (1965, 1975) : La puissance de calcul double tous les 2 ans
- NB : énergie dépensée par les calculateurs de Google > 1 centrale nucléaire - NB’ : énergie dépensée par les « TIC » ~ celle de l’aviation civile
- En médecine : - Dossier Médical informatisé (à l’hôpital, en ville, ..) - Nouvelles technologies omniprésentes
- Imagerie, Automates de dosage, génomique ,protéomique, transcriptomique, télémédecine, téléchirurgie.
- En épidémiologie : - Bases de données sur comportements, expositions aux risques environnementaux, déplacements (épidémies)
Introduction
© A
J Va
llero
n, 2
013
Quelques exemples de l’interaction Médecine - Biostatistique
UE4: en rouge dans les diapos suivantes la partie du programme concernée
© A
J Va
llero
n, 2
013
La variabilité • Conséquences de la très grande prématurité en termes d’handicap neurologique et comportemental de l’enfant.
• Marlow et col., NEJM, 2005
Terme 41 semaines (287 jours) Prématurité < 37 semaines
UE4: mesures de la variabilité, tests de comparaison, de tendance.
© A
J Va
llero
n, 2
013
Etude des facteurs de risque: l’obésité
• 116 000 femmes de 30-35 ans en 1976
• Mortalité 24 ans ensuite
• Source : Hu et Col. , NEJM, 2004
Indice de corpulence (BMI) 100 P (kg)/ T2 (m) surpoids quand >25 obèse si >30
UE4: facteurs de risque, risques relatif et attribuable, courbe de mortalité, unités
© A
J Va
llero
n, 2
013
Efficacité des corticosteroides p.o. dans le traitement des enfants avec poussée asthmatique après infection virale
aigue.
• In Panickar et col. NEJM, 22/1/2009
UE4: essai thérapeutique randomisé, placebo, courbe de survie
© A
J Va
llero
n, 2
013
1990+ : début du projet génome humain 2003 : annonce officielle du 1er genome humain
© Aj Valleron 2011
© A
J Va
llero
n, 2
013
Génotypage = Traquer la variabilité au niveau du génome
¨ 3,4 milliards de paires de bases
¨ 10-‐15 millions de SNPs référencés dans le génome humain
¨ « puces » perme@ant sur un nombre limité (500 000, 4 500 000 … par exemple) de représenter la variabilité
¨ Génotypage = génotypage de 500.000 SNPs du génome
Génomes idenKques à 99.9%
Diffèrent en moyenne par 4 millions de SNPs
CATT….GCATAATGCATTGT…ATCGTTCAGGGTTATG…..ATCAGTCAGTTCCA
© A
J Va
llero
n, 2
013
1990+ : début du projet génome humain 2003 : annonce officielle du 1er genome humain 1999 : TSP (The SNP consortium) 2005 : 1ère étude GWAS publiée GWAS = Genome Wide Association Study Étude recherchant si, le long du génome, on trouve des génotypes en fréquence significativement différente chez les malades et des témoins. Il s’agit d’une association, pas nécessairement causale.
UE4 : études cas-témoins association ou corrélation, versus causalité
© A
J Va
llero
n, 2
013
Published Genome-Wide Associations through 06/2011, 1,449 published GWA at p≤5x10-8 for 237 traits
NHGRI GWA Catalog www.genome.gov/GWAStudies
© A
J Va
llero
n, 2
013
© A
J Va
llero
n, 2
013
« Médecine personnalisée » Risque de diabète de type 2 entre 29 et 75 ans
Risque individuel du patient X : 17,8%
Risque Moyen : 25,7%
Le génome du patient X : Risque accru
Risque réduit
1 11
12 22
10 9 8 4 3
rs7903146
rs1801282
rs5219
rs4402960
rs1111875
rs4712523
rs13266634
rs10012946
rs2383208
rs2237892
rs1387153
risque moyen
/2 *2
Risque associé aux SNP
(GG) (TT, TG) GG : réduction de 8% par rapport à la moyenne rs4402960
GG
11 SNPs connus comme associés à DT2
2
UE4 : association, risque
© A
J Va
llero
n, 2
013
Recherche de gènes « pronostiques » grâce à des puces à ADN
• En ligne les gènes étudiés
• En colonne les patients
• Rouge : gène sous exprimé • Vert : gène sur exprimé
• Recherche de corrélation avec le pronostic
Source : Arango et col., Gastroenterology 2005
UE4: test de comparaison de courbes de survie
© A
J Va
llero
n, 2
013
Cancer des bronches • En France:
• environ 27 000 morts/an (dont 22 000 chez les hommes) • environ 85 % attribuables au tabac
• deux catégories de cancer des bronches: • à petites cellules • non à petites cellules (le plus fréquent) « NSCLC »
– stade I : survie à 5 ans = 47 % – stade II : survie à 5 ans = 26 % – stade III : survie à 5 ans = 8 % – stade IV : survie à 5 ans = 2 %
– Rarement dépistés avant stade III
UE4: risque « attribuable ». Intervalle de « confiance » ( 47% ± x%) non donnés
© A
J Va
llero
n, 2
013
• Recherche de gènes prédicteurs du pronostic du cancer des bronches (NSCLC)
• 125 malades étudiés 672 gènes au départ • 16 gènes identifiés
In : Chen et col., New England J. of Medicine, 4 Janvier 2007 UE4: pronostic, courbes de survie, tests
© A
J Va
llero
n, 2
013
Rapport des risques de mort chez ceux qui ont la « signature » des 5 gènes principaux découverts, contre ceux qui ne l’ont pas, avec son CI ( = intervalle de confiance IC) à 95% (« hazard » : danger)
In : Chen et col., New England J. of Medicine, 4 Janvier 2007 UE4: risque relatif, degré de signification d’un test
© A
J Va
llero
n, 2
013
© A
J Va
llero
n, 2
013
Protocole d'une expérience Définition : description complète de l'ensemble des matériels et méthodes employés dans l'expérience permettant à un expérimentateur indépendant de reproduire les résultats de l'expérience. La démarche scientifique implique la possibilité de reproduire les résultats, donc la publication du protocole.
Protocole de traitement : description complète de l’ensemble des procédures utilisées dans le traitement d’un patient d’une pathologie déterminée. Aussi : « protocole infirmier » :
© A
J Va
llero
n, 2
013
Épreuve Expérience aléatoire
Définition: protocole d'une expérience dont le résultat est "aléatoire". exemple : on lance un dé "parfait" ; le résultat est la face observée (1, 2, 3, ..., 6). deux « expérimentateurs » indépendants pourront reproduire la procédure ; mais ils ne trouveront pas le même résultat.
© A
J Va
llero
n, 2
013
Événement élémentaire
Définition : un résultat possible de l'épreuve.
exemple du dé : il y a 6 événements élémentaires (1, 2, ..., 6)
• Notation : l’ensemble des événements élémentaires est noté E ( E: « ensemble fondamental » du polycopié)
© A
J Va
llero
n, 2
013
Événement
Définition : un "événement" est un sous ensemble de E. Il est défini par la "liste" des événements élémentaires qui le composent. Notation : l'ensemble des événements est noté Ω .
Ω = P(E) P(E) est l’ensemble des parties de E
© A
J Va
llero
n, 2
013
Exemple du "dé parfait"
• épreuve : on lance "au hasard" un dé parfait (... ce qui signifie que ses 6 faces ont la même probabilité de "sortir").
• événements élémentaires : il y en a 6.
• exemples d'événements : il y en a 26
– "pair" = événements élémentaires {2,4,6} ; – « 6 » = événement élémentaire {6}.
© A
J Va
llero
n, 2
013
Réalisation d’un événement
Définition : On dit qu’un événement élémentaire e réalise l’événement A quand e appartient à la liste définissant A
Par exemple, « 6 » – réalise l’événement « pair » – réalise l’événement « multiple de 3 » – ne réalise pas l’événement {5}.
© A
J Va
llero
n, 2
013
Représentation géométrique ( utile pour retrouver les formules)
é.é. Ω=P(Ε)
ü Le résultat de l ’épreuve est un événement élémentaire é.é. ü L’ ensemble des é.é. forme l ’ensemble E ü Un « événement » est une partie de E (ici, en grisé : l’ événement A) ü Les événements élémentaires « réalisent » ou non chaque événement, selon que la flèche tombe, ou non, dans A (dans l’exemple, l’é.é. ne réalise pas A) ü La Surface de (E) est fixée à 1 ü La surface de A représente la probabilité de A
Ε Épreuve conduisant à un é.é. A
© A
J Va
llero
n, 2
013
Évenements incompatibles
Définition: A et D sont incompatibles si, lorsqu'on effectue l'épreuve, il est impossible d'obtenir un événement élémentaire qui réalise à la fois A et D.
{A et D } = impossible A ∩ D = ∅ Exemple du dé : "pair" et "5" sont incompatibles. Autre exemple : <20 ans et >65 ans
© A
J Va
llero
n, 2
013
A et D sont incompatibles (représentation géomètrique)
A! D!= CA
Il est impossible qu’un é.é. réalise à la fois A et D
© A
J Va
llero
n, 2
013
Opérations logiques sur les événements
Ε
A
B
Langage probabiliste Langage ensembliste
A est un événement une partie de E
{A ou B} : événement réalisé quand A, ou B l'est. A ∪ B
{A et B} : événement réalisé quand A et B le sont à la fois A ∩ B
épreuve
é.é.
Ω=P(Ε)
© A
J Va
llero
n, 2
013
Opérations logiques sur les événements
Ε
A
B
Langage probabiliste Langage ensembliste
A est un événement une partie de E
{A ou B} : événement réalisé quand A, ou B l'est A ∪ B
{A et B} : événement réalisé quand A et B le sont à la fois A ∩ B
Contraire de A : événement réalisé quand A ne l’est pas CA, Ā
épreuve
é.é.
Ω=P(Ε)
© A
J Va
llero
n, 2
013
Opérations sur les événements
A ou B A - B
A et B
A!
A!A!
B!A!
A! B!
B!
Α= CA
Exercice : montrer que A – B = A et CB
© A
J Va
llero
n, 2
013
Nombre d’événements dans une épreuve menant à n (fini) événements élémentaires.
a b c d e f g h i j k l
(1) 1 0 0 0 0 0 0 0 0 0 0 0
(2) 1 1 1 0 0 0 0 0 0 0 0 0
(3) 1 0 0 0 1 0 0 0 1 0 0 0
(4) 0 1 1 1 0 1 1 1 0 1 1 1
(5) 0 0 0 0 0 0 0 0 0 0 0 0
(6) 1 1 1 1 1 1 1 1 1 1 1 1
(1) = {a} (2) = {a,b,c} (3) = voyelles (4) = consonnes
Résultat : Il y a 2n événements possibles quand il y a n événements élémentaires
ici, 212 parce qu’en face de chacune des 12 lettres il y a 2 choix: 0 ou 1
© A
J Va
llero
n, 2
013
QCM • Dans le dossier médical des urgences, on note :
– age du patient au diagnostic : J (<25), M (26-45), A >45) – Sexe : H, F – Motif : Ch (chirurgical), M (Médical), Psy (Psychiatrique) – Pour les patients Chirurgie : Gy (gynéco), Ort (Orthopédie), Br (brûlés), Au (autres)
• A : les hommes brûlés de plus de 45 ans sont les sujets {A}et{H}et{Br} • B : les hommes brûlés de plus de 45 ans sont les sujets {A}ou{H}ou{Br} • C : les hommes brûlés de plus de 45 ans sont les sujets {NJ}et{NM}et{Br} et{H} • D : les femmes font partie de {{ J}ou{M}ou{A} } ou F • E : les femmes font partie de {{ J}ou{M}ou{A} } ou H
© A
J Va
llero
n, 2
013
QCM 1.1 • Dans le dossier médical des urgences, on note :
– age du patient au diagnostic : J (<25), M (26-45), A >45) – Sexe : H, F – Motif : Ch (chirurgical), M (Médical), Psy (Psychiatrique) – Pour les patients Chirurgie : Gy (gynéco), Ort (Orthopédie), Br (brûlés), Au (autres)
• A : les hommes brûlés de plus de 45 ans sont les sujets {A}et{H}et{Br} • B : les hommes brûlés de plus de 45 ans sont les sujets {A}ou{H}ou{Br} • C : les hommes brûlés de plus de 45 ans sont les sujets {NJ}et{NM}et{Br} et{H} • D : les femmes font partie de {{ J}ou{M}ou{A} } ou F • E : les femmes font partie de {{ J}ou{M}ou{A} } ou H
A C D E
© A
J Va
llero
n, 2
013
Commentaire sur le QCM 1.1 apparemment simple, mais… ?
• {A}ou{H} : cet événement (qui se lit Agé>45 ou Homme) comprend des Femmes
Les femmes âgées>45 vérifient {A} En effet: {A}ou{H} est l’événement constitué de tous lesévénements qui vérifient {A} ou qui vérifient {H} ou qui vérifient les deux à la fois
© A
J Va
llero
n, 2
013
Les trois catégories de probabilités
• Définies « mathématiquement » : La face 3 du dé est de probabilité 1/6
• Définies par une fréquence : Il y a 600 000 VHC+/60 000 000 habitants en France. La probabilité p d’être VHC+ est 0.01 pour un habitant pris au hasard.
• Définies « subjectivement » : Il y a probabilité 0,30 pour qu’il pleuve demain.
© A
J Va
llero
n, 2
013
La loi des grands nombres fréquence à probabilité
( Jacques Bernoulli, 1680, publiée en 1713 )
La fréquence de « pile » observée sur n expériences tend vers 0,5 quand n devient grand.
La loi de Bernoulli fait le pont entre probabilité et observation
La fréquence des garçons à la naissance tend vers 0,515 quand n devient grand
= la probabilité pour qu’un enfant à la naissance soit un garçon
est 0,515
© A
J Va
llero
n, 2
013
Axiomes
Définition : Un axiome est une propriété non démontrée nécessaire pour construire une théorie. Exemple : en Géométrie Euclidienne, “deux parallèles ne se coupent pas” est un axiome (la géométrie riemanienne n’utilise pas cet axiome).
non au programme du concours
© A
J Va
llero
n, 2
013
Les 3 axiomes du calcul des probabilités
Ils permettent de construire la théorie du calcul des probabilités. 1- La probabilité d’un événement est un nombre
compris entre 0 et 1 2- si A et B sont incompatibles,
Pr (A ou B) = Pr (A) + Pr(B) 3- Pr (E)=1
© A
J Va
llero
n, 2
013
Probabilité de {A ou B} +++
• Pr (A ou B) = • Pr (A) + Pr (B) - Pr (A et B)
Ε A
B
épreuve
é.é.
© A
J Va
llero
n, 2
013
Quand les événements élémentaires sont équiprobables.
exemples : pile ou face ; dé ; jeu de cartes ... Résultat : si l’épreuve mène à N(fini) événements élémentaires de même probabilité: - la probabilité de chacun est 1/N. - La probabilité d'un événement A est, dans ce cas, le rapport du nombre d'événements élémentaires qui le réalisent divisé par N. (La probabilité de A est le rapport du nombre de cas "favorables" au nombre de cas possibles)
© A
J Va
llero
n, 2
013
Analyse combinatoire : cf TD
Indispensable à connaître dans le cas « équiprobable » • Permutations de a,b,c,d : adbc,cdab,..
Pn = n! • Arrangements de 2 parmi 4 : ab,ba,ac,ca,ad,dc,..
A(n,p) = n (n-1) (n-2) ... (n-p+1) • Combinaisons de 2 parmi 4 : ab,ac,ad,bc,bd,c
C(n,p) = A(n,p)/p! = n! / p! (n-p)!
© A
J Va
llero
n, 2
013
Conséquences des axiomes : résultats évidents
• Pr (Ø) = 0 La probabilité d’un événement impossible est 0 En effet : Ø ∪ E = E et Ø ∩ E = Ø donc Pr(Ø ) + Pr(E) = Pr(E)
• Pr (Contraire de A) = 1- Pr (A) S’il ya 30 chances sur 100 de mort, il y a 70 chances sur 100 de survie.
En effet : A ∪ Ā = E et A ∩ Ā = Ø donc Pr(A) + Pr(Ā) = Pr(E) = 1
© A
J Va
llero
n, 2
013
Probabilités subjectives +++
“il y a une probabilité de 0,70 pour qu’une épidémie de varicelle survienne dans les 4 mois qui viennent” Ce chiffre :
– ne relève pas d’un calcul du “rapport événements favorables/ événements possibles” – doit respecter les axiomes – Pourra être mis en cause par les observations futures.
© A
J Va
llero
n, 2
013
fréquence d’une maladie : Définitions épidémiologiques + + +
Prévalence : nombre (ou proportion) de malades à un moment donné
Incidence : nombre (ou proportion) de nouveaux malades pendant une durée donnée.
En état stable : P= I x D où D est la durée moyenne
de la maladie
© A
J Va
llero
n, 2
013
Probabilité conditionnelle exemple
Pr (qu'un Français soit VHC+) = 600 000 / 60 000 000 = 1%
Pr (qu'un Français soit VHC+ sachant qu'il a 15 ans)
= faible, certainement <10-4
Pr (qu'un Français soit VHC+ sachant qu'il est toxicomane IV depuis >5 ans)
= forte, certainement > 50% Pr (qu'un Français soit VHC+ sachant qu'il est asthmatique)
= 1 %
© A
J Va
llero
n, 2
013
Probabilité conditionnelle + + +
Notation : Pr (A / B) Expression courante (courte et dangereuse : car ne signifie rien) « Probabilité de A si B » Expression correcte (plus longue, mais explicite) « Probabilité que A survienne sachant que B a eu lieu » (a été réalisé/ est survenu / s’est produit…) »
© A
J Va
llero
n, 2
013
Indépendance de deux événements +++ la meilleure définition (car sans « formule »): Si lorsqu’on sait que B s'est produit, la valeur de la probabilité de A n’est pas modifiée, on dit que A et B sont indépendants.
ou Des événements indépendants n'apportent pas d'information l'un sur l'autre. l’asthme et le VHC+ ( diapo précédente ) sont indépendants : l’un n’aide pas au diagnostic de l’autre - Le bon sens le dit - Le calcul aussi: la proba de VHC+ est la même qu’on sache ou non que lepetient est asthmatique. (c’est 1%).
© A
J Va
llero
n, 2
013
Une formule définissant l’indépendance de A et B (+ + +)
Pr (A/B) = Pr (A) ou/et Pr (B/A) = Pr (B) Dans l’exemple : {A} = VHC+ et {B}= Asthmatique La fréquence du VHC+ est 1% à Pr (VHC+) = 1% La fréquence du VHC chez les asthmatiques est 1%
Pr (VHC+ / asthmatique) = 1%
© A
J Va
llero
n, 2
013
Calcul de la probabilité conditionnelle Pr(A/B) + + +
Avant de savoir que B s'est réalisé .. Si on sait que B s'est réalisé .. les événements conditionnels possibles sont uniquement dans l’ovale B
A B
E
Pr (A) ≈ 0.3
B
Pr (A/B) = Pr (A et B) Pr(B)
Pr (E) = 1
A
≈ 0.8
© A
J Va
llero
n, 2
013
Relation entre Pr(A/B) et Pr (B/A)
On utilise (A et B) ≡ (B et A)
Pr (A et B) = Pr (A/B) Pr (B) .. =
Pr (B et A) = Pr (B/A) Pr (A)
© A
J Va
llero
n, 2
013
Seconde formule de l’indépendance de A et B
Pr (A/B) = Pr (A) car indépendance Pr (A/B) = Pr (A et B) / Pr(B) toujours
Donc, si A et B sont indépendants : Pr (A et B) = Pr (A) x Pr(B)
NB: formule symétrique en A et B
++++
© A
J Va
llero
n, 2
013
Symétrie de l’indépendance de A et B
Si Pr (A/B) = Pr (A), alors on a aussi Pr (B/A) = Pr (B)
Si A est indépendant de B
Alors B est indépendant de A
© A
J Va
llero
n, 2
013
Indépendance et Incompatibilité ( QCMs meurtriers aisés)
Résultat : des événements incompatibles ne peuvent pas être indépendants... PREUVE (sans calcul): si je sais que E1 s’est produit, je sais automatiquement que E2 ne s’est pas produit (car E1∩ E2 = ∅ ). J’ai donc une information (forte) sur la probabilité conditionnelle de E2 (elle est =0) donc E1 et E2 ne sont pas indépendants. PREUVE (par calcul) Si E1 et E2 sont indépendants Pr (E2 et E1) = Pr(E2) x PR(E1) Comme E1 et E2 sont incompatibles Pr (E2 et E1) = 0 Mais Pr(E2) et PR(E1) sont ≠ 0.
© A
J Va
llero
n, 2
013
Proportion du risque d’une maladie attribuable à un facteur causal + + +
• Le tabac cause le cancer des bronches. Mais: – Tous les fumeurs n’ont pas un cancer des bronches – Tous les cancéreux des bronches n’ont pas fumé
• Question: Sur 100 cas de cancer des bronches, combien peut-on en
attribuer au tabac.
NB: méthodologie employée pour quantifier l’importance des différents facteurs de risque en pathologie humaine.
© A
J Va
llero
n, 2
013
Risque relatif On note F le fait d’avoir été exposé au facteur de
risque (ex: tabac, obésité, génotype..) et M d’avoir la maladie étudiée
Pr (M/F) est le risque de maladie chez les sujets exposés au facteur F
Pr (M/NF) est le risque de maladie chez les sujets non exposés au facteur F
Définition : le Risque Relatif est le rapport
€
RR =Pr(M /F)Pr(M /NF)
© A
J Va
llero
n, 2
013
Soit N la taille de la population On note f la proportion de la population exposée au facteur
de risque (ex: il ya f=30% de fumeurs) (1) Nbre de malades parmi les Nf exposés à F: Nf Pr(M/F) (2) Parmi les Nf exposés, Nf Pr (M/NF) auraient eu la
maladie s’ils n’avaient pas été exposés (3) le nbre de malades attribuable à l’exposition est (1) – (2) Nf Pr(M/F) – Nf Pr (M/NF) (4) Le nbre total de malades est : N f Pr(M/F) + N (1-f) Pr(M/NF)
© A
J Va
llero
n, 2
013
risque attribuable La proportion du nombre total de malades qui est
attribuable au facteur de risque F est (3) / (4) Application numérique : M = K des bronches, F= tabac (RR ≈ 10). On
trouve RA≈ 80% soit environ 25 000 cas/an attribuables au tabac
€
RA =Nf Pr(M F) − Nf Pr(
MNF)
Nf Pr(M F) + N(1− f )Pr(MNF)=
fRR −1
f (RR −1) +1où RR=
Pr(M F)
r(MNFest le risque relatif
© A
J Va
llero
n, 2
013
Diagnostic (+ + + +)
• Sensibilité, spécificité. • Théorème de Bayes. • Valeur Prédictive Positive, négative. • Courbe ROC (à cours 2)
NB : orthographe Un diagnostic (nom) Un signe diagnostique (adjectif) idem pour pronostic, pronostique…
© A
J Va
llero
n, 2
013
Quand un « signe » peut-il être utilisé dans le diagnostic d’une maladie?
« signe » : fièvre élevée, antécédents familiaux de diabète, TAs> 160mm Hg, … Un signe S ne peut être utilisé pour diagnostiquer une maladie M que s’il a une fréquence différente chez les Malades (M) et les non malades (NM).
Pr(S/M) ≠ Pr(S/NM)
© A
J Va
llero
n, 2
013
Défauts d’un test diagnostique - Les « faux positifs » le test classe le sujet comme malade alors qu’il ne l’est pas. - Les « faux négatifs » le test classe le sujet comme non malade alors qu’il l’est. vocabulaire : le « test » diagnostique permet de détecter si le « signe » diagnostique est présent
© A
J Va
llero
n, 2
013
Sensibilité – Spécificité +++ Sensibilité : un signe sensible est fréquent chez les malades. La sensibilité Se est quantifiée par : Se = Pr(S/M) Spécificité : un signe spécifique est rare chez les non malades. La spécificité Sp est quantifiée : Sp = Pr(NS/NM) ou 1- Sp = Pr(S/NM)
(NS : un sujet qui ne porte pas le signe S)
© A
J Va
llero
n, 2
013
Théorème de Bayes (1761, publié en 1763) Laplace (1773)
Objectif : exprimer Pr(A/B) en fonction de Pr(A), Pr(B/A) et Pr(B/ Ā) ( Ā = « contraire de A » ). Contexte diagnostique: Calculer Pr(M/S) en fonction de:
Pr (S/ M) Pr (S/ NM) Pr (M)
© A
J Va
llero
n, 2
013
Théorème de Bayes : application au diagnostic
le théorème permet de transformer la probabilité a priori de maladie (Pr (M)) en une probabilité a posteriori (Pr (M/S)) a priori signifie avant de savoir si le sujet a le signe S, et a posteriori après qu’on dispose de cette information.
© A
J Va
llero
n, 2
013
Théorème de Bayes application au diagnostic
On cherche la probabilité pour qu’un sujet aie la maladie M, sachant qu’il porte le signe S. Par exemple, M = Grippe et Signe S =T°> 39,5 °C
On cherche donc Pr (M/S) Les données disponibles : - La fréquence des sujets avec fièvre chez ceux qui ont
la grippe, c’est à dire Pr (S /M) - La fréquence des sujets avec fièvre chez ceux qui
n’ont pas la grippe, c’est à dire Pr (S /NM)
© A
J Va
llero
n, 2
013
bien distinguer Pr(M/S) et Pr(S/M)
100 % des gagnants (G) ont joué (J)
Pr (J/G) = 1 = 100%
Pr (G/J) = 0,000..
© A
J Va
llero
n, 2
013
Théorème de Bayes et Diagnostic
On cherche : Pr(M/S) en fonction de .... Pr(M) = probabilité a priori de la maladie Pr(S/M) = fréquence du signe chez les malades = Se Pr(S/NM) =fréquence du signe chez les non malades =1 – Sp
€
Pr(M /S) = Pr(M et S)Pr(S)
=Pr(S /M) Pr(M)
Pr(S)
© A
J Va
llero
n, 2
013
Décomposition de S sur M et NM
S et M : sujets qui ont le signe et sont
malades
S! M!
S et NM : sujets qui ont le signe et ne sont pas
malades
S : Sujets qui ont le signe
© A
J Va
llero
n, 2
013
Pr(S) = Pr(S et M) + Pr (S et NM) car (S et M) et (S et NM) sont incompatibles.
Pr( S et M) = Pr (S/M) Pr(M) Pr (S et NM) = Pr(S/NM) Pr(NM) Donc: Pr(S) = Pr (S/M) Pr(M) + Pr(S/NM) Pr(NM) et Pr (NM) = 1 – Pr(M)
© A
J Va
llero
n, 2
013
Théor. de Bayes appliqué au Diagnostic
Pr (M): prévalence de la maladie Pr (S/M) : sensibilité du signe S Pr (S/NM) : 1 - spécificité du signe S
Pr( / )Pr( )Pr( / )Pr( / )Pr( ) Pr( / )Pr( )
S M MM SS M M S NM NM
=+
))Pr(1()1()Pr()Pr()/Pr( MSpMSe
MSeSM−×−+×
×=
€
© A
J Va
llero
n, 2
013
Évaluation d’un test diagnostique +++
• Valeur Prédictive Positive d’un test : VPP VPP = Pr (M/S)
• Valeur Prédictive Négative d’un test : VPN VPN = Pr (NM/NS)
© A
J Va
llero
n, 2
013
Application au dépistage exemple du VIH
1- caractéristiques des tests : – très spécifiques : 0,999 (valeur indicative) – très sensibles : 0,99 (valeur indicative)
2 – prévalence – Supposons 100 000 sur 40 000 000, soit 1/400 (*) – Varie selon l’age ; peut être beaucoup plus élevée dans des populations à risque : NB : Chiffres actuels (Yéni, 2010) : Le nombre de personnes infectées par le VIH est estimé à 152 000 en 2008 dont 50 000 ignorent leur statut ou ne sont pas suivies.• Le nombre de nouvelles contaminations peut être estimé à 7 000 à 8 000 par an
© A
J Va
llero
n, 2
013
1/ cas du dépistage en population générale
application numérique au dépistage du VIH Pr(M) =5/2000 = 2,5/ 1000 Pr(S/M)=0,99 Pr(S/NM)=1-0,999 sur 100 personnes déclarées séropositives par le test, 29 ne le seraient pas en réalité. Donc nécessité d’au moins un second test de « confirmation ».
3
3 3
0,99 2,5 10Pr( / ) 71%0,99 2,5 10 (1 0,999) (1 2,5 10 )
M S−
− −
× ×= =
× × + − × − ×
© A
J Va
llero
n, 2
013
2/ Cas du dépistage dans une population à haut risque
si la probabilité a priori (c. à d., la prévalence dans la population testée) est élevée, la valeur prédictive positive du test augmente. Dans l’exemple du dépistage du VIH, avec le même test diagnostique (Sp = 999‰ et Se = 99%) pour P(M)=0,20 on trouve VPP = Pr(M/S) = 99,99%
© A
J Va
llero
n, 2
013
Théorème de Bayes (1761, publié en 1763) Laplace (1773)
Le théorème de Bayes exprime Pr(A/B) en fonction de Pr(A), Pr(B/A) et Pr(B/ Ā) ( Ā = « contraire de A » ).
€
Pr(A /B) =Pr(B /A)Pr(A)
Pr(B /A)Pr(A) +Pr(B /A)Pr(A)
avec A = Contrairede A
© A
J Va
llero
n, 2
013
Généralisation du théorème de Bayes
Au lieu de considérer un seul événement A ( ex: A= malade)
On considère k événements incompatibles A1, A2, … Ak
(ex: A1 est malade entre 20 et 30 ans, A2 est malade entre 30 et 40 ans, etc.)
€
Pr(A1 /B) =Pr(B /A1)Pr(A1)
Pr(B /Ai)Pr(Ai)i=1
k
∑
© A
J Va
llero
n, 2
013
Questions - Compléments
© A
J Va
llero
n, 2
013
Cours 1 – Question 1
On dit qu’un sujet de la population présente un syndrome grippal (causé ou non par le virus de la grippe) s’il a des signes respiratoires, une fièvre subite, des courbatures. un sujet infecté par le virus de la grippe a 80 chances sur 100 d’avoir ces symptômes. la probabilité pour qu’un sujet quelconque de la population soit infecté par le virus de la grippe est estimée à 30%. A- Pr (symptômes/Grippe) = 0,80 B- Pr (Grippe/symptômes) = 0,80 C- Pr (Grippe) = 0,30
D- Pr (Grippe et symptômes) = 0,30 E- Pr (Grippe et symptômes) = 0,24
© A
J Va
llero
n, 2
013
Cours 1 – Question 1 On dit qu’un sujet de la population présente un syndrome grippal (causé ou non par le virus de la grippe) s’il a des signes respiratoires, une fièvre subite, des courbatures. un sujet infecté par le virus de la grippe a 80 chances sur 100 d’avoir ces symptômes. la probabilité pour qu’un sujet quelconque de la population soit infecté par le virus de la grippe est estimée à 30%. A- Pr (symptômes/Grippe) = 0,80 B- Pr (Grippe/symptômes) = 0,80 C- Pr (Grippe) = 0,30
D- Pr (Grippe et symptômes) = 0,30 E- Pr (Grippe et symptômes) = 0,24
A C E
© A
J Va
llero
n, 2
013
Cours 1 – Question 2 Dans une consultation, la fréquence des patients consultant
pour trouble du sommeil est de 20%. Celle des patients ayant eu un épisode dépressif est de 15%. Celle des patients ayant un trouble du sommeil, et ayant eu un épisode dépressif est de 5%.
• A – la fréquence des patients sans trouble du sommeil est de 80%. • B- la probabilté pour qu’un patient de la consultation ait un trouble
du sommeil est de 0,20. • C- le fréquence des patients sans épisode dépressif est de 85%. • D- le fréquence des patients sans trouble du sommeil ni trouble
dépressif est de 0,80 x 0, 85 = 0,68 =68% • E- Si les troubles du sommeil et les épisodes dépressifs étaient des
événements indépendants, on devrait observer 3% de patients ayant un trouble du sommeil, et ayant eu un épisode dépressif (et non 5%).
© A
J Va
llero
n, 2
013
Cours 1 – Question 2 Dans une consultation, la fréquence des patients consultant
pour trouble du sommeil est de 20%. Celle des patients ayant eu un épisode dépressif est de 15%. Celle des patients ayant un trouble du sommeil, et ayant eu un épisode dépressif est de 5%.
• A – la fréquence des patients sans trouble du sommeil est de 80%. • B- la probabilité pour qu’un patient de la consultation ait un trouble
du sommeil est de 0,20. • C- le fréquence des patients sans épisode dépressif est de 85%. • D- le fréquence des patients sans trouble du sommeil ni trouble
dépressif est de 0,80 x 0, 85 = 0,68 =68% • E- Si les troubles du sommeil et les épisodes dépressifs étaient des
événements indépendants, on devrait observer 3% de patients ayant un trouble du sommeil, et ayant eu un épisode dépressif (et non 5%).
A B C E
© A
J Va
llero
n, 2
013
Cours 1 – Question 3 • En Egypte, la prévalence de l’hépatite C est très élevée : de
l’ordre de 15% en moyenne, et pouvant monter à 60 % dans certains villages de basse Egypte. Une explication pourrait être le traitement de masse contre le schistosiomase effectué dans les années 1970. Dans un de ces villages où la prévalence est de 60%, on trouve que 90% des sujets VHC+ ont été traités contre la schystosiomase, tandis que 20% des sujets VHC- l’ont été.
• A- Dans le village où la prévalence du VHC+ est de 60%, la probabilité de trouver deux habitants de suite VHC- est de 0,40 x 2 = 0,80
• B - Dans le village où la prévalence du VHC+ est de 60%, la probabilité de trouver deux habitants de suite VHC- est de 0,16
• C- Dans le village étudié, la probabilité (VHC+/traitement contre la schystosiomase)=0,90
• D- Dans le village étudié, la probabilité (traitement contre la schystosiomase/ VHC+)=0,90
• E- Dans le village étudié, le fait d’être VHC+ et d’avoir été traité contre la schistosiomase ne sont pas indépendants.
© A
J Va
llero
n, 2
013
Cours 1 – Question 3 • En Egypte, la prévalence de l’hépatite C est très élevée : de l’ordre de 15% en
moyenne, et pouvant monter à 60 % dans certains villages de basse Egypte. Une explication pourrait être le traitement de masse contre le schistosiomase effectué dans les années 1970. Dans un de ces villages où la prévalence est de 60%, on trouve que 90% des sujets VHC+ ont été traités contre la schistosiomase , tandis que 20% des sujets VHC- l’ont été.
• A- Dans le village où la prévalence du VHC+ est de 60%, la probabilité de trouver deux habitants de suite VHC- est de 0,40 x 2 = 0,80
• B - Dans le village où la prévalence du VHC+ est de 60%, la probabilité de trouver deux habitants de suite VHC- est de 0,16
• C- Dans le village étudié, la probabilité (VHC+/traitement contre la schistosiomase )=0,90
• D- Dans le village étudié, la probabilité (traitement contre la schistosiomase / VHC+)=0,90
• E- Dans le village étudié, le fait d’être VHC+ et d’avoir été traité contre la schistosiomase ne sont pas indépendants.
B D E
© A
J Va
llero
n, 2
013
Cours 1 – Question 4 (suite de 3) • A- La fréquence des sujets qui ont été traités contre la
schistosiomase dans ce village est entre 0,20 et 0,40. • B - La fréquence des sujets qui ont été traités contre la
schistosiomase dans ce village est entre 0,40 et 0,60. • C- La fréquence des sujets qui ont été traités contre la
schistosiomase dans ce village est entre 0,60 et 0,80. • D- 12% des sujets de ce village sont VHC+ après
avoir été traités contre la schistosiomase • E- 54% des sujets de ce village sont VHC+ après avoir
été traités contre la schistosiomase
C
© A
J Va
llero
n, 2
013
Cours 1: Question 5 1% des sujets de 65 ans ont , à l’occasion d’un examen de
routine, une glycémie supérieure à 130 mg/100ml. Parmi ceux là, 60 % se révèlent être finalement diabétiques. Par ailleurs, on considère qu’il y a environ 3% de diabétiques à cet age.
A- la sensibilité du critère 130mg/100ml est 60 %. B- la sensibilité du critère 130mg/100ml est 99 %. C- la spécificité du critère 130mg/100ml est 60 %. D- La valeur prédictive positive du test est 60 %. E- la sensibilité du critère 130mg/100ml est 20 %.
© A
J Va
llero
n, 2
013
Cours 1: Question 5 1% des sujets de 65 ans ont , à l’occasion d’un examen de
routine, une glycémie supérieure à 130 mg/100ml. Parmi ceux là, 60 % se révèlent être finalement diabétiques. Par ailleurs, on considère qu’il y a environ 3% de diabétiques à cet age.
A- la sensibilité du critère 130mg/100ml est 60 %. B- la sensibilité du critère 130mg/100ml est 99 %. C- la spécificité du critère 130mg/100ml est 60 %. D- La valeur prédictive positive du test est 60 %. E- la sensibilité du critère 130mg/100ml est 20 %. D E
© A
J Va
llero
n, 2
013
Cours 1: Question 6 Face à une malformation congénitale très rare, mais gravissime, on
dispose de tests diagnostiques. La mère veut avoir une très forte garantie qu’aucune malformation ne pourra passer inaperçue ; en cas de test positif, elle demandera une IVG. Elle indique qu’elle ne poursuivra pas le médecin en justice s’il se révèle que l’IVG effectuée était inutile ; en revanche, elle le poursuivra si à la naissance, on se trouve face à une malformation indétectée.
A- il faut que le test soit très sensible. B- il faut que le test soit très spécifique. C- il faut que la valeur prédictive positive soit très élévée. D- il faut que la valeur prédictive négative soit très basse. E- il faut que la valeur prédictive négative soit très haute.
© A
J Va
llero
n, 2
013
Cours 1: Question 6 Face à une malformation congénitale très rare, mais gravissime, on
dispose de tests diagnostiques. La mère veut avoir une très forte garantie qu’aucune malformation ne pourra passer inaperçue ; en cas de test positif, elle demandera une IVG. Elle indique qu’elle ne poursuivra pas le médecin en justice s’il se révèle que l’IVG effectuée était inutile ; en revanche, elle le poursuivra si à la naissance, on se trouve face à une malformation indétectée.
A- il faut que le test soit très sensible. B- il faut que le test soit très spécifique. C- il faut que la valeur prédictive positive soit très élévée. D- il faut que la valeur prédictive négative soit très basse. E- il faut que la valeur prédictive négative soit très haute.
A E
© A
J Va
llero
n, 2
013
Exercice: commenter ce résumé de « Place des D-Dimères dans le diagnostic des thromboses veineuses
profondes et de l’embolie pulmonaire » • Pour le diagnostic positif de maladie thromboembolique, quelle que soit la méthode, la spécificité et la valeur
prédictive positive des dosages de D-Dimères sont médiocres, de l'ordre de 50%, parce que les causes d'augmentation de D-Dimères sont nombreuses en dehors des thromboses veineuses. Cette spécificité est très mauvaise chez les malades hospitalisés (15 à 30%) mais acceptable (50 à 70%) chez les malades externes suspects de thrombose, qui n'ont pas d'autre raison d'avoir une augmentation du taux de D-Dimères.
• Pour le diagnostic d’exclusion de la maladie thromboembolique, de nombreux travaux, tous concordants, ont établi que dans le diagnostic d'une thrombose veineuse et d'une embolie pulmonaire un dosage de D-Dimères a une sensibilité et une valeur prédictive négative supérieure à 95%, sous réserve que le dosage soit effectué avec une méthode sensible. Cependant, certains auteurs, notamment Bauer de Boston estiment qu’une valeur prédictive négative de 95% est insuffisante. Cet auteur préconise pour les suspicions de TVP de coupler une échographie et un dosage de D-Dimères. La négativité des deux évite d’avoir recours à des explorations plus invasives, telles que la phlébographie par exemple. Pour l’embolie pulmonaire, il préconise de rajouter aux deux examens précédents une scintigraphie pulmonaire, les trois tests devant être normaux pour éviter d’autres explorations.
• Avec les méthodes moins sensibles type latex, la sensibilité et la valeur prédictive négative sont de l'ordre de 80 à 85%, c'est à dire que le risque de ne pas détecter l'épisode thromboembolique est de 15 à 20%, ce qui est en pratique inacceptable vu la gravité potentielle de ne pas traiter un malade atteint de maladie thromboembolique.
• On comprend dès lors l'intérêt accordé aux nouvelles méthodes ELISA simplifiées ou immuno-turbidimétriques, rapides, dont l'évaluation montre qu'elles ont des performances identiques à celles des méthodes ELISA traditionnelles.
• Il est important que le biologiste soit conscient de ces problèmes afin qu'il puisse conseiller utilement le clinicien confronté au diagnostic des phlébites et des embolies pulmonaires, et choisir un réactif validé par des travaux cliniques de qualité.
© Pr T. Mahjoub - www.efurgences.net
© A
J Va
llero
n, 2
013 calcul du risque attribuable
Application au cancer
D’après Boffetta et col., the causes of cancer, Annals of Oncology, 2008
© A
J Va
llero
n, 2
013
Pour réviser: l’exemple du jeu de cartes
on tire une carte ds un jeu de 52 cartes. il y a 52 événements élémentaires. il y a 2 52 événements (soit environ 4 x 1015) . E1=coeur E2=roi E3=dame E4=figure Pr(E1) = 0,25 Pr(E1/E2) = 0,25 Pr(E2) = 1/13 Pr(E3) = 1/13 Pr(E4) =3/13 Pr(E2/E3) = 0 Pr(E2/E4) = 1/3 Pr (E4/E3) = 1 E1 et E2 = roi de cœur E1 et E2 sont indépendants. Pr (E1 et E2) = 1/4 x 1/13 = 1/52