29

On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

Embed Size (px)

Citation preview

Page 1: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables
Page 2: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

On a deux variables quantitatives.

On cherche s’il y a un lien entre les 2 variables

Page 3: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

1. Garçons ou filles : qui réussi le mieux au bac ?

2. Cigarette et cancer : y a t il un lien ?3. Prévention routière : moins d’accident chez

les verbalisés ?

Autre formulation :

1. Y a t il un lien entre sexe et réussite au bac ?2. Y a t il un lien entre cancer et cigarette ?3. Y a t il un lien entre accident et

verbalisation ?

Page 4: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

H0 : il n’y a pas de lien entre la variable sexe et la variable résultat.

Page 5: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

EffectifAdmis Garçon 10Admis Fille 42Refusé Garçon 5Refusé Fille 18

Garçons FillesRefusés 5 18Admis 10 42

Résultat SexeIsabelle Ref FSylvain Adm GLucie Adm Fjean Ref GZoé Adm F… … …

Données brutesTableau des effectifs

Tableau croisé

Page 6: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

Garçons FillesRefusés 5 18Admis 10 42

Garçons FillesRefusés 50 10Admis 50 70

Garçons FillesRefusés 30 15Admis 30 15

Dans notre lycée :

Pas de différenceH0 n’est pas rejetable

Différence énorme On rejette H0

Variabilité biologique ?Différence significative ?

Page 7: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

On veut un indice qui reflète les disparités de notre tableau.

On veut qu’il soit grand pour

et petit pour :

Garçons FillesRefusés 50 10Admis 50 70

Garçons FillesRefusés 30 15Admis 30 15

Page 8: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

Pour le calculer :1. Tableau des effectifs observés (tableau

croisé) 2. Tableau des effectifs attendus3. Tableau des écarts4. Tableau des écarts au carré et pondérés5. 2

Page 9: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables
Page 10: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

Garçons Filles TotalRefusés 5 18 23Admis 10 42 52Total 15 60 75

Page 11: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

Résultats

Pour chaque case : effectif attendu = total colonne x total ligne

total généralGarçons Filles Total

Refusés 23Admis 52Total 15 60 75

Garçons Filles TotalRefusés 15x23/75 6x23/75 23Admis 15x52/75 60x52/75 52Total 15 60 75

Garçons Filles TotalRefusés 4,6 18,4 23Admis 10,4 41,6 52Total 15 60 75

Totaux

Calcul par case

Page 12: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

Pour chaque case : écart brut = effectifs observés – effectifs

attendus

=

Effectifs attendusEffectifs observés

Tableau des écarts bruts

Garçons FillesRefusés 4,6 18,4Admis 10,4 41,6

Garçons FillesRefusés 5 18Admis 10 42

Garçons FillesRefusés 0,4 -0,4Admis -0,4 0,4

Page 13: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

Pour chaque case : Écart au carré pondéré =

Garçons Filles

Refusés (0,4)2/4,6 (-0,4)2/18,4

Admis (-0,4)2/10,4 (0,4)2/41,6

(écart brut)2

effectif attendu

Garçons FillesRefusés 0,035 0,009Admis 0,015 0,004

Page 14: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

Le 2 est la somme des écarts au carré pondérés

2 = (Écart au carré pondéré)

2 =0,035+0,015+0,009+0,004=0,63

Garçons FillesRefusés 0,035 0,009Admis 0,015 0,004

Page 15: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

Y a t il un lien entre couleur des yeux et des cheveux ?

H0 : il n’y a pas de lien entre la couleur des yeux et celle des cheveux

Page 16: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

CheveuxBlond Bruns Noir Roux Total

Bleus 25 9 3 7 44

Yeux Vert 13 17 10 7 47

Marron 7 13 8 5 33Total 45 39 21 19 124

Page 17: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

CheveuxBlond Bruns Noir Roux Total

Bleus 44

Yeux Vert 47

Marron 33Total 45 39 21 19 124

CheveuxBlond Bruns Noir Roux Total

Bleus 16,0 13,8 7,5 6,7 44

Yeux Vert 17,1 14,8 8,0 7,2 47

Marron 12,0 10,4 5,6 5,1 33

Total 45 39 21 19 124

Pour chaque case : effectif attendus = total colonne x total ligne

total général

Page 18: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

Pour chaque case : écart brut = effectif observé – effectif

attendu

=

Effectifs attendusEffectifs observés

Tableau des écarts bruts

Blond Bruns Noir RouxBleus 25 9 3 7

Vert 13 17 10 7

Marron 7 13 8 5

Blond Bruns Noir RouxBleus 16,0 13,8 7,5 6,7

Vert 17,1 14,8 8,0 7,2

Marron 12,0 10,4 5,6 5,1

Blond Bruns Noir RouxBleus 9,0 -4,8 -4,5 0,3Vert -4,1 2,2 2,0 -0,2

Marron -5,0 2,6 2,4 -0,1

Page 19: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

Pour chaque case : Ecart au carré pondéré = (écart brut)2

effectif attendu

Blond Bruns Noir Roux

Bleus (9,0)2/16,0 (-4,8)2/13,8 (-4,5)2/7,5 (0,3)2/6,7

Vert (-4,1)2/17,1 (2,2)2/14,8 (2,0)2/8,0 (-0,2)2/7,2

Marron (-5,0)2/12,0 (2,6)2/10,4 (2,4)2/5,6 (-0,1)2/5,1

Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01

Marron 2,07 0,66 1,04 0,00

Page 20: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

2 = (écart au carré pondéré)

2 = 5,11+1,69+2,66+0,01+

0,96+0,33+0,52+0,01+

2,07+0,66+1,04+0,00 = 15,05

Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01

Marron 2,07 0,66 1,04 0,00

Page 21: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

2Obs

=(effectifs observés – effectifs théoriques)2

effectif théorique

Page 22: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables
Page 23: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

Quand un 2 est-il grand ?

A B C D ETrès grand 0,3 0,2 0,3 0,2 0,1Grand 0,2 0,1 0,1 0,1 0,3Moyen 0,3 0,3 0,2 0,3 0,1Petit 0,1 0,3 0,1 0,2 0,3Très petit 0,2 0,2 0,3 0,3 0,2

Homme FemmeAdmis 0,2 0,1Refusé 0,1 2,2

2=2,6 2=5,3

Page 24: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

DDL=Degrés de liberté

DDL=(Nombre de colonnes-1)x(Nombre de lignes-1)

DDL = (2-1)x(2-1) = 1 DDL=(4-1)x(3-1) = 6 Blond Bruns Noir Roux

Bleus 16,0 13,8 7,5 6,7

Vert 17,1 14,8 8,0 7,2

Marron 12,0 10,4 5,6 5,1

Garçons FillesRefusés 5 18Admis 10 42

Page 25: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

R : chisq.test(effectifs Observés)

χ2 1 2 3 4 5 6 7 8 9 10 11 12 130,00 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00%

0,50 47,95% 77,88% 91,89% 97,35% 99,21% 99,78% 99,94% 99,99% 100,00% 100,00% 100,00% 100,00% 100,00%

1,00 31,73% 60,65% 80,13% 90,98% 96,26% 98,56% 99,48% 99,82% 99,94% 99,98% 99,99% 100,00% 100,00%

1,50 22,07% 47,24% 68,23% 82,66% 91,31% 95,95% 98,23% 99,27% 99,71% 99,89% 99,96% 99,99% 100,00%

2,00 15,73% 36,79% 57,24% 73,58% 84,91% 91,97% 95,98% 98,10% 99,15% 99,63% 99,85% 99,94% 99,98%

2,50 11,38% 28,65% 47,53% 64,46% 77,65% 86,85% 92,71% 96,17% 98,09% 99,09% 99,58% 99,82% 99,92%

3,00 8,33% 22,31% 39,16% 55,78% 70,00% 80,88% 88,50% 93,44% 96,43% 98,14% 99,07% 99,55% 99,79%

3,50 6,14% 17,38% 32,08% 47,79% 62,34% 74,40% 83,52% 89,92% 94,11% 96,71% 98,23% 99,09% 99,54%

4,00 4,55% 13,53% 26,15% 40,60% 54,94% 67,67% 77,98% 85,71% 91,14% 94,73% 96,99% 98,34% 99,12%

4,50 3,39% 10,54% 21,23% 34,25% 47,99% 60,93% 72,07% 80,94% 87,55% 92,20% 95,29% 97,26% 98,46%

5,00 2,53% 8,21% 17,18% 28,73% 41,59% 54,38% 66,00% 75,76% 83,43% 89,12% 93,12% 95,80% 97,52%

5,50 1,90% 6,39% 13,86% 23,97% 35,79% 48,15% 59,92% 70,30% 78,87% 85,54% 90,46% 93,92% 96,25%

Probabilité qu'il n'y ait pas de lien entre les deux variables

DDL

χ2

2=2,6DDL=1p=0,11

2=5,3DDL=6p=0,51

Page 26: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

Sexe / Réussite :

2Obs=0,63 et DDL=1

P=0.11

On ne peut pas rejeter H0,

Il n’y a pas de lien entre Sexe et Réussite

C. Cheveux / C. Yeux :

2Obs=15,05 et DDL=6

P=0,0167

On peut rejeter H0,

Il y a un lien entre C. Cheveux et C. Yeux

>5%

<5%

Page 27: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables
Page 28: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

Écarts au carré pondérés

Parce que Blond / Bleus = 5,11 et que Noir / Bleus = 2,66 Ces deux cases « apportent » beaucoup au 2

Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01

Marron 2,07 0,66 1,04 0,00

Page 29: On a deux variables quantitatives. On cherche sil y a un lien entre les 2 variables

Cases qui apportent beaucoup : Sur le tableau des écarts au carré pondéré

Apport positif ou négatifs ? Sur le tableau des écarts, Blonds / Bleus = + 9 : il y en a

beaucoup.

On dit qu’ils sont

sur-représentés

Sur le tableau des écarts, Noirs / Bleus = - 4,5 : il en manque beaucoup.

On dit qu’ils sont

sous-représentés

Blond Bruns Noir RouxBleus 9,0 -4,8 -4,5 0,3Vert -4,1 2,2 2,0 -0,2

Marron -5,0 2,6 2,4 -0,1

Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01

Marron 2,07 0,66 1,04 0,00

Écarts au carré pondérés Écarts