51
Méthodes de sondages, le pouvoir de l’alea Nathalie Villa-Vialaneix http://www.nathalievilla.org [email protected] Chargée de recherche INRA, Statistique Lycée Jules Fil, Carcassonne - 27 Mars 2014 Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 1 / 18

Slides Lycée Jules Fil 2014

  • Upload
    tuxette

  • View
    276

  • Download
    0

Embed Size (px)

DESCRIPTION

(en français) : introduction aux probabilités et au sondages (quinzaine des maths 2014)

Citation preview

Méthodes de sondages, le pouvoir de l’alea

Nathalie Villa-Vialaneixhttp://www.nathalievilla.org

[email protected]

Chargée de recherche INRA, Statistique

Lycée Jules Fil, Carcassonne - 27 Mars 2014

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 1 / 18

Loi des grands nombres

Outline

1 Loi des grands nombres

2 Utiliser le hasard pour un sondage

3 Théorème Centrale Limite

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 2 / 18

Loi des grands nombres

Jeu de pile ou face

Issues possibles dans un jeu de pile ou face : {pile, face}

n jeux de pile ou face ; on considère

P =]pile

n

(fréquences de “pile” parmi les lancers)

n valeurs possibles pour P Probabilité d’avoir cette valeur1 0, 1

12 , 1

22 0, 1

2 , 1 14 , 1

2 , 14

3 0, 13 , 2

3 , 1 18 , 3

8 , 38 , 1

8... ... ...n 0, 1

n , 2n , ..., 1 1

2n , n2n , n×(n−1)

2n+1 , ..., 12n

issues possibles : {pile, pile}, {pile, face}, {face, pile}, {face, face}

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18

Loi des grands nombres

Jeu de pile ou face

Issues possibles dans un jeu de pile ou face : {pile, face}

n jeux de pile ou face ; on considère

P =]pile

n

(fréquences de “pile” parmi les lancers)

n valeurs possibles pour P Probabilité d’avoir cette valeur1 0, 1

12 , 1

22 0, 1

2 , 1 14 , 1

2 , 14

3 0, 13 , 2

3 , 1 18 , 3

8 , 38 , 1

8... ... ...n 0, 1

n , 2n , ..., 1 1

2n , n2n , n×(n−1)

2n+1 , ..., 12n

issues possibles : {pile, pile}, {pile, face}, {face, pile}, {face, face}

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18

Loi des grands nombres

Jeu de pile ou face

Issues possibles dans un jeu de pile ou face : {pile, face}

n jeux de pile ou face ; on considère

P =]pile

n

(fréquences de “pile” parmi les lancers)

n valeurs possibles pour P Probabilité d’avoir cette valeur1 0, 1

12 , 1

22 0, 1

2 , 1 14 , 1

2 , 14

3 0, 13 , 2

3 , 1 18 , 3

8 , 38 , 1

8... ... ...n 0, 1

n , 2n , ..., 1 1

2n , n2n , n×(n−1)

2n+1 , ..., 12n

issues possibles : {pile, pile}, {pile, face}, {face, pile}, {face, face}

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18

Loi des grands nombres

Jeu de pile ou face

Issues possibles dans un jeu de pile ou face : {pile, face}

n jeux de pile ou face ; on considère

P =]pile

n

(fréquences de “pile” parmi les lancers)

n valeurs possibles pour P Probabilité d’avoir cette valeur1 0, 1

12 , 1

2

2 0, 12 , 1

14 , 1

2 , 14

3 0, 13 , 2

3 , 1 18 , 3

8 , 38 , 1

8... ... ...n 0, 1

n , 2n , ..., 1 1

2n , n2n , n×(n−1)

2n+1 , ..., 12n

issues possibles : {pile, pile}, {pile, face}, {face, pile}, {face, face}

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18

Loi des grands nombres

Jeu de pile ou face

Issues possibles dans un jeu de pile ou face : {pile, face}

n jeux de pile ou face ; on considère

P =]pile

n

(fréquences de “pile” parmi les lancers)

n valeurs possibles pour P Probabilité d’avoir cette valeur1 0, 1

12 , 1

2

2 0, 12 , 1

14 , 1

2 , 14

3 0, 13 , 2

3 , 1

18 , 3

8 , 38 , 1

8... ... ...n 0, 1

n , 2n , ..., 1 1

2n , n2n , n×(n−1)

2n+1 , ..., 12n

issues possibles : {pile, pile}, {pile, face}, {face, pile}, {face, face}

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18

Loi des grands nombres

Jeu de pile ou face

Issues possibles dans un jeu de pile ou face : {pile, face}

n jeux de pile ou face ; on considère

P =]pile

n

(fréquences de “pile” parmi les lancers)

n valeurs possibles pour P Probabilité d’avoir cette valeur1 0, 1

12 , 1

2

2 0, 12 , 1

14 , 1

2 , 14

3 0, 13 , 2

3 , 1

18 , 3

8 , 38 , 1

8

... ...

...

n 0, 1n , 2

n , ..., 1

12n , n

2n , n×(n−1)2n+1 , ..., 1

2n

issues possibles : {pile, pile}, {pile, face}, {face, pile}, {face, face}

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18

Loi des grands nombres

Jeu de pile ou face

Issues possibles dans un jeu de pile ou face : {pile, face}

n jeux de pile ou face ; on considère

P =]pile

n

(fréquences de “pile” parmi les lancers)

n valeurs possibles pour P Probabilité d’avoir cette valeur1 0, 1 1

2 , 12

2 0, 12 , 1

14 , 1

2 , 14

3 0, 13 , 2

3 , 1

18 , 3

8 , 38 , 1

8

... ...

...

n 0, 1n , 2

n , ..., 1

12n , n

2n , n×(n−1)2n+1 , ..., 1

2n

issues possibles : {pile, pile}, {pile, face}, {face, pile}, {face, face}

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18

Loi des grands nombres

Jeu de pile ou face

Issues possibles dans un jeu de pile ou face : {pile, face}

n jeux de pile ou face ; on considère

P =]pile

n

(fréquences de “pile” parmi les lancers)

n valeurs possibles pour P Probabilité d’avoir cette valeur1 0, 1 1

2 , 12

2 0, 12 , 1 1

4 , 12 , 1

43 0, 1

3 , 23 , 1

18 , 3

8 , 38 , 1

8

... ...

...

n 0, 1n , 2

n , ..., 1

12n , n

2n , n×(n−1)2n+1 , ..., 1

2n

issues possibles : {pile, pile}, {pile, face}, {face, pile}, {face, face}

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18

Loi des grands nombres

Jeu de pile ou face

Issues possibles dans un jeu de pile ou face : {pile, face}

n jeux de pile ou face ; on considère

P =]pile

n

(fréquences de “pile” parmi les lancers)

n valeurs possibles pour P Probabilité d’avoir cette valeur1 0, 1 1

2 , 12

2 0, 12 , 1 1

4 , 12 , 1

43 0, 1

3 , 23 , 1 1

8 , 38 , 3

8 , 18

... ...

...

n 0, 1n , 2

n , ..., 1

12n , n

2n , n×(n−1)2n+1 , ..., 1

2n

issues possibles : {pile, pile}, {pile, face}, {face, pile}, {face, face}

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18

Loi des grands nombres

Jeu de pile ou face

Issues possibles dans un jeu de pile ou face : {pile, face}

n jeux de pile ou face ; on considère

P =]pile

n

(fréquences de “pile” parmi les lancers)

n valeurs possibles pour P Probabilité d’avoir cette valeur1 0, 1 1

2 , 12

2 0, 12 , 1 1

4 , 12 , 1

43 0, 1

3 , 23 , 1 1

8 , 38 , 3

8 , 18

... ... ...n 0, 1

n , 2n , ..., 1 1

2n , n2n , n×(n−1)

2n+1 , ..., 12n

issues possibles : {pile, pile}, {pile, face}, {face, pile}, {face, face}

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18

Loi des grands nombres

Répéter le jeu de pile ou face... longtemps !

Regardons comment P évolue :

1 lancer

2 lancers3 lancers...

n lancers

→...

P(1)

P(2)P(3)...

P(n)

tracer le graphique de P(n) en fonction de n...

Simulons !

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 4 / 18

Loi des grands nombres

Répéter le jeu de pile ou face... longtemps !

Regardons comment P évolue :

1 lancer2 lancers

3 lancers...

n lancers

→...

P(1)P(2)

P(3)...

P(n)

tracer le graphique de P(n) en fonction de n...

Simulons !

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 4 / 18

Loi des grands nombres

Répéter le jeu de pile ou face... longtemps !

Regardons comment P évolue :

1 lancer2 lancers3 lancers...

n lancers

→...

P(1)P(2)P(3)...

P(n)

tracer le graphique de P(n) en fonction de n...

Simulons !

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 4 / 18

Loi des grands nombres

Conclusion

Quand n devient très grand,

P(n) =]pile

n

se rapproche de 12 , càd, de la probabilité d’obtenir “pile” en lançant

une pièce !

Loi des grands nombres

fréquence observée d’un événement sur un grand nombre d’essais↓

probabilité (théorique) d’obtenir cet événement sur un essai

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 5 / 18

Loi des grands nombres

Conclusion

Quand n devient très grand,

P(n) =]pile

n

se rapproche de 12 , càd, de la probabilité d’obtenir “pile” en lançant

une pièce !

Loi des grands nombres

fréquence observée d’un événement sur un grand nombre d’essais↓

probabilité (théorique) d’obtenir cet événement sur un essai

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 5 / 18

Loi des grands nombres

Perspective historique“Ars Conjectandi” (1713) de Jacques Bernoulli est le premier ouvragecontenant une démonstration de la loi des grands nombres dans le cas dela fréquence de succès d’un événement (comme le jeu de “pile ou face”).

La démonstration lui prit 20 ans et fût publiée par son neveu huit ans aprèssa mort. On appelle loi de Bernoulli une loi qui donne la probabilité dusuccès d’un événement : “avoir un pile au jeu de pile ou face” (1/2), “avoirun 6 au dé” (1/6), etc...

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 6 / 18

Loi des grands nombres

Perspective historique“Ars Conjectandi” (1713) de Jacques Bernoulli est le premier ouvragecontenant une démonstration de la loi des grands nombres dans le cas dela fréquence de succès d’un événement (comme le jeu de “pile ou face”).

La démonstration lui prit 20 ans et fût publiée par son neveu huit ans aprèssa mort. On appelle loi de Bernoulli une loi qui donne la probabilité dusuccès d’un événement : “avoir un pile au jeu de pile ou face” (1/2), “avoirun 6 au dé” (1/6), etc...Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 6 / 18

Loi des grands nombres

Extension au cas d’une loi quelconqueExpérience : On tire au hasard des nombres selon une distribution deprobabilité donnée (ex : tirer au hasard un nombre entre 0 et 1)

x1, x2, x3...

Densité de la distribution de probabilité, fX : exemple de la densité dela loi Gaussienne

Espérance : E(X) =∫

xfX(x)dx (exemple : pour la loi Gaussienne,E(X) = 0 ; pour un nombre tiré au hasard entre 0 et 1 : E(X) = 0, 5)

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 7 / 18

Loi des grands nombres

Extension au cas d’une loi quelconqueExpérience : On tire au hasard des nombres selon une distribution deprobabilité donnée (ex : tirer au hasard un nombre entre 0 et 1)

x1, x2, x3...

Densité de la distribution de probabilité, fX : exemple de la densité dela loi Gaussienne

Espérance : E(X) =∫

xfX(x)dx (exemple : pour la loi Gaussienne,E(X) = 0 ; pour un nombre tiré au hasard entre 0 et 1 : E(X) = 0, 5)

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 7 / 18

Loi des grands nombres

Extension au cas d’une loi quelconqueExpérience : On tire au hasard des nombres selon une distribution deprobabilité donnée (ex : tirer au hasard un nombre entre 0 et 1)

x1, x2, x3...

Densité de la distribution de probabilité, fX : exemple de la densité dela loi Gaussienne

Espérance : E(X) =∫

xfX(x)dx (exemple : pour la loi Gaussienne,E(X) = 0 ; pour un nombre tiré au hasard entre 0 et 1 : E(X) = 0, 5)Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 7 / 18

Loi des grands nombres

Convergence vers l’espérance

On définit la moyenne des n premiers nombres tirés : Xn = x1+...+xnn

tracer le graphique de Xn en fonction de n...

Simulons !

Loi des grands nombres

Xn se rapproche de E(X)

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 8 / 18

Loi des grands nombres

Convergence vers l’espérance

On définit la moyenne des n premiers nombres tirés : Xn = x1+...+xnn

tracer le graphique de Xn en fonction de n...

Simulons !

Loi des grands nombres

Xn se rapproche de E(X)

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 8 / 18

Loi des grands nombres

Convergence vers l’espérance

On définit la moyenne des n premiers nombres tirés : Xn = x1+...+xnn

tracer le graphique de Xn en fonction de n...

Simulons !

Loi des grands nombres

Xn se rapproche de E(X)

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 8 / 18

Utiliser le hasard pour un sondage

Outline

1 Loi des grands nombres

2 Utiliser le hasard pour un sondage

3 Théorème Centrale Limite

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 9 / 18

Utiliser le hasard pour un sondage

Exemple introductifOn cherche à savoir le pourcentage de personnes en France qui aiment lapizza (noté P et inconnu)

1 Solution 1 : interroger tous les habitants de France et leur demandersi ils aiment la pizza : c’est long !!!!!!!

2 Solution 2 (sondage aléatoire) : interroger au hasard n personnesdans la population et calculer P̂(n) le pourcentage de personnes quiaiment la pizza

la probabilité qu’une personne prise au hasard aime la pizza est P(inconnue) donc

P̂(n) ' P

si n est assez grand

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 10 / 18

Utiliser le hasard pour un sondage

Exemple introductifOn cherche à savoir le pourcentage de personnes en France qui aiment lapizza (noté P et inconnu)

1 Solution 1 : interroger tous les habitants de France et leur demandersi ils aiment la pizza : c’est long !!!!!!!

2 Solution 2 (sondage aléatoire) : interroger au hasard n personnesdans la population et calculer P̂(n) le pourcentage de personnes quiaiment la pizza

la probabilité qu’une personne prise au hasard aime la pizza est P(inconnue) donc

P̂(n) ' P

si n est assez grand

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 10 / 18

Utiliser le hasard pour un sondage

Exemple introductifOn cherche à savoir le pourcentage de personnes en France qui aiment lapizza (noté P et inconnu)

1 Solution 1 : interroger tous les habitants de France et leur demandersi ils aiment la pizza : c’est long !!!!!!!

2 Solution 2 (sondage aléatoire) : interroger au hasard n personnesdans la population et calculer P̂(n) le pourcentage de personnes quiaiment la pizza

la probabilité qu’une personne prise au hasard aime la pizza est P(inconnue) donc

P̂(n) ' P

si n est assez grand

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 10 / 18

Utiliser le hasard pour un sondage

Exemple introductifOn cherche à savoir le pourcentage de personnes en France qui aiment lapizza (noté P et inconnu)

1 Solution 1 : interroger tous les habitants de France et leur demandersi ils aiment la pizza : c’est long !!!!!!!

2 Solution 2 (sondage aléatoire) : interroger au hasard n personnesdans la population et calculer P̂(n) le pourcentage de personnes quiaiment la pizzala probabilité qu’une personne prise au hasard aime la pizza est P(inconnue) donc

P̂(n) ' P

si n est assez grandSondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 10 / 18

Utiliser le hasard pour un sondage

Perspective historique• le principe du sondage est pratiqué depuis le Moyen-Âge mais sans

contrôle probabiliste ;

au XVIIIe, Pierre-Simon de Laplace :premières estimations pour évaluer lapopulation française à partir des naissances(choix raisonné d’échantillonnage, notiond’“erreur à craindre”) ;

Arthur Bowley (∼ 1900) : premierssondages aléatoires (notion d’intervalle deconfiance) ;

• approche reconnue au congrès de l’IIS en 1925 (Rome) et qui segénéralise dans les instituts de sondage nationaux.

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 11 / 18

Utiliser le hasard pour un sondage

Perspective historique• le principe du sondage est pratiqué depuis le Moyen-Âge mais sans

contrôle probabiliste ;

au XVIIIe, Pierre-Simon de Laplace :premières estimations pour évaluer lapopulation française à partir des naissances(choix raisonné d’échantillonnage, notiond’“erreur à craindre”) ;

Arthur Bowley (∼ 1900) : premierssondages aléatoires (notion d’intervalle deconfiance) ;

• approche reconnue au congrès de l’IIS en 1925 (Rome) et qui segénéralise dans les instituts de sondage nationaux.

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 11 / 18

Utiliser le hasard pour un sondage

Perspective historique• le principe du sondage est pratiqué depuis le Moyen-Âge mais sans

contrôle probabiliste ;

au XVIIIe, Pierre-Simon de Laplace :premières estimations pour évaluer lapopulation française à partir des naissances(choix raisonné d’échantillonnage, notiond’“erreur à craindre”) ;

Arthur Bowley (∼ 1900) : premierssondages aléatoires (notion d’intervalle deconfiance) ;

• approche reconnue au congrès de l’IIS en 1925 (Rome) et qui segénéralise dans les instituts de sondage nationaux.

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 11 / 18

Utiliser le hasard pour un sondage

Méthodes de sondage aléatoiresSondage simple

On choisit au hasard n personnes dans la population.

Sondage par strates

Simulons !

La population est divisée en un petit nombre de sous-populations qui ontdes valeurs différentes pour la variable d’intérêt (ex : 3 classes d’âges)

on choisit au hasard quelques personnes dans chaquesous-population : réduit la variabilité de l’estimation... !

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 12 / 18

Utiliser le hasard pour un sondage

Méthodes de sondage aléatoiresSondage simple

On choisit au hasard n personnes dans la population.

Sondage par strates

Simulons !

La population est divisée en un petit nombre de sous-populations qui ontdes valeurs différentes pour la variable d’intérêt (ex : 3 classes d’âges)

on choisit au hasard quelques personnes dans chaquesous-population : réduit la variabilité de l’estimation... !

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 12 / 18

Utiliser le hasard pour un sondage

Méthodes de sondage aléatoiresSondage par grappes

La population est divisée en (beaucoup de) petites sous-populations (ex :les départements français)

⇒ on choisit au hasard quelquessous-populations pour lesquelles on interroge tout le monde : c’estmoins coûteux... !

Sondage par strates

Simulons !

La population est divisée en un petit nombre de sous-populations qui ontdes valeurs différentes pour la variable d’intérêt (ex : 3 classes d’âges)

on choisit au hasard quelques personnes dans chaquesous-population : réduit la variabilité de l’estimation... !

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 12 / 18

Utiliser le hasard pour un sondage

Méthodes de sondage aléatoiresSondage par grappes

La population est divisée en (beaucoup de) petites sous-populations (ex :les départements français)⇒ on choisit au hasard quelquessous-populations pour lesquelles on interroge tout le monde : c’estmoins coûteux... !

Sondage par strates

Simulons !

La population est divisée en un petit nombre de sous-populations qui ontdes valeurs différentes pour la variable d’intérêt (ex : 3 classes d’âges)

on choisit au hasard quelques personnes dans chaquesous-population : réduit la variabilité de l’estimation... !

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 12 / 18

Utiliser le hasard pour un sondage

Méthodes de sondage aléatoiresSondage par strates

Simulons !

La population est divisée en un petit nombre de sous-populations qui ontdes valeurs différentes pour la variable d’intérêt (ex : 3 classes d’âges)

on choisit au hasard quelques personnes dans chaquesous-population : réduit la variabilité de l’estimation... !

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 12 / 18

Utiliser le hasard pour un sondage

Méthodes de sondage aléatoiresSondage par strates Simulons !

La population est divisée en un petit nombre de sous-populations qui ontdes valeurs différentes pour la variable d’intérêt (ex : 3 classes d’âges)⇒on choisit au hasard quelques personnes dans chaquesous-population : réduit la variabilité de l’estimation... !

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 12 / 18

Utiliser le hasard pour un sondage

Le sondage en pratique : souvent, la méthode des quotas

Actuellement, les instituts de sondage pratiquent souvent la

méthode des quotas

(construction d’un échantillon non aléatoire construit pour reproduire lescaractéristiques d’âge, sexe, CSP, etc de la population)

Problème : Aucune possibilité de contrôler l’ampleur de l’erreur effectuéelors de l’estimation avec une approche probabiliste !

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 13 / 18

Utiliser le hasard pour un sondage

Le sondage en pratique : souvent, la méthode des quotas

Actuellement, les instituts de sondage pratiquent souvent la

méthode des quotas

(construction d’un échantillon non aléatoire construit pour reproduire lescaractéristiques d’âge, sexe, CSP, etc de la population)

Problème : Aucune possibilité de contrôler l’ampleur de l’erreur effectuéelors de l’estimation avec une approche probabiliste !

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 13 / 18

Théorème Centrale Limite

Outline

1 Loi des grands nombres

2 Utiliser le hasard pour un sondage

3 Théorème Centrale Limite

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 14 / 18

Théorème Centrale Limite

Retour au jeu de pile ou face...

Ici, on fixe n. On sait que pour n “assez grand”, P(n) ' 0, 5 (lepourcentage de “pile” observés sur n tirages est proche de 50%).

Comment se répartit P(n) autour de 0,5 si on effectue plusieurs sériesde n tirages ?

Simulons !

1 on génère m séries de n tirages chacune ;

2 pour chacune des séries, on calcule P(n) ;

3 on centre et on réduit P(n) en calculant pour chaque série : P(n)−0,51/(2

√n)

;1

4 on effectue l’histogramme des m valeurs ainsi trouvées.

1 12√

nest en fait l’écart type attendu de P(n).

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 15 / 18

Théorème Centrale Limite

Retour au jeu de pile ou face...

Ici, on fixe n. On sait que pour n “assez grand”, P(n) ' 0, 5 (lepourcentage de “pile” observés sur n tirages est proche de 50%).

Comment se répartit P(n) autour de 0,5 si on effectue plusieurs sériesde n tirages ?

Simulons !

1 on génère m séries de n tirages chacune ;

2 pour chacune des séries, on calcule P(n) ;

3 on centre et on réduit P(n) en calculant pour chaque série : P(n)−0,51/(2

√n)

;1

4 on effectue l’histogramme des m valeurs ainsi trouvées.

1 12√

nest en fait l’écart type attendu de P(n).

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 15 / 18

Théorème Centrale Limite

Retour au jeu de pile ou face...

Ici, on fixe n. On sait que pour n “assez grand”, P(n) ' 0, 5 (lepourcentage de “pile” observés sur n tirages est proche de 50%).

Comment se répartit P(n) autour de 0,5 si on effectue plusieurs sériesde n tirages ?

Simulons !

1 on génère m séries de n tirages chacune ;

2 pour chacune des séries, on calcule P(n) ;

3 on centre et on réduit P(n) en calculant pour chaque série : P(n)−0,51/(2

√n)

;1

4 on effectue l’histogramme des m valeurs ainsi trouvées.

1 12√

nest en fait l’écart type attendu de P(n).

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 15 / 18

Théorème Centrale Limite

Conclusion des simulationsRésultat : Lorsque n devient grand et que le nombre de séries de tiragesdevient grand aussi l’histogramme des P(n)−0,5

σ(P(n)) ' densité gaussienne demoyenne 0 et d’écart type 1.

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 16 / 18

Théorème Centrale Limite

Extension pour une distribution généraleLe théorème Centrale Limite

La propriété précédente est vraie de manière très générale : Xn−E(X)σX

estréparti autour de 0 comme une loi gaussienne de moyenne 0 et d’écarttype 1 lorsque n devient grand.

95% des valeurs Xn−E(X)σX

sont entre −1, 96 et 1, 96 (très faible probabilité).

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 17 / 18

Théorème Centrale Limite

Extension pour une distribution généraleLe théorème Centrale Limite

La propriété précédente est vraie de manière très générale : Xn−E(X)σX

estréparti autour de 0 comme une loi gaussienne de moyenne 0 et d’écarttype 1 lorsque n devient grand.

95% des valeurs Xn−E(X)σX

sont entre −1, 96 et 1, 96 (très faible probabilité).

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 17 / 18

Théorème Centrale Limite

Application pour la recherche d’un intervalle de confiance

En sondage :

1 on calcule : moyenne de la variable étudiée sur l’échantillon X ;

2 si σX est connue, on en déduit un intervalle de confiance :IC =

[X − 1, 96 × σX√

n;X + 1, 96 × σX√

n

].

Interprétation : 95% des échantillons construits ainsi contiennent labonne valeur de l’espérance E(X).

Simulons !

En pratique, σX n’est pas connue, comme la moyenne, on l’estime àpartir de l’écart type sur l’échantillon.

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 18 / 18

Théorème Centrale Limite

Application pour la recherche d’un intervalle de confiance

En sondage :

1 on calcule : moyenne de la variable étudiée sur l’échantillon X ;

2 si σX est connue, on en déduit un intervalle de confiance :IC =

[X − 1, 96 × σX√

n;X + 1, 96 × σX√

n

].

Interprétation : 95% des échantillons construits ainsi contiennent labonne valeur de l’espérance E(X).

Simulons !

En pratique, σX n’est pas connue, comme la moyenne, on l’estime àpartir de l’écart type sur l’échantillon.

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 18 / 18

Théorème Centrale Limite

Application pour la recherche d’un intervalle de confiance

En sondage :

1 on calcule : moyenne de la variable étudiée sur l’échantillon X ;

2 si σX est connue, on en déduit un intervalle de confiance :IC =

[X − 1, 96 × σX√

n;X + 1, 96 × σX√

n

].

Interprétation : 95% des échantillons construits ainsi contiennent labonne valeur de l’espérance E(X).

Simulons !

En pratique, σX n’est pas connue, comme la moyenne, on l’estime àpartir de l’écart type sur l’échantillon.

Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 18 / 18