47
AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Embed Size (px)

Citation preview

Page 1: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

AUTOUR DE LA LOI NORMALE

Formation nouveaux programmes de Terminales S et ES

Page 2: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Les objectifs du programme de statistique en terminale

Formation nouveaux programmes de Terminales

2

Poursuivre le travail de statistique inférentielle commencé en classe de Seconde et de Première Prise de décision en situation de

risque Estimation par intervalle de confiance

Avec un nouvel outil : la loi normale

Page 3: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

POURQUOI LA LOI NORMALE ?

Formation nouveaux programmes de Terminales S et ES

Page 4: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Un exemple : Etude du surpoids

formation nouveaux programmes de terminales

4

Dans la population étudiée, il y a 46% d’hommes et 18% de personnes de plus de 60 ans. Un sondage a été réalisé par un tirage au hasard de 400 personnes, et peut être assimilé à un tirage avec remise.1. Dans l’échantillon prélevé pour cette étude on

observe :

 Cet échantillon est-il représentatif ?

2. L’étude montre que dans cet échantillon 29% des personnes sont en surpoids. Estimer la proportion de personnes en surpoids dans cette population.

Hommes Femmes

195 205

< 60 ans > 60 ans

313 87

Page 5: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Un exemple : Etude du surpoids

Formation nouveaux programmes de terminales

5

Dans la population étudiée, il y a 46% d’hommes et 18% de personnes de plus de 60 ans. Le sondage a été réalisé par un tirage au hasard de 400 personnes et peut être assimilé à un tirage avec remise. 

Pour une étude, mettant en jeu le lien avec certaines caractéristiques connues de la population on considère qu’un échantillon est représentatif, si la fréquence f observée de ces caractéristiques est dans l’intervalle de fluctuation au seuil de 95%.

Au travail !

Page 6: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Etude du surpoids : un scénario possible

Formation nouveaux programmes de terminales

6

Dans la population étudiée, il y a 46% d’hommes et 18% de personnes de plus de 60 ans. 

le sondage a été réalisé par un tirage au hasard de 400 personnes et peut être assimilé à un tirage avec remise.

 1. Réaliser un échantillon. par simulation, Cet échantillon est-il représentatif  en ce qui concerne la

répartition des hommes ?

Pour une étude, mettant en jeu le lien avec certaines caractéristiques connues de la population on considère qu’un échantillon est représentatif, si la fréquence f observée de ces caractéristiques est dans l’intervalle de fluctuation au seuil de confiance de 95%.

Page 7: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Etude du surpoids : réinvestir

formation nouveaux programmes de terminales

7

2. Dans l’échantillon prélevé pour cette étude on observe :

   Cet échantillon est-il représentatif ? Pour les hommes : p =0,46 (outil de seconde)Pour un seuil de 95%, on a obtenu IFH =[0,41 ;0,51]

f =195/400 = 0,4875 donc f IFH

donc cet échantillon est représentatif pour les hommesPour les plus de 60 ans : p=0,18 (outil première)

cette méthode ne s’applique pas, il faut 0,2<p<0,8On établit IFV avec la fonction de répartition de la loi binomiale B(400;0,18) , à l’aide d’une calculatrice ou d’un tableur : IFv=[57/400;87/400]donc cet un échantillon est représentatif pour les plus de 60 ans.

Hommes Femmes

195 205< 60 ans > 60 ans

313 87

Page 8: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Etude du surpoids : outil de 2de

formation nouveaux programmes de terminales

8

3. L’étude montre que dans cet échantillon 29% des personnes sont en surpoids. Estimer la proportion de personnes en surpoids dans cette population.

L’intervalle de confiance de la classe de seconde donne

[0,29- 0,05 ; 0,29+0,05]

Donc la proportion de personnes en surpoids est dans l’intervalle [0,24 ; 0,33] au niveau de confiance de 95%.On dit aussi pour un seuil de risque de 5%.

Page 9: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Un exemple : Etude du surpoids

formation nouveaux programmes de terminales

9

4. On veut réaliser une étude plus précise en réalisant un échantillon de taille 1200. Dans l’échantillon prélevé pour cette étude on observe :

   Cet échantillon est-il représentatif ?Le calcul n’est ici plus possible avec une

calculatrice, cela dépasse ses capacités de calcul.

L’étude montre que dans cet échantillon 32% des personnes sont en surpoids. Estimer la proportion de personnes en surpoids dans cette population.

Page 10: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Observation des binomiales pour n grand

En utilisant Geogebra et l’outil de calcul des probabilités, on peut explorer le comportement des grandes binomiales

Des formes similaires dites « forme en cloche »10 formation nouveaux programmes de terminales

Page 11: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

TP centrer- réduire : le foie gras

formation nouveaux programmes de terminales

11

Les foies gras d'oie commercialisés en 2012 par un producteur du Sud Ouest ont une masse dont la moyenne est 750 grammes et dont l'écart type est 100 grammes. Le pesage, en grammes, d'un foie pris au hasard dans la production détermine une V.A. G telle que E(G)=750 et (G)=100. L'année précédente, en 2011, les foies gras commercialisés par ce même producteur avaient un poids moyen de 680 g et un écart type de 120g. Un client fidèle a acheté un foie de 750 g en 2011 et un de 800 g en 2012. Quel classement peut-on faire de ces deux foies

comparativement à la production annuelle dont ils sont issus ?

Page 12: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

LOI NORMALE et BINOMIALE

Formation nouveaux programmes de Terminales S et ES

Page 13: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

L’idée centrale

Formation nouveaux programmes de terminales

13

Une première idée simplifiée du théorème : Lorsqu’on observe les représentations

graphiques des grandes binomiales, elles présentent une forme commune dite « forme en cloche », connue sous le nom de courbe de Gauss, et qui correspond à la fonction de densité de la loi normale.

On a donc l’idée intuitive qu’on peut approcher les lois binomiales par les normales, pour n grand.

La formalisation de ce constat est énoncée par le « théorème de Moivre-Laplace », ce qui va nécessiter quelques détours…

Page 14: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Le théorème de Moivre-Laplace

14

Premières remarques : On reconnait à droite P(a < Z < b) où Z suit la loi

normale N(0;1). Ce n’est pas sur Xn que porte la convergence vers la

loi normale, mais sur la « variable centrée réduite » Zn.

On s’intéresse à des probabilités d’intervalles.

formation nouveaux programmes de terminales

Page 15: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Le théorème de Moivre-Laplace

15

Autre remarque Ce théorème définit une convergence en loi :

Ce n’est pas Zn qui converge vers Z, mais la fonction de répartition de Zn qui converge vers la fonction de répartition de Z.

formation nouveaux programmes de terminales

Page 16: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

le théorème de Moivre-Laplace

Xn suit B(n;p)

On centre et on réduit

On obtient Zn

Z qui suit N(0 ; 1)

con

verg

e

Y qui suit N (np; npq)

n tend vers l’infi

ni

16 Formation nouveaux programmes de terminales

con

verg

e

Dépend de n

Page 17: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Premier problème : le passage du discret au continu

formation nouveaux programmes de terminales

17

Premier problème :

On va donc plonger la loi binomiale dans le monde des aires

la loi binomiale est une loi discrète P(X=a)Diagramme en bâtons

la loi normale est une loi continue P(a<X<b)Aire sous une courbe

Page 18: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Passage du discret au continu On considère une variable aléatoire Xn qui suit

la loi discrète B(n;p)

18 Formation nouveaux programmes de Terminales

E(Xn) = np = µ

V(Xn) = np(1-p) = σ²

Page 19: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Problème du passage du discret au continu

La loi binomiale, loi discrète, se représente par un diagramme en bâtons, qu’il faut convertir en histogramme pour que les probabilités puissent être interprétées en termes d’aires.

Le bâton représentant p(X=k) = pk doit devenir une colonne d’aire pk.

On l’obtient en traçant une colonne de largeur 1 centrée sur k : [k - 0,5 ; k + 0,5] de hauteur pk.

19 formation nouveaux programmes de terminales

Page 20: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Passage du discret au continu On considère une variable aléatoire Xn qui suit

la loi discrète B(n;p)

E(Xn) = µ et V(Xn) = σ²

20 Formation nouveaux programmes de terminales

Page 21: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Passage du discret au continu On considère une variable aléatoire Xn qui suit

la loi discrète B(n;p)

Et on a :

P(a Xn b) = somme des aires des rectangles

21 Formation nouveaux programmes de terminales

Page 22: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Comment centrer

X est une variable aléatoire centrée signifie que E(X) = 0

La variable Yn = Xn – µ est centrée

22 Formation nouveaux programmes de terminales

Attention :Yn ne suit pas une loi binomiale :Cette variable aléatoire prend des valeurs négatives !

Page 23: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Comment centrer

La variable Yn = Xn – µ est centrée

E(X+b) = E(X)+ b donc

E(Yn) = 023 Formation nouveaux programmes de terminales

V(aX+b) = a²V(X) donc

V(Yn) = ²

Page 24: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Comment réduire

24 formation nouveaux programmes de terminales

E(Zn) = 0

Sa variance est égale à 1 :

La variable aléatoire Zn = Yn/ est centrée

V(aX+b) = a²V(X)

Page 25: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Comment réduire

On a pris la variable aléatoire

Zn = Yn /

25 formation nouveaux programmes de terminales

On raisonne sur des aires, on veut conserver des rectangles d’aire pk ; donc si on réduit les abscisses en les divisant par , on doit compenser en multipliant les ordonnées par .On conserve une aire totale de 1.

Page 26: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Bilan sur Zn, variable centrée réduite

)p(np

npXZ n

n

1

26 formation nouveaux programmes de terminales

E(Zn) = 0 V(Zn) = 1

Page 27: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Loi normale centrée réduite

formation nouveaux programmes de terminales

27

Les histogrammes représentant Zn ont tous exactement la même allure

La courbe qui approxime cette allure c’est la courbe de Gauss représentant la fonction f définie par :

f(x) =

C’est la fonction de densité de la loi normale N(0;1)

nouvelle fonction de référence à étudier

2

2

1²x

e

Page 28: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Lien entre binomiale et normale

Le théorème qui formalise ce constat est le théorème de Moivre-Laplace (TML).

Xn suit B(n;p)

On centre et on réduit

On obtient Zn

Z qui suit N(0 ; 1)

con

verg

e

Y qui suit N (np; npq)

Ap

pro

xi

m° TML

28 Formation nouveaux programmes de terminales

Page 29: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

FLUCTUATION ET CONFIANCE

Formation nouveaux programmes de Terminales S et ES

Page 30: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Second théorème du programme

Si Z suit N(0 ; 1) alors pour tout réel α [0 ; 1],

il existe un réel u tel que P(-u<Z< u ) =1-

30 formation nouveaux programmes de terminales

f(x) = 2

2

1²x

e

Page 31: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Second théorème du programme

31 formation nouveaux programmes de terminales

On cherche un intervalle I=[-u ; u]

tel que P(Z I)=1-

où Z suit N(0 ;1)

I est un intervalle de fluctuation au seuil de 1-α pour une V.A. qui suit la loi normale standard N(0 ; 1) .

Page 32: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Application à l’intervalle de fluctuation pour

une v.a. qui suit B(n,p)

un réel donné et u le réel tel que P(-u<Z< u ) =1- où Z suit N(0 ; 1) Si Xn suit B(n ; p) et Fn = Xn/n

et In l’intervalle :

d’après le théorème de Moivre-Laplace, on aura :

Donc pour n « assez grand » on a : P(Fn In) ≃ 1 -

In est un intervalle de fluctuation dit asymptotique au seuil 1-,

1)IF(P nnnlim

32 Formation nouveaux programmes de terminales

n

)p(pup;

n

)p(pupIn

11

Page 33: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Intervalle de fluctuation pour la loi normale N(0 ; 1)au seuil de 95%

P(F[-u0,05 ; u0,05]) = 0,9533

u0,05

P(F[-1,96 ; 1,96])≃>0,95formation nouveaux programmes de

terminales

α = 0,05 Uα ≃ 1,96

Page 34: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Intervalle de fluctuation pour une v.a. qui suit B(n ; p)au seuil de 95%

34

u0,05u0,05 ≃ 1,96 on en déduit au seuil de 95%

formation nouveaux programmes de terminales

α = 0,05 uα ≃ 1,96

Page 35: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Intervalle de fluctuation pour une v.a. qui suit B(n ; p) au seuil de 95%

35 Formation nouveaux programmes de terminales

0 200 400 600 800 1000 1200 1400 1600 1800 20000

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

Page 36: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

trois intervalles de fluctuation au seuil de 95%

2nde •IF =

1ère• IF = • Sa détermination nécessite un

tableur ou un algorithme

Term. •IF = 38

form

atio

n n

ouveaux p

rog

ram

mes

de te

rmin

ale

s

formule

formule

Pas de formule

np;

np

11

n

b;

n

a

n

)p(p,p;

n

)p(p,p

1961

1961

Page 37: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

trois intervalles de fluctuation au seuil de 95%

2nde

• Pas de base théorique : simulations

• approximation de l’IF de terminale contraintes : n 25 et 0,2<p<0,8

1ère

• Base théorique : loi binomiale

• sans contraintes sur n et p

Term.

• Base théorique : TML• Intervalle asymptotique• contraintes : n 30 et

np5 et n(1-p)5

39

form

atio

n n

ouveaux p

rog

ram

mes

de te

rmin

ale

s

Environ 95%

Environ 95%

Au moins 95%

Page 38: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Un exemple : Etude du surpoids

formation nouveaux programmes de terminales

40

4. On veut réaliser une étude plus précise en réalisant un échantillon de taille 1200. Dans l’échantillon prélevé pour cette étude on observe :

   Cet échantillon est-il représentatif ?

L’étude montre que dans cet échantillon 32% des personnes sont en surpoids. Estimer la proportion de personnes en surpoids dans cette population.

Page 39: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Un exemple : Etude du surpoids

formation nouveaux programmes de terminales

41

4. On veut réaliser une étude plus précise en réalisant un échantillon de taille 1200. Dans l’échantillon prélevé pour cette étude on observe :

 Intervalle de fluctuation asymptotique au niveau de confiance

de 0,95 on a p=0,46 et n =1200 donc np >5IFH = [0,46-1,96x0,014; 0,46-1,96x0,014] =[0,43;0,49]Or fH ≃ 0,46 et fH IFH donc l’échantillon est représentatif.De même IFV =[0,158;0,202] et fV ≃ 0,207 et fH IFH donc

l’échantillon n’est pas représentatif.

L’étude montre que dans cet échantillon 32% des personnes sont en surpoids. Estimer la proportion de personnes en surpoids dans cette population. [0,32-1/rac(1200) ; 0,32 +1/rac(1200)]≃[0,29 ; 0,35]Donc au niveau de confiance de 0,95 p [0,29 ; 0,35]

1200

Page 40: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Bilan : Intervalle de confiance

Formation nouveaux programmes de Terminales

42

f la fréquence observée sur un échantillon de taille n.

Si n 30, nf 5 et n(1-f) 5

Un intervalle de confiance IC au niveau de

confiance de 95% est .

et on a P( pIC) ≃ 0,95.Pour n et f déterminés, on parlera d’une

fourchette de sondage.

nf;

nf

11

Page 41: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Détermination de l’intervalle de confiancepar lecture des abaques

formation nouveaux programmes de terminales

44

n=100

Fréquence observée fn

Intervalle de confiance

Page 42: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

A quoi servent les sondages

Formation nouveaux programmes de Terminales

45

Extraction d ’unéchantillon

Étude surl ’échantillon

Extrapolationà la population

xxx xx

xxx

x

xx

xxx

x

x xxxxx x

x

xxxx

xxx x

xx

x

xx x

xxx

xxxx

x

xx

x

x

xxxx

xx

x

x

xxx

x

xxxxx x

x

xx

xx

x

x

x x

x x

x xx

x

x

x

x

x

x x

x

x x

x

P

xx xx xx xxxxxxxx

x

x

x

xx

E

xx xx xx xxxxxxxx

x

x

x

xx

E

Page 43: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

l’ECHANTILLONNAGE

formation nouveaux programmes de terminales

46

Population

Éch

an

tillo

nÉchantillonnage

Proportion p

Fréquence f

Je connais p, j’en déduis f

Statistiques inférentielles Je connais f, j’en déduis p

au lycée

Page 44: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

APPLICATIONS DE L’ECHANTILLLONNAGE

Théorie des tests, quand on dispose d’une hypothèse sur p

Théorie de l'estimation, quand on ne connait pas p.

fréquence f sur un

échantillon de taille n

Intervalle de confiance

Estimation de p

Intervalle de fluctuation

Rejet ou non de

l’hypothèse sur p

fréquence f sur un

échantillon de taille n

47

Formation nouveaux programmes de terminales

Page 45: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Prise de décision : un exemple

Formation nouveaux programmes de Terminales

48

Dans la réserve indienne d’Aamjiwnaag, située au Canada à proximité d’industries chimiques, il est né entre 1999 et 2003, 132 enfants dont 46 garçons.

Ces observations sont-elles le fruit du hasard ?

Règle de décision : Si f IF c’est le fruit du hasard, sinon ce n’est pas le fruit du hasard. On a f = 46/132 ≃ 0,35 et IFasyptotique =[0,42 ; 0,60]Donc ce n’est pas le fruit du hasardHypothèse

vraieHypothèse fausse

J’accepte l’hypothèse

1 - βJe rejette l’hypothèse

α 1-β

Page 46: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Conclusion : pourquoi les statistiques?

formation nouveaux programmes de terminales

49

Le statisticien est une personne qui préfère les vrais doutes aux fausses certitudes.

Je sais que je me trompe, mais je peux quantifier

mon erreur.

Page 47: AUTOUR DE LA LOI NORMALE Formation nouveaux programmes de Terminales S et ES

Quels types d’exercices en terminale

La situation est modélisée par une loi normale On connait μ et σ, on calcule une probabilité On connait μ, σ et p, on détermine x tel que P(X<x)

= p On connait x et p, on détermine μ et σLa situation est modélisée par une loi binomiale On connait μ et p, on cherche la précision ε telle

queP(X[μ- ε ; μ + ε]) = p en approximant par une loi normale

Avec une loi normale ou binomiale Prise de décision avec IF asymptotique Estimation de p avec IC seconde Détermination de la précision d’une estimation.

50 Formation nouveaux programmes de Terminales