36
initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Embed Size (px)

Citation preview

Page 1: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Deuxième partie : initiation au traitement quantitatif des

données ; éléments de statistiques descriptives

Introduction à la statistique

Page 2: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Tableau individu/variable

Caractère 1

sexe

Caractère 2

âge

Caractère 3

profession

… Caractère X

Individu 1

Individu 2

Individu n

Page 3: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

I La statistique à une dimension : principaux types

de variables et leur représentation

P : population X : la variable xi : symbole d’une modalité i de chaque variable x1, x2, …xp : ensemble des modalités pour i allant

de 1 à p. ni : nombre d’individus ayant répondu xi à la

variable X n1, n2,…np : effectifs correspondant aux

modalités N : total des effectifs fi : fréquence soit ni/N

Page 4: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Distribution statistique de la population selon une

variable

Modalités xi

effectifs

Fréquence fi %

x1 n1 f1 = n1/N f1 *100

x2 n2 f2 = n2/N f2 *100

… …

xp np fp = np/N fp *100

Total N 1 100

Page 5: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Exemple

Modalité xi Effectifs ni

Fréquence fi %

Homme ; x1

40 40/110 = 0,36

36 %

Femme ; x2 70 70/110 = 0,64

64 %

Total 110 1 100 %

Page 6: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Autres conventions de notation

N = n1+ n1+…+ n1=p

iin

1

14070110/1110

70

110

40

1/.../1......

1/1/

21

11

1

111

NNexemple

NNNNN

ou

NN

nn

nnnnff

nnf

p

p

p

p

ii

p

ii

p

ii

Page 7: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

I1 Les variables qualitatives

A/ Définition

B/ Les variables nominales

C/ Les variables ordinales

D/ La représentation des variables qualitatives

Page 8: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Origine sociale des étudiants de 1ère année de sociologie (1994-1995)

Modalités ni fi angle

indépendants

31 0,1 36°

Cadres et prof intellec sup

70 0,23 82,8°

Prof interm 76 0,24 86,4°

employés 26 0,08 28,8°

Ouvriers et inactifs

108 0,35 126°

Total 329 1 360°

Page 9: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

• les diagrammes circulaires

Angle = 100 fi * 360/100 = 360 * fi

répartition des étudiants de sociologie selon l'origine sociale (enquête 1994-95)

10%

23%

24%

8%

35%

indépendants

cadres et pro intellecsup

prof interm

employés

ouvriers et inactifs

Page 10: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

• Les tuyaux d’orgue

Page 11: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

I2 Les variables quantitatives

Les variables discrètes

modalités effectifs

fréquence Effectifs cumulés Fréquence cumulée

0 n0 F0=n0/N n0 N0/N

1 n1 F1=n1/N n0+n1 (n0+n1)/N

…. … … …

xi ni Fi=ni/N n0+n1+…+ni (n0+n1+…+ni)/N

…. … … …

xp np Fp=np/N n0+n1+…+np= N (n0+n1+…+np)/N=1

Total N 1

Page 12: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Exemple : nombre d’enfants par couple

modalités

effectifs fréquence Effectifs cumulés

Fréquence cumulée

0 8 0,27 8 0,27

1 10 0,33 18 0,60

2 5 0,17 23 0,77

3 0 0 23 0,77

4 4 0,13 27 0,90

5 3 0,1 30 1

Total 30 1

Page 13: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Représentations des variables discrètes : les diagrammes en bâton

Page 14: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Les variables continues

- Données brutes non groupées

- Données groupées en classes

Page 15: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Variables continues groupées en classes

classes ni fi Centre de classe Ci

[y0-y1] n1 n1/N C1=(y0+y1)/2

[y1-y2] n2 n2/N C2=(y1+y2)/2

[yi-1-yi] ni ni/N Ci=(yi-1+yi)/2

[yp-1-yp] np np/N Cp=(yp-1+yp)/2

N 1

Page 16: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Exemple : résultat d’un amphi à un examen (cas de l’amplitude constante)

classes ni fi Centre de

classe Ci

[0-5] 39 39/145 = 0,27 2,5

[5-10] 58 58/145 = 0,4 7,5

[10-15] 36 36/145 = 0,25 12,5

[15-20] 12 12/145 = 0,08 17,5

145 1

Page 17: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Histogramme (amplitude constante)

Page 18: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Exemple : répartition des effectifs en 3 tranches d’âge d’amplitude variable

ni fi amplitude Ci

[20;30[ 2000 0,36 10 25

[30;50[ 3000 0,54 20 40

[50;55[ 500 0,09 5 52,5

Total 5500 1

Hi = ni/amplitude

Page 19: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Histogramme (amplitude variable)

Page 20: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Histogramme des fréquences (amplitude variable)

Page 21: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Tableau récapitulatifTypes de variables Type de tableaux Représentation

qualitatives

nominales

Effectifset

Fréquences

Diagramme circulaire

Tuyaux d’orgueordinales

quantitatives

discrètes

Effect, fréq, effect et fréq cumulés

Diagrammes en bâtons

continues

Non groupées : xi et ni ordonnés

Fonction FRE

Groupées en classes : effect, fréq, centre, amplitude

Histogrammes et histogrammes normés (amplitude variable)

Page 22: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

II Les paramètres de position

II1 Le mode

Définition

Le mode M est la modalité de la variable qui correspond au plus grand effectif

Variables qualitatives

Page 23: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Modalités (xi) ni %

Indépendants 31 10 %

Cadres 70 23 %

Professions intermédiaires 76 24 %

Employés 26 8 %

Ouvriers et inactifs 108 35 %

total 329 100 %

Exemple : Origine sociale des étudiants de 1ère année de

sociologie (1994-1995)

Mode : ouvriers et inactifs

Page 24: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

• Les variables quantitatives discrètes

Modalités (xi) Effectif ni Fréquence fi

0 8 0,27

1 10 0,33

2 5 0,17

3 0 0

4 4 0,13

5 3 0,1

Total 30 1

Mode : 1 enfant

Page 25: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

• Les variables quantitatives continues (amplitude constante)

CM Li

21

1

M = mode

Li = borne inférieure de la classe modale

C = amplitude de la classe modale

∆1 = effectif classe modale – effectif classe précédente

∆2 = effectif classe modale – effectif classe suivante

Page 26: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Exemple : résultat d’un amphi à un examen (cas de l’amplitude constante)

Classes ni

[0;5[ 39

[5;10[ 58

[10;15[ 36

[15;20[ 12

145

M = 5 + (19/19+22)*5 = 7,32

Page 27: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

• Les variables quantitatives continues (amplitude variable)

ni amplitude

hi

[20;30[ 2000 10 200

[30;50[ 3000 20 150

[50;55[ 500 10 100

5500

Même formule avec∆1 = valeur hi de la classe modale – valeur hi de la classe précédente∆2 = valeur hi de la classe modale – valeur hi de la classe suivanteM = 20 + (200/200+50)*10 = 28 ans

Page 28: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

II2 La moyenne arithmétique

Les variables discrètes

NX

p

iii xn

1

Page 29: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Exemple : nombre d’enfants par couple

Modalités (xi)

Effectif ni

nixi

0 8 0

1 10 10

2 5 10

3 0 0

4 4 16

5 3 15

total 30 51

Moyenne = 51/30 = 1,70

Page 30: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

• Les variables continues

Non groupées Groupées en classes

NX

p

iix

1

NX

p

iiiCn

1

Page 31: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Exemple : résultat d’un amphi à un examen

Classes ni Ci niCi

[0;5[ 39 2,5 97,5

[5;10[ 58 7,5 435

[10;15[ 36 12,5 450

[15;20[ 12 17,5 210

145 1192,5

Moyenne = 1192,5/145 = 8,22

Page 32: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

II3 La médiane

La médiane est la valeur de la variable qui partage en 2 parties égales ou en 2 sous-ensemble égaux la population

La médiane est plus stable que la moyenne car elle n’est pas influencée par les valeurs extrêmes

Page 33: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

• Les variables discrètes

x¡ n¡ effectifs cumulés

0 10 10

1 30 40

2 40 80

3 10 90

4 5 95

5 4 99

6 1 100

100

Nombre d’enfants par couple exemple 1

Page 34: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

x¡ n¡ effectifs cumulés

0 5 5

1 25 30

2 20 50

3 15 65

4 15 80

5 12 92

6 8 100

100

Nombre d’enfants par couple exemple 2

Page 35: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

• Les variables continues groupées en classes

C

NLiMe

nnn

i

i

11

...2

AvecLi : borne inférieure de la classe médianeni : effectif de la classe médianeC : amplitude de la classe médianen1+…+ni-1 : effectifs cumulés des classes précédant la classe médiane

Page 36: Deuxième partie : initiation au traitement quantitatif des données ; éléments de statistiques descriptives Introduction à la statistique

Exemple : distribution de salaires

x¡ n¡ effectif cumulé

[0,2000[ 10 10

[2000,4000[ 30 40

[4000,6000[ 40 80

[6000,8000[ 10 90

[8000,10000[ 5 95

[10000,12000[ 4 99

≥ 12000 1 100

N=100

N/2 = 50 ===> intervalle médian correspond à l’effectif cumulé 80 soit [4000,6000[.L¡ = 4000

Me = 4000 + ((50-40)/40) 2000 = 4500 Frs