4
Master MARKETING / Pierre Desm et 1 QUITTER MENU PRINCIPAL > < Test de Kolmogorov-Smirnov (K & S ) Comparaison de deux distributions pour une variable ordinale Test non paramétrique : on ne teste pas un paramètre (moyenne, écart-type,…) Soit O m et T m les effectifs cumulés observés et théoriques et n la taille de l’échantillon (n>35) H0 : Les fréquences observées sont identiques aux fréquences théoriques Statistique : D = Max (O m -T m ) pour les m modalités Si n>35 et risque d’erreur accepté () de 1 % : Dc= 1,63 / Racine(n) Si n>35 et risque d’erreur accepté () de 5 % : Dc= 1,36 / Racine(n) Interprétation : On rejette H0 si D > Dc

QUITTER MENU PRINCIPAL > > < < Master MARKETING / Pierre Desmet 1 Test de Kolmogorov-Smirnov (K & S ) Comparaison de deux distributions pour une variable

Embed Size (px)

Citation preview

Page 1: QUITTER MENU PRINCIPAL > > < < Master MARKETING / Pierre Desmet 1 Test de Kolmogorov-Smirnov (K & S ) Comparaison de deux distributions pour une variable

Master MARKETING / Pierre Desmet 1 QUITTERQUITTERMENU PRINCIPALMENU PRINCIPAL>><<

Test de Kolmogorov-Smirnov (K & S )

Comparaison de deux distributions pour une variable ordinale

Test non paramétrique : on ne teste pas un paramètre (moyenne, écart-type,…)

Soit Om et Tm les effectifs cumulés observés et théoriques et n la taille de l’échantillon (n>35)

H0 : Les fréquences observées sont identiques aux fréquences théoriques

Statistique : D = Max (Om-Tm) pour les m modalités

Si n>35 et risque d’erreur accepté () de 1 % : Dc= 1,63 / Racine(n)

Si n>35 et risque d’erreur accepté () de 5 % : Dc= 1,36 / Racine(n)

Interprétation : On rejette H0 si D > Dc

Page 2: QUITTER MENU PRINCIPAL > > < < Master MARKETING / Pierre Desmet 1 Test de Kolmogorov-Smirnov (K & S ) Comparaison de deux distributions pour une variable

Master MARKETING / Pierre Desmet 2 QUITTERQUITTERMENU PRINCIPALMENU PRINCIPAL>><<

Exemple K&S

Catégorisation de la variable continue (perte d’information)

Test de K-S NON pas de différence

dans la distribution (D < Dc)

Page 3: QUITTER MENU PRINCIPAL > > < < Master MARKETING / Pierre Desmet 1 Test de Kolmogorov-Smirnov (K & S ) Comparaison de deux distributions pour une variable

Master MARKETING / Pierre Desmet 3 QUITTERQUITTERMENU PRINCIPALMENU PRINCIPAL>><<

ExempleAnalyse/ tests non paramétriques/ 2 échantillons indépendants

La distribution de « money » (en classes) est-elle la même selon que la personne a acheté le livre « Florence » ?

Z= 1,467 (faible) risque = 0,027 (<5%) Conclusion : on doit rejeter l’hypothèse H0

(les distributions ne sont pas les mêmes) Ceux qui ont acheté « Florence »

dépensent plus

Testa

,172

,172

,000

1,467

,027

Absolue

Positive

Négative

Différences les plusextrêmes

Z de Kolmogorov-Smirnov

Signification asymptotique (bilatérale)

NTILES ofMONEY

Critère de regroupement : FLORENCEa.

Tableau croisé FLORENCE * NTILES of MONEY

148 150 150 142 137 727

20,4% 20,6% 20,6% 19,5% 18,8% 100,0%

14 11 11 24 21 81

17,3% 13,6% 13,6% 29,6% 25,9% 100,0%

162 161 161 166 158 808

20,0% 19,9% 19,9% 20,5% 19,6% 100,0%

Effectif

% dans FLORENCE

Effectif

% dans FLORENCE

Effectif

% dans FLORENCE

0

1

FLORENCE

Total

1 2 3 4 5

NTILES of MONEY

Total

Page 4: QUITTER MENU PRINCIPAL > > < < Master MARKETING / Pierre Desmet 1 Test de Kolmogorov-Smirnov (K & S ) Comparaison de deux distributions pour une variable

Master MARKETING / Pierre Desmet 4 QUITTERQUITTERMENU PRINCIPALMENU PRINCIPAL>><<

Exemple Analyse/ tests non paramétriques/ K-S pour 1 échantillon

La distribution de Money est-elle Normale ? Choix de la distribution de référence : Normale-gaussienne,

(mais aussi sur option uniforme, poisson, exponentielle) Z= 1,331 (faible) risque = 0,058 (>5%)

on peut accepter l’hypothèse H0 la distribution empirique suit la distribution théorique

Test de Kolmogorov-Smirnov à un échantillon

996

208,28

102,119

,042

,042

-,029

1,331

,058

N

Moyenne

Ecart-type

Paramètres normauxa,b

Absolue

Positive

Négative

Différences les plusextrêmes

Z de Kolmogorov-Smirnov

Signification asymptotique (bilatérale)

MONEY

La distribution à tester est gaussienne.a.

Calculée à partir des données.b.