48
Enquêtes quantitatives Statistiques descriptives Clément Dussarps 26/09/12

Introduction aux statistiques descriptives et tests d'hypothèses

Embed Size (px)

Citation preview

Page 1: Introduction aux statistiques descriptives et tests d'hypothèses

Enquêtes quantitativesStatistiques descriptives

Clément Dussarps

26/09/12

Page 2: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 2

Statistiques, mais comment ?

Sans mathématiques !(ou presque)

Page 3: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 3

Pourquoi des statistiques ?

Expliquer des comportements (humains notamment)

Identifier des liens entre publics et comportements : comprendre un public

Faire des groupes (typologies) Comparer des publics Comparer des comportements à des instants

différents Valider ou non des hypothèses …

=> Des outils pour observer, analyser, expliquer, comprendre

?

Page 4: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 4

Exemples d’applications pratiques

Votre mémoire ! Observer des différences de comportements vis-

à-vis de marques (qui achète quoi, quand, combien…)

Analyser l’impact d’une campagne publicitaire (existe-t-il des différences significatives par rapport à avant la campagne ?)

Déterminer des profils pour mieux cibler une campagne de communication (qui va acheter quoi, etc.)

Suivre son public, le connaître …

Page 5: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 5

Objectifs du cours

A la fin de la séance, vous devez être capable de… Choisir, pour une enquête à réaliser, entre un

échantillonnage probabiliste et non probabiliste Déterminer les objectifs d’une enquête Concevoir un questionnaire Formuler des hypothèses Construire un questionnaire sur Sphinx Saisir des réponses sur Sphinx

Page 6: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 6

Plan du coursDate Etapes

26 septembreCours : bases de l’échantillonnage, construction questionnaire, présentation du sujet ministériel, proposer ensemble des objectifsSphinx : faire 5 questions & saisie de réponses (5 individus)

Intersession (1 semaine) Relire cours, finir exercicesFaire groupes, proposer des objectifs & hypothèses

03 octobreCours : bases du traitement des données, validation d’hypothèses (khi-2), analyse multivariée (AFC)Sphinx : traitements de données

Intersession (2 semaines) Relire cours, finir exercicesProposer questionnaire

17 octobre Se mettre d’accord sur un questionnaireTester questionnaire entre nous

Intersession (4 semaines) Administration du questionnaire (10 rép. / personnes)

14 novembre Accompagnement pour traitement, dossiers, etc.

Intersession (3 semaines) Dossiers à faire (rapport d’enquête par rapport à une question précise)

05 décembre Présentation orale des dossiers + bilan

Page 7: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 7

Evaluation

3 notes Note globale sur les exercices rendus coeff. 1 1 note présentation orale coeff. 1 1 note dossier écrit coeff. 2

Page 8: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps

L’échantillon

Page 9: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 9

Echantillonnage

Population de référence (ou mère) :Penser à bien la définir :

- « Etudiants en IUT Publicité 2ème année à Bordeaux »

- « Bûcherons Québecois de moins de 35 ans »

- « Femmes de 35 à 50 ans, qui ont au moins 1 enfant, et regardent TF1 au moins 1 fois par semaine»

- « Français en âge de voter (> 18 ans) »

?

Page 10: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 10

Echantillon et hasard

Un sac de billes (nombreuses !) Homogénéité (répartition ?)

Un sac de 10000 billes ?Tirer 100 billes Taux de sondage = 1%

Un sac de 1000 billes ?Tirer 100 billes aussi !10 seraient insuffisantesTaux de sondage = 10%

?

Page 11: Introduction aux statistiques descriptives et tests d'hypothèses

11

Echantillon et hasard

Ce que l’on veut :o Précision acceptableo Représentativité

Limites = budget, temps

Pour doubler la précision= échantillon x4

Clément Dussarps

Page 12: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 12

Sondage ou recensement ?

Recensement : faire l’appel dans une classe de 20 étudiants

Sondage = 1000 personnes sur 65 millions de personnes

Recensement = 65 millions de personnes ou x foyers

Différence d’objectifs Différence de coût Rapport coût/résultat

Page 13: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 13

Echantillonnage

Population de référence (ou mère) :

Page 14: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 14

Echantillonnage

Echantillon (généralité) = une partie de la population L’échantillon est

analysé.

A terme, il n’a de valeur que pour en tirer des conclusions sur la population totale.

Page 15: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 15

Echantillonnage

Echantillonnage aléatoireLa population de référence est connue et listée

On choisit x personnes sur la population, sans aucune pondération (tirage aléatoire, chacun a autant de chance qu’un autre d’être sélectionné)

Représentatif de la population (a priori), si elle est homogène.

Page 16: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 17

Echantillonnage

Echantillonnage stratifiéLa population de référence est connue et listée

On « stratifie » les groupes, on les répartis en sous-groupes, par ex par rapport : - au genre - à l’âge - à la CSP

Les sous-groupes ne sont pas toujours de tailles équivalentes.

Page 17: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 18

Echantillonnage

Echantillonnage en grappes (d’individus)La population de référence est connue et listée

Ici, les grappes sont « parfaites » (homogènes, même taille)

Ex : choisir 10 immeubles et frapper à toutes les portes.Les grappes sont-elles homogènes ?

Les individus d'une même grappe vérifient au moins une même caractéristique (âge, CSP…).

Page 18: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 20

Echantillonnage

Echantillonnage : quotasOn a certains éléments de la population de référence. Ex : 500 femmes, 500 hommes, 250 individus < 25 ans, etc.

On respecte les proportions de la population selon certains choix (ex : respect du genre, de l’âge, de la CSP…). Ex : en utilisant une base INSEE

Il faut bien préparer les groupes et classes de population (ex pour l’âge).

Page 19: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 21

Echantillonnage

Echantillonnage : de jugementSélection de personnes (ou types de personnes) jugées pertinentes pour l’étude.

Page 20: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 22

Echantillonnage

Echantillonnage : de convenance, volontaireOn connaît mal la population de référence.

Envoi d’e-mails à toute une population, abonnés d’un journal, sondage dans la rue sans méthode, etc.

Risque : tomber sur des très contents ou très mécontents (les « énervés » et les « youpiya »)=> Qui sont les non répondants ?

Page 21: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 23

Echantillonnage

Non probabiliste Quotas Jugement Convenance

o Choix raisonné (déductif) pour les quotas/panels

o Population un peu connue, mais sans liste complète

Probabiliste Aléatoire Stratifié En grappes

o Hasardo Population connue

(liste)

Page 22: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 24

Echantillonnage

Quelle méthode choisir ?o Probabiliste :

• la population est parfaitement connue (liste des différents individus). Pour l’aléatoire simple, seule la liste suffit (pas les caractéristiques)

• Rarement applicable du fait de cette condition• Peut être coûteux, personnes difficiles à avoir

o Non probabiliste (empirique) :• La liste exhaustive de la population n’est pas connue• On a une idée de certaines caractéristiques de la

population (ex : il y a 50% de femmes, 50% d’hommes).• Peut s’avérer fiable, notamment avec la méthode des

quotas

Page 23: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 25

Echantillonnage

Quelle méthode choisir parmi les non probabilistes :o Méthode des quotas

• Quand on n’a pas de base précise listant les individus (mais quelques chiffres sur la population totale)

• Bon rapport qualité / prixo Convenance

• Quand on n’a pas le choix : ni base précise, ni moyen d’appliquer les quotas

• Solution de facilité• Représentativité rarement fiable• Echantillon éventuellement redressable

o Panel / cohortes• Etude longitudinale (sur le temps) auprès d’un public précis

(ex : consommateurs d’un produit)

?

Page 24: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 26

Echantillonnage

Combien de personnes questionner ?o Tout dépend du budget, du temps, de la qualité

souhaitée (précision)…o Pour être précis, le nombre de personnes dans

l’échantillon n’est pas nécessairement proportionnel au nombre de personnes dans la population (ex : interroger 400 personnes VS interroger 800 personnes ne veut pas dire = précision x 2)

o Peut être arbitraire (ex : on interroge 1 personne sur 10 = 10%)

o Il est possible de redresser l’échantillon après enquête pour le faire correspondre aux quotas fixés

o Il existe aussi un calcul…

Page 25: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 27

Echantillonnage

Calculer la taille d’un échantillon

DES MATHEMATIQUES !!!

Des défibrillateurs sont disponibles pour les arrêts

cardiaques éventuels

Page 26: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 28

Echantillonnage

Calculer la taille d’un échantillon (quotas)

t = niveau de confiance à 95% = 1,96m = marge d’erreur à 5% = 0,05p = proportion de la variable étudiée dans la population (ex : 20% = 0,20) // si inconnue, prendre 50%

N =t² x p (1-p)

Page 27: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 29

Echantillonnage

Il existe aussi des calculs pour estimer l’intervalle de confiance…

Pour en savoir plus : Google est votre ami

Page 28: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 30

Echantillonnage

Enquête biaisée : échantillon non représentatif, à cause d’une erreur volontaire ou non sur l’échantillonnage.

Exemple : faire un sondage sur les consommateurs d’un magasin, en interrogeant les personnes passant par une sortie et pas une autre, un mercredi après-midi… (échantillon de convenance, administration mal gérée !)

Exemple 2 : choisir une population de personnes abonnées à L’Humanité pour étudier les intentions de vote de la population française)

?

Page 29: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps

L’enquête

Page 30: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 32

Un peu de vocabulaire…

Individu = « unité statistique élémentaire » (Martin, 2005)o Humainso Foyers (et parfois : foyers + individus)o Communeso Etc…

Variables : éléments étudiés (ex : l’âge) = questions posées

Modalités : réponses possibles (« modalités de réponse »)

Variable DonnéeAnnée de naissance 1990Commune de résidence BordeauxFréquence des soirées festives > 3 par semaine

Page 31: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 34

Types de questions

Fermées à choix unique

Fermées à choix multiples

Page 32: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 35

Types de questions

Fermées à choix multiples ordonnées

Fermées échelle :

Page 33: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 36

Types de questions

Types d’échelles :o « Très satisfait », « plutôt satisfait », « plutôt pas

satisfait », « insatisfait »o Numérique : 0, 1, 2, 3… Préciser le sens de l’échelle (ex :

0 = négatif, absence… ; 3 = très bien, très présent…)

Conseil (discutable) : choisir un nombre de valeurs pair. Cela évite les « valeurs refuge »Exemple : « TS », « PS », « Ni satisfait, ni insatisfait », « PPS », « IS »

Même si cela empêche la liberté de la neutralité…

Page 34: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 37

Types de questions

Ouverte numérique :

Ouverte texte (alphanumérique) :

Page 35: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps

Méthodologie

Page 36: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 39

Réalisation de l’étude

Définir l’objectif global de l’enquête Définir la population de référence Définir un échantillon :

o Type d’individus : personnes, foyers, communes…o Périmètre géographique : où a lieu l’enquête et

jusqu’où ?o Date : quand a lieu l’enquête ?o Si stratification/quotas : quelles données doivent servir

pour le tri (genre, âge, CSP…) ? Définir les données à recueillir=> Méthode projet : QQOQCP : qui, quoi, où, quand, comment, pourquoi ?

Page 37: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 40

Réalisation de l’étude

Pourquoi ? Objectifs de l’enquête Qui ? Public Quoi ? Quelle forme a l’étude (sondage,

recensement…), quelles questions poser Où ? Périmètre de l’enquête Quand ? Temporalité (judicieusement choisie) Comment ? Forme d’administration (passation)

Page 38: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 41

Réalisation de l’étude

Exemple : les fumeurs dans une promo de Pub 2A à l’IUT de Bordeaux 3…

Penser à être précis selon les objectifs fixés = objectifs ici ?

Exemple de questions : Etes-vous fumeur : oui ; non Si oui, à quelle fréquence fumez-vous : … Si oui, êtes-vous sensible aux messages sur les

paquets … + données de profil etc.

Page 39: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 42

Quelques conseils

S’adapter à son public (quel vocabulaire ?, etc.) Savoir quelles données seront essentielles avant de

lancer l’enquête : sinon il manquera des données ! Formuler des hypothèses avant L’ordre des questions a son importance. On préfère

souvent mettre le profil à la fin = + facile à répondre, plus court…

L’ordre au niveau micro a aussi son importance : éviter d’influencer une réponse au regard d’une question posée juste avant (ex : « mangez-vous des sandwich (fréquence) ? » puis « pensez-vous manger sainement ? » (échelle))

« Règle » des trois oui : oui, oui… et oui !

Page 40: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 43

Quelques conseils Une question ne concerne qu’un seul élément (pas de double

question) Eviter la négation dans une question Etre précis dans les réponses et exhaustif. Si nécessaire,

prévoir une réponse « Autre » à préciser en question ouverte Etre précis c’est aussi éviter la subjectivité. Une question du

type « êtes-vous en activité depuis longtemps ? » n’est pas claire : « depuis combien de temps êtes-vous en activité » = « - d’1 an, 1 an, 2 ans, 3 ans, > 3 ans »

Eviter de donner une réponse dans la question : « ce produit sain est-il bon pour vous ? »

On peut rendre les réponses obligatoires, mais attention à ne pas être trop contraignant

Page 41: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 44

Quelques conseils

Faire attention avec les représentations, il n’est pas toujours aisé de se projeter. Ex : « pensez-vous aller au supermarché entre 18h et 20h dans les 3 jours à venir ? »

Dans tous les cas : tester le questionnaire sur un petit nombre (5 – 10 personnes suffisent généralement pour détecter les grosses erreurs, il en faut parfois plus pour détecter les manques dans les questions = 30 est bien)

Ce test permet de détecter :o Erreurs sur la forme : manière dont sont posées les questions

ou les réponses, manque d’une modalité de réponse, etc.o Sur le fond : manque d’informations pour conclure. Ex : profil

peu ou mal analysé au regard des objectifs

Page 42: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps

Travail pratique

Page 43: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 46

Pratique

Présentation du sujet traité cette année« Soirées festives étudiantes et risques »

Objectifs ? Hypothèses ? Questions possibles ?

?

Page 44: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 47

Pratique

Prise en main Sphinx, faire 5 questions et saisir 5 réponses

Questions :o 1 fermée à choix unique (ex : genre = homme / femme)o 1 fermée à choix multiples, ordonnés (ex : quels sont vos

styles musicaux préférés parmi : Rock, Métal, Dance, Rap, Classique…)

o 1 fermée échelle (ex : fréquence d’écoute de musique)o 1 ouverte numérique (ex : âge)o 1 ouverte texte (quel est votre groupe de rock favori ?)

Choisir un ordre logique à ces questions Rajouter une condition (ex : ne poser la question

ouverte texte que si la personne a coché « rock »)

Page 45: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 48

Pour la prochaine fois… http://www.clementdussarps.fr/C1/ Finir les exercices pour samedi 29/09/12 à 12h00 (envoyer

à [email protected]) Relire le cours – m’envoyer questions par e-mail (réponse la

fois prochaine à tous)

Faire des groupes de 3 personnes maximum Proposer 3 à 5 problèmes à traiter sur le sujet de l’enquête

o « Soirées festives chez les étudiants  et risques »o Penser à ce que vous voulez cibler : la manière dont les gens

perçoivent cela, ou dont ils vivent cela, etc.o Déterminer un échantillon possible

Proposer des hypothèses de réponse aux problèmes posés

Page 46: Introduction aux statistiques descriptives et tests d'hypothèses

49

Deux bons livres accessibles

De bonnes bases sans mathématiques :

De bons savoir-faire, regard intéressant sur les stats :

Page 47: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps 50

Biblio/webographie Olivier Martin, « L’enquête et ses méthodes ; l’analyse de données quantitatives »,

2005, Armand Colin. Bernard Py, « La statistique sans formule mathématique », 2010, Pearson. Nombreux cours ici (Jean-Marc Fontan, Québec) : http://

www.omd.uqam.ca/membres/pages-perso/Jean-Marc/cours/SOC1101/ - voir les cours 3, 4, 5, Echantillonnage : http://

www.needocs.com/document/management-divers-divers-cours-d-echantillonnage,6127

http://www.astro.ulg.ac.be/cours/magain/stat/ Cours complet : http://

www.dunod.com/document/9782100521371/52137_AnnexesWeb_s.pdf

Manipulation des sondages : http://www.apprendre-a-manipuler.com/medias/les-5-techniques-les-plus-utilisees-pour-manipuler-les-sondages-dopinion-auquels-vous-repondez.html

Intéressant pour comprendre comment on peut « faire mentir » des chiffres

Page 48: Introduction aux statistiques descriptives et tests d'hypothèses

Clément Dussarps

Merci de votre attention