52
Chapitre 3 - L'enquête descriptive simple Version 1.2 Septembre 2010 AUTEURS PRINCIPAUX : NELLY AGRINIER - CÉDRIC BAUMANN - ISABELLE FOURNEL CO-AUTEURS : FRANCIS GUILLEMIN - GUY HÉDELIN

Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

Embed Size (px)

Citation preview

Page 1: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

Chapitre 3 -L'enquête

descriptive simple

Version 1.2

Septembre 2010

AUTEURS PRINCIPAUX : NELLY AGRINIER - CÉDRIC BAUMANN

- ISABELLE FOURNEL CO-AUTEURS : FRANCIS GUILLEMIN - GUY HÉDELIN

Page 2: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004
Page 3: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

Table des matières

Objectifs 5

I - Les principes des méthodes de sondage 7

A. Comment réaliser un sondage ?..........................................................7 1. Sondage aléatoire................................................................................8 2. Autres méthodes de sondage...............................................................11 3. Méthode des quotas (parfois appelée sondage pseudo-aléatoire)..............11 4. QCM sur les différents types de sondage...............................................11

B. En pratique.....................................................................................13 1. Effectif de personnes requis pour un échantillon.....................................13 2. Comment tirer au sort........................................................................13 3. Exploitation des résultats fournis par le sondage....................................14

C. Interprétation des résultats..............................................................17 1. Taux de participation et non réponses..................................................17 2. Interprétation des résultats.................................................................18

II - La rédaction du protocole d'une investigation en santépublique 19

A. Les différentes parties du protocole d'une investigation en santé publique..........................................................................................................19

1. La page de titre.................................................................................19 2. Le plan du protocole, la liste des abréviations........................................20 3. Le résumé du protocole......................................................................20 4. La justification de l'étude....................................................................20 5. L‘hypothèse et l'objectif de l'étude.......................................................21 6. Le schéma général de l'étude/ Plan expérimental...................................21 7. La population et échantillon.................................................................21 8. L'investigation, les explorations étudiées...............................................22 9. La description des données collectées et des méthodes de mesure...........23 10. L'analyse statistique, l'analyse de contenu...........................................23 11. Le déroulement de l'étude, les aspects logistiques................................23 12. Les aspects médico-légaux (éthiques et réglementaires).......................25 13. Les références bibliographiques.........................................................25 14. Les annexes....................................................................................26

III - Le calcul du nombre de sujets nécessaire dans une étudeépidémiologique descriptive transversale 27

A. Justification de l'échantillonnage.......................................................28

B. Précision de la mesure.....................................................................28 1. Fluctuations d'échantillonnage.............................................................28 2. Intervalle de fluctuation......................................................................29 3. Intervalle de confiance.......................................................................31

Reproduction et diffusion interdite sans accord des auteurs.3

Page 4: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

C. Éléments du calcul du nombre de sujets nécessaire.............................34 1. Facteurs liés à la taille de l'échantillon..................................................34 2. Formules pour calculer la taille d'un échantillon aléatoire simple...............34

D. Considérations pratiques..................................................................35

E. Conclusion......................................................................................36

IV - Les méthodes et techniques de base du recueil dedonnées dans une enquête épidémiologique 37

A. Introduction....................................................................................37

B. Le recueil des informations...............................................................37 1. Objectifs et contraintes.......................................................................37 2. Exercice avec corrigé - Le recueil des informations.................................38 3. Critères de qualité propres à la mesure.................................................38 4. Type de données...............................................................................39

C. Le bordereau de recueil....................................................................39 1. Construction d'un bordereau...............................................................39 2. Organisation et présentation du bordereau (mode de passation)..............44 3. Modes de passation............................................................................45 4. Quelques remarques sur la forme........................................................46 5. Qualité du recueil de l'information........................................................47 6. Test (ou pré-test) et validation............................................................48 7. Conclusion........................................................................................48

Solution des exercices de TD 49

Solution des Quiz 51

Reproduction et diffusion interdite sans accord des auteurs.4

Page 5: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

Objectifs

Objectif général :

� Être capable de concevoir et d'interpréter de façon critique une enquête descriptivesimple

Objectifs spécifiques :

� Connaître les principes des méthodes de sondage et savoir estimer la précision d'unsondage simple / Savoir discuter la représentativité d'un échantillon

� Savoir rédiger le protocole d'une investigation en santé publique

� Savoir calculer un nombre de sujets nécessaire dans une étude épidémiologiquedescriptive

� Utiliser les méthodes et techniques de base du recueil de données

Reproduction et diffusion interdite sans accord des auteurs.5

Page 6: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004
Page 7: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

I - Les principes desméthodes desondage

I

Comment réaliser un sondage ? 7

En pratique... 13

Interprétation des résultats 18

Lorsqu'on souhaite mesurer la fréquence d'un phénomène observé dans unepopulation (prévalence voir cours sur les indicateurs chapitre 1), il n'est le plussouvent pas possible de mesurer ce phénomène sur l'ensemble des individusconstituant cette population (population = ensemble d'unités statistiques ayant uncaractère commun et sur lesquelles une caractéristique peut être mesurée). Enpratique, lorsqu'on souhaite mesurer la prévalence d'une pathologie ou d'unphénomène, on travaillera sur un sous ensemble de la population = échantillon, etc'est sur cet échantillon qu'on mesurera le phénomène qui nous intéresse. Ceprocédé est appelé sondage. La population étudiée, de laquelle on extraitl'échantillon est appelée population source, et la population à laquelle on souhaitegénéraliser les résultats est la population cible.L'objectif du sondage est donc de pouvoir estimer le phénomène mesuré au niveaude l'ensemble de la population cible à partir des données qui auront été recueilliessur l'échantillon (inférence). Le choix de cet échantillon est donc fondamental, etpour pouvoir interpréter correctement le résultat, cet échantillon doit êtrereprésentatif de la population cible (ie tous les individus de la population dont ilest issu ont la même probabilité non nulle de faire partie de l'échantillon) (voircours sur les biais chapitre 5). La qualité d'une estimation repose sur sa précision (voir cours sur précision d'unemesure chapitre 2) et sur l'absence de biais (voir cours sur les biais chapitre 5).

A. Comment réaliser un sondage ?

Il est nécessaire de définir au préalable la population à laquelle on s'intéresse. Il peut s'agir d'unités individuelles (ex : individus) ou d'unités collectives (ex :hôpitaux). Comme il n'est pas possible le plus souvent d'étudier l'ensemble de cettepopulation cible, on va choisir une population source. Ce chapitre abordera lesdifférents moyens de constituer un échantillon à partir de cette population source.

Reproduction et diffusion interdite sans accord des auteurs.7

Page 8: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

1. Sondage aléatoire

Le sondage aléatoire est la seule méthode permettant d'échapper complètement auchoix humain, et de limiter les biais de sélection (Voir cours sur les biais chapitre5). Il s'agit donc de la méthode à privilégier. Il repose sur le tirage au sort. On tire au sort les unités statistiques parmi l'ensemble de la population. Pour cela,il faut disposer d'une liste où sont répertoriés tous les individus de la population :c'est la base de sondage. La base de sondage correspond à la liste de l'ensembledes individus (ou d'unités collectives) appartenant au champ de l'enquête. Elle doitêtre à jour, exhaustive, sans doublon, et doit permettre de contacter les individus. On peut tirer au sort directement des individus. La base de sondage peut êtreconstituée par exemple des listes électorales (dans ce cas là, les mineurs et lespersonnes non inscrites sur les listes électorales ne seront jamais tirées au sort),des abonnés téléphoniques (problème des jeunes n'ayant qu'un téléphone portable,ainsi que des abonnés sur listes rouges)...Il est parfois plus pratique de disposernon pas d'une liste d'individus, mais d'une liste d'unités collective (ex : liste desétablissements scolaires d'une région) : on parlera alors de sondage en grappe.

a) Sondage aléatoire simple (ou sondage élémentaire) : tiragedirect dans la base de sondage

� Principe : On tire au sort les individus directement dans l'ensemble de la liste (base desondage).

� Avantage : *simple *analyse statistique classique

� Inconvénients : *Cette technique suppose de disposer de la liste exhaustive de tous les individus dela population source, sinon, il y aura un biais de sélection (voir cours sur les biaischapitre 5). Tous les sujets ont la même probabilité d'être sélectionné, qui correspond à lafraction de sondage f=n/N Avec n : effectif de l'échantillon N : effectif de la population Précision de l'estimation

Elle dépend de la variance de l'estimateur, laquelle est de la forme ² /n . Lafluctuation d'échantillonnage (défaut de précision) est d'autant plus forte que lesvaleurs de la variable étudiée sont plus dispersées dans la population (variance ²

élevée). En revanche, la précision est d'autant meilleure que l'effectif del'échantillon (n) est plus élevé.

Exemple

On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004.La base peut être constituée par la liste des femmes ayant accouché dans lesdifférentes maternités de Côte d'Or. Le sondage élémentaire consiste à tirer au sortles femmes sur cette liste. Si on ne tirait au sort que dans la liste des femmes ayant accouché dans la seulematernité accueillant des grossesses à haut risque, l'échantillon ne serait pasreprésentatif de l'ensemble des accouchements du département : la prévalence de

Reproduction et diffusion interdite sans accord des auteurs.8

Les principes des méthodes de sondage

Page 9: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

l'accouchement prématuré serait sur-estimée.

b) Sondage stratifié

� Principe : La base de sondage est divisée en groupes homogènes (strates) selon un critère liéà la variable à estimer (exemple tranche d'âge, sexe, habitat urbain-rural etc..).Puis un tirage au sort est réalisé dans chaque strate. En pratique, on répartitd'abord les individus en sous-groupes homogènes pour le caractère étudié (strates)puis on tire au sort à l'intérieur de chacune de ces strates. L'estimateur pourl'ensemble de l'échantillon est calculé à partir des estimateurs obtenus dans chaquestrate.

Exemple

Exemple : d'après Rumeau-RouquetteOn cherche à estimer la taille des 12- 18 ans dansune population. Or, on sait que la taille est liée àl'âge. Si on isole dans cette population les individusd'une même classe d'âge, on peut alors segmenter la population en autant departies qu'il y a de classe d'âge.

Dans un sondage non stratifié, on va tirer au sort lesindividus sans tenir compte de leur strated'appartenance (ici, sans tenir compte de la classed'âge). Par exemple, si on tire on tire au sort 16individus, il se peut que ces individus soient tirés au

sort dans la strate de la population comportant le plus grand nombre d'individus.Par exemple, s'il y a 1 000 individus au total dans une population, et que 900d'entre eux ont plus de 15 ans, alors il y a une plus forte probabilité que le tirageau sort concerne des plus de 15 ans, et que les individus appartenant aux autresstrates, beaucoup moins représentées dans la population, ne soient pas tirés ausort.

Dans un sondage stratifié, on va tirer au sort lesindividus non plus directement dans l'ensemble de lapopulation, mais dans leur strate d'appartenance (iciselon la classe d'âge). Ceci permet de garantir d'avoirdes individus dans chacune des strates constituant lapopulation. Par exemple, sur les 16 individus, on vaen tirer au sort 2 dans chaque strate.

� Intérêt : La stratification vise à réduire la variance des estimateurs, en améliorant larépartition de l'échantillon entre les différentes strates.

� Avantage : Le sondage stratifié permet d'être certain d'avoir des individus dans chaque strate.Le gain de précision dû à la stratification est d'autant plus grand qu'il existe uneliaison plus forte entre le critère de stratification et la variable étudiée. Il permet aussi de sur-représenter les strates ayant de faibles effectifs. Dans cecas, la fraction de sondage variera entre les différentes strates. Exemple : si 99% des lycéens habitent en zone urbaine et 1% des lycéens en zone

Reproduction et diffusion interdite sans accord des auteurs.9

Les principes des méthodes de sondage

Page 10: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

rurale, si on tire au sort les lycéens sans stratifier sur la zone, on risque de n'avoirque des lycéens appartenant aux lycées urbains. On peut aussi choisir pour l'échantillon de respecter les proportions observées dansla population (allocation proportionnelle). Par exemple, si dans une région comportant 200 lycées, il y a 60% de lycéensvivant en zone urbaine et 40% en zone rurale, et si on décide de tirer au sort 100lycéens, alors on tirera au sort 60 lycéens dans les zones urbaines et 40 lycéens enzone rurale. Exemple : On veut mesurer la prévalence du tabagisme chez les jeunes scolarisésen Bourgogne. On sait que la consommation de tabac varie selon l'âge et doncselon le type d'établissement scolaire fréquenté. On fait 2 strates : une strate «collégiens » et une strate « lycéens » et on tire au sort les individus au sein dechaque strate.

c) Sondage en grappes

� Principe : Le sondage en grappe consiste à tirer au sort non pas directement un individu,mais des unités collectives (par exemple : services hospitaliers, établissementsscolaires...). L'ensemble des individus de l'unité collective sont inclus dansl'enquête. Ce type de sondage est utilisé lorsqu'on n'a pas de liste des individus,mais qu'on dispose d'une liste de grappes réunissant plusieurs individus.

� Avantage : Il permet de faciliter la réalisation de l'enquête et de réduire son coût, en limitant lenombre de lieux à étudier pour accéder aux individus mais entraîne fréquemmentune perte de précision des estimateurs. Le sondage en grappe est d'autant plus efficace (conduit à une meilleure précisionque le sondage élémentaire) que : - les grappes sont plus hétérogènes en leur sein pour la variable étudiée (varianceintra-grappe élevée) - les grappes sont plus semblables entre elles (variance inter-grappe faible) Si le groupement des unités statistiques en grappe conduit à des grappes plushétérogènes que ne le voudrait le hasard, le sondage en grappe est plus précis quele sondage élémentaire. En revanche, si les grappes sont plus homogènes que ne levoudrait le hasard, le sondage en grappe est moins précis qu'un sondageélémentaire.Le calcul des estimateurs produits par ce type de sondage est complexe et ne serapas détaillé dans ce cours. Par exemple, dans l'exemple précédent, comme on ne dispose généralement pasfacilement de la liste de tous les élèves de Bourgogne on se procurera la liste detous les établissements scolaires de la région. Les établissements scolaires sont lesgrappes, et constituent les unités de sondage. Ce sont eux qu'on va tirer au sort. Eton étudie ensuite tous les élèves des établissements tirés au sort. N.B. : Il est possible de combiner sondage élémentaire et sondage en grappe :dans l'exemple précédent, on tire au sort les établissements (sondage en grappe)puis on tire au sort les élèves : sondage à 2 degrés. Power-point visible en ligne

2. Autres méthodes de sondage

En l'absence de base de sondage utilisable, d'autres méthodes d'échantillonnage,

Reproduction et diffusion interdite sans accord des auteurs.10

Les principes des méthodes de sondage

Page 11: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

dites « empiriques » peuvent être utilisées.

a) Sondage systématique

Lorsqu'on ne dispose pas d'une base de sondage, on décide de prendre lespersonnes se trouvant dans une situation donnée au regard d'un critère qui n'estpas aléatoire, mais qui est supposé indépendant du phénomène à étudier. Exemple : méthode des itinéraires. Des règles précises sont définies pour inclureles individus dans l'échantillon :Exemple : un immeuble sur trois, un étage sur deux, appartement correspondantà la porte de gauche sur le palier etc... Limites : On ne connaît pas la probabilité d'inclusion des individus de lapopulation, la représentativité de l'échantillon n'est nullement garantie, lesdifférences avec la population source sont difficiles à établir.

3. Méthode des quotas (parfois appelée sondage pseudo-aléatoire)

� Principe : La méthode des quotas a pour objectif la constitution d'un échantillon ayant lesmêmes caractéristiques que la population cible. Pour atteindre toutes les catégoriesde la population à couvrir par l'enquête, on impose des quotas = nombre de sujetsde chaque catégorie sur lequel portera l'enquête. Exemple : on veut que l'échantillon contienne 15 femmes de 25 ans habitant enzone rurale, 10 femmes de 25 ans habitant en zone urbaine, 5 femmes de plus de25 ans habitant en zone rurale, 10 femmes de plus de 25 ans habitant en zoneurbaine... N.B. Cette méthode est utilisée habituellement par les Instituts de sondage.

� Limites : On ne connaît pas la probabilité d'inclusion des individus de la population, et donc,l'inférence des résultats obtenus à la population doit être faite avec plus deprécaution que dans les méthodes aléatoires. La représentativité de l'échantillonainsi constitué peut être sujette à caution.

4. QCM sur les différents types de sondage

On souhaite connaître la conformité de l'hygiène des mains des professionnels desanté aux recommandations officielles. Pour cela, une étude d'observation despratiques est réalisée et consiste à observer la technique d'hygiène des mains parles professionnels de santé. Indiquez de quel type de sondage il s'agit dans les situations suivantes (une ouplusieurs réponses possibles) :

Exercice 1[Solution n°1 p 51]

1. Pour un service de chirurgie, vous disposez de la liste de l'ensemble desprofessionnels de santé. Vous décidez de tirer au sort les professionnels que vousallez observer. Indiquez de quel type de sondage il s'agit (une ou plusieursréponses possibles) :

Reproduction et diffusion interdite sans accord des auteurs.11

Les principes des méthodes de sondage

Page 12: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

A. Sondage aléatoire simple

B. Sondage stratifié

C. Sondage en grappe

D. Sondage systématique

E. Méthode des quotas

Exercice 2[Solution n°2 p 51]

2. Dans un hôpital, vous souhaitez observer les pratiques dans différents services.Vous tirez au sort les différents services, puis vous observez les pratiques de tousles professionnels. Indiquez de quel type de sondage il s'agit (une ou plusieursréponses possibles) :

A. Sondage aléatoire simple

B. Sondage stratifié

C. Sondage en grappe

D. Sondage systématique

E. Méthode des quotas

F. Sondage à 2 degrés

Exercice 3[Solution n°3 p 51]

3. Dans un hôpital, vous souhaitez observer les pratiques dans différents services.Vous tirez au sort les différents services, puis vous tirez au sort les professionnelsde santé que vous allez observer. Indiquez de quel type de sondage il s'agit (uneou plusieurs réponses possibles) :

A. Sondage stratifié

B. Sondage en grappe

C. Sondage aléatoire simple

D. Sondage à 2 degrés

E. Sondage à 3 degrés

Exercice 4[Solution n°4 p 52]

4. Vous décidez d'observer, pour un hôpital, les pratiques chez les médecins, chezles infirmières et chez les aides-soignantes. Vous tirez au sort 10 médecins parmiles 100 médecins présents, 50 infirmières parmi les 300 infirmières présentes, et60 aides soignantes parmi les 600 aides soignantes présentes. Indiquez de queltype de sondage il s'agit (une ou plusieurs réponses possibles) :

Reproduction et diffusion interdite sans accord des auteurs.12

Les principes des méthodes de sondage

Page 13: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

A. Sondage à 3 degrés

B. Sondage en grappe

C. Sondage aléatoire simple

D. Sondage stratifié

E. Méthode des quotas

B. En pratique...

1. Effectif de personnes requis pour un échantillon

Un sondage, comme toute autre étude épidémiologique, nécessite le calcul d'unnombre de sujets nécessaires selon la précision souhaitée de l'estimation. Lesmodalités de calcul sont présentées dans le cours "Calcul du nombre de sujetsnécessaires dans une étude épidémiologique descriptive transversale". Une fois ce calcul effectué, il faut également tenir compte du taux de participationattendu. Par exemple, si on souhaite réaliser une enquête par auto-questionnaire sur laconsommation d'alcool, et que le taux de participation attendu est 10%, si le calculdu NSN indique qu'il faut inclure 100 personnes, alors il faudra envoyer 1 000questionnaires (car 10%*1000=100)

2. Comment tirer au sort

Pour procéder au tirage au sort, il faut disposer d'une base de sondage danslaquelle on va numéroter tous les individus de cette base. Ensuite, le tirage au sortpeut être réalisé par des logiciels statistiques ou à l'aide d'une table des nombresau hasard .

Extrait d'une table de nombre au hasard.

Si on veut tirer 100 sujets dans une base comportant 1000 individus, on numérotetous les individus de cette base de 0 à 999; Dans la table de nombres au hasard,on prend les 100 premiers nombres de 3 chiffres en éliminant les répétitions. Onpeut lire la table verticalement, horizontalement, en diagonale...L'essentiel est dese fixer à l'avance la façon dont la table sera lue.

Exemple 1 : On décide de lire la table de gauche àdroite en commençant en haut et à gauche et enprenant les chiffres par groupes de 3 colonnes : dansl'exemple ci-dessous, on retiendra donc le 260, le658, le 698, le 844, le 582, le 212, etc...

Reproduction et diffusion interdite sans accord des auteurs.13

Les principes des méthodes de sondage

Page 14: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

Exemple 2 : On décide de lire la table en diagonale.Les nombres retenus seront : le 260, le 616, le 422,le 833, le 669, le 720, etc...

S'il s'agit d'un sondage stratifié, il faudra numéroter les individus dans chacune desstrates. S'il s'agit d'un sondage en grappe, on numérote chaque grappe, et on tire au sortles grappes.

3. Exploitation des résultats fournis par le sondage

Le sondage consiste à n'inclure qu'une partie (= échantillon) de la populationsource. Les individus de l'échantillon vont être inclus dans l'étude et être l'objetd'un recueil de données : mesure d'une ou plusieurs variables quantitatives et /ouqualitatives. A partir des valeurs observées dans l'échantillon, on calculera selon lescas la moyenne et la variance de la variable (variable quantitative) ou la proportiondes individus présentant une certaine caractéristique (variable qualitative). Pour unéchantillon donné, la valeur prise par cet estimateur est appelée estimation.On peut mesurer sur l'échantillon les mêmes types de paramètres de position et dedispersion que sur une population. Les paramètres de l'échantillon n'ont d'intérêtqu'en tant qu'estimation des vrais paramètres inconnus de la population. Faire une estimation, c'est tenter de définir les paramètres d'une population à partirdes paramètres observés sur un échantillon (inférence).

a) Estimation des paramètres dans un sondage simple

i - Paramètres observés sur l'échantillon

1111 . . . . Pour une variable quantitative

� Moyenne

m : moyenne de l'échantillon. C'est l'estimateur de la moyenne µ inconnue.

x i : valeurs de la variable

∑xi : somme des valeurs de la variablen = taille de l'échantillon

� Variance

x i : valeurs de la variable

∑xi = somme des valeurs de la variables² = variance de l'échantillonn = effectif de l'échantillon

Reproduction et diffusion interdite sans accord des auteurs.14

Les principes des méthodes de sondage

Page 15: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

2222 . . . . Pour une variable qualitative à 2 modalités (variable binaire)

� Proportionp =n/N avec q=1-p

� Variances² = pq/n

ii - Calcul de l'intervalle de confiance (estimation parintervalle)

Les modalités de calcul de l'intervalle de confiance pour un sondage aléatoiresimple sont abordés dans le cours "Calcul du nombre de sujets nécessaires dansune étude épidémiologique descriptive transversale - Intervalle de confiance".

b) Estimation des paramètres dans un sondage stratifié

i - Paramètres observés sur l'échantillon

1111 . . . . Pour une variable quantitative

� Moyenne

ms : : moyenne estimée sur l'ensemble de l'échantillon. C'est l'estimateur dela moyenne µ inconnue.Ni : effectif de la strate i dans la population mi : moyenne estimée dans la strate i de l'échantillon n : effectif de l'ensemble de l'échantillon

� Variance :

Avec :var ms : variance de l'ensemble de l'échantillon : Ni : Effectif de la strate i dans la population : N : Effectif de la population entière (1-fi) : facteur d'exhaustivité correspondant à 1- ni/Ni fi= ni/Ni = fraction de sondage dans la stratesi² : variance dans la strate i ni : effectif de la strate i dans l'échantillon

2222 . . . . Pour une variable qualitative

� Pourcentage :

AvecPs : proportion estimée sur l'ensemble de l'échantillon Ni : Effectif de la strate i dans la population N : Effectif de la population entièrePi : proportion estimée dans la strate i

� Variance :

Reproduction et diffusion interdite sans accord des auteurs.15

Les principes des méthodes de sondage

Page 16: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

Ps : proportion estimée sur l'ensemble de l'échantillon Ni : Effectif de la strate i N : Effectif de la population entière : Pi: proportion estimée dans la strate i ni : effectif de la strate i dans l'échantillon qi=1-pi

c) Tableau récapitulatif

Reproduction et diffusion interdite sans accord des auteurs.16

Les principes des méthodes de sondage

Page 17: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

d) Exercice avec corrigé - Les sondages

Q u e s t i o n [Solution n°1 p 49]

Complétez le tableau suivant (données fictives) afin d'estimer la proportion defumeurs dans une étude portant sur les élèves des lycées ruraux et urbains.

Tableau 1 : -

Tira

ge

Ava

ntag

es

Inco

nvén

ient

s

Son

dage

alé

atoi

re s

impl

e S

onda

ge e

n gr

appe

S

onda

ge

stra

tifié

Bas

e de

son

dage

Li

ste

com

plèt

e de

s su

jets

-

liste

com

plèt

e de

s gr

appe

s Li

ste

com

plèt

e de

s su

jets

dan

s ch

aque

str

ate

- nu

mér

otat

ion

des

suje

ts

- T

AS

des

suj

ets

- nu

mér

otat

ion

des

grap

pes

TA

S d

es g

rapp

es

- nu

mér

otat

ion

des

suje

ts d

ans

chaq

ue s

trat

e -

TA

S d

es s

ujet

s da

ns le

s st

rate

s

Sta

tistiq

ues

sim

ples

B

onne

est

imat

ion

du p

aram

ètre

- pr

atiq

ue

- ne

néc

essi

te p

as d

e ba

se d

e so

ndag

e dé

taill

ée

- m

oind

re c

oût

- ga

in e

n pr

écis

ion

(pos

sibi

lité

de s

ur-r

epré

sent

er

les

stra

tes

avec

un

faib

le

effe

ctif)

Sup

pose

d'a

voir

la li

ste

com

plèt

e de

s su

jets

- an

alys

e st

atis

tique

com

plex

e né

cess

itant

de

pren

dre

en

com

pte

l'effe

t gra

ppe

- m

oins

pré

cis

qu'u

n so

ndag

e al

éato

ire s

impl

e

- an

alys

e pl

us c

ompl

exe

que

le

sond

age

aléa

toire

sim

ple

- su

ppos

e d'

avoi

r un

e ba

se d

e so

ndag

e

Reproduction et diffusion interdite sans accord des auteurs.17

Les principes des méthodes de sondage

Page 18: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

C. Interprétation des résultats

1. Taux de participation et non réponses

Le taux de participation doit être précisé. Bien souvent, les personnes ne répondantpas à une enquête (ou les personnes pour lesquelles la variable étudiée n'a pas puêtre recueillie) diffèrent de celles qui répondent (ou celles chez qui la variable a puêtre recueillie). Ces différences sont responsable d'un biais de sélection del'échantillon. (cf cours sur les biais- chapitre 5)

a) Pendant l'étude : pour limiter le nombre de non-répondants

� S'assurer de la faisabilité de l'étude : si enquête par questionnaire, tester lesquestionnaires auparavant, ne pas commencer par des questions sensibles,le questionnaire ne doit pas être trop long à remplir.

� Faire une relance afin d'améliorer le taux de réponse, ce qui suppose que lesquestionnaires ne soient pas anonymes

b) Lors de l'exploitation des résultats : pour étudier les biais desélection

� Comparer les caractéristiques des non-répondants par rapport auxrépondants

� Redresser les résultats observés. Le redressement a pour objectif d'améliorer la précision des estimations, et de faireen sorte que la structure de l'échantillon soit identique à la structure connue sur lapopulation de certaines variables liées aux variables étudiées. Il permet de corrigerpartiellement le biais dû aux non-réponses.

2. Interprétation des résultats

On présente classiquement un paramètre de position et un paramètre de dispersion: moyenne et écart-type, ou pourcentage et intervalle de confiance par exemple. Le travail sur échantillon a pour but d'extrapoler les données observées àl'ensemble de la population source (inférence). Les paramètres mesurés sur unéchantillon sont des estimateurs des vraies valeurs inconnues de la population. → L'échantillon doit être REPRESENTATIF de la population qu'il est censé décrire.Pour cela, il faut que tous les individus de la population aient une probabilité

Tableau 2 : -

Strate

500 100 0,2 101300 200 0,15 100

Total 1800 300

Nombre d'élèvesdans la strate i

Nombre d'élèves

dans l'échantillon

pour la strate i

Fraction de

sondage

Nombre de fumeurs pour la strate i

Proportion de

fumeurs dans la strate i

Ni ni fi nifumeur pi Nipi/N

Lycée rural Lycée urbain

Reproduction et diffusion interdite sans accord des auteurs.18

Les principes des méthodes de sondage

Page 19: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

connue et non nulle de figurer dans l'échantillon. Seul le sondage aléatoire assurecette condition. On parle de biais de sélection (ou biais d'échantillonnage) lorsque l'échantillondiffère systématiquement de la population dont il est supposé provenir (cf cours surles biais- chapitre 5).

Exemple

Exemple : choix de volontaires : personnes plus soucieuses de leur état de santé,et non représentatives de la population générale.Exemple : pour déterminer la prévalence de l'accouchement prématuré en Côted'Or, on effectue le tirage au sort uniquement parmi les femmes ayant accouché auCHU. Comme c'est une maternité de type III, elle accueille plus de grossessespathologiques que les autres maternités : on risque de surestimer la prévalence del'accouchement prématuré en Côte d'Or. Exemple : défaut de couverture : si la base de sondage est l'annuairetéléphonique, alors il manquera toutes les personnes sur liste rouge, et toutes lespersonnes ne possédant qu'un téléphone portable (jeunes essentiellement). Exemple : On souhaite connaître la consommation d'alcool dans une populationd'ouvriers. Pour cela, on décide d'interroger sur leur consommation d'alcool parquestionnaire des ouvriers travaillant sur les chantiers. Si les seules personnes quirépondent aux questionnaires sont les ouvriers ne consommant pas d'alcool, et queles ouvriers consommant de l'alcool ne remplissent pas le questionnaire, alors lesrésultats de l'enquête seront complètement faussés, et la consommation d'alcoolsous estimée.

Pour avoir une idée de la représentativité de l'échantillon étudié, on peut comparerles caractéristiques générales des personnes de l'échantillon et des personnes de lapopulation caractéristiques de cet échantillon par rapport à celles de la populationcible.

Reproduction et diffusion interdite sans accord des auteurs.19

Les principes des méthodes de sondage

Page 20: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004
Page 21: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

II - La rédaction duprotocole d'uneinvestigation ensanté publique

II

Les différentes parties du protocole d'une investigation en

santé publique 21

Le protocole est un document écrit contenant tous les éléments scientifiques,techniques, organisationnels, réglementaires et budgétaires liés à laréalisation d'une étude. Il comprend :

� un état des connaissances actuelles sur le thème étudié

� une justification scientifique de l'investigation

� une formulation de l'objectif de l'investigation,

� une description détaillée de la méthodologie et du déroulement del'investigation.

Ses destinataires sont multiples :

� les instances éthiques et réglementaires qui vont autoriser la mise en œuvrede l'étude

� les financeurs éventuels,

� et les différents acteurs de l'investigation.

A. Les différentes parties du protocole d'uneinvestigation en santé publique

1. La page de titre

Les informations générales doivent être regroupées dans une “ page de titre ”. Cesinformations sont les suivantes :

� le titre qui résume le but de l'étude

� le nom de l'investigateur principal et ses coordonnées

� le nom des co-investigateurs et leurs coordonnées

� le nom et coordonnées des laboratoires impliqués

� le nom du promoteur et son adresse : à quoi sert le promoteur dans une

Reproduction et diffusion interdite sans accord des auteurs.21

Page 22: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

recherche biomédicale ? Le promoteur joue un rôle essentiel, sesprincipales missions sont : d'assurer la gestion de la recherche, de vérifierque le financement est prévu, d'envoyer le projet de recherche auxinstances compétentes pour obtenir l'autorisation de mise en œuvre del'étude (cf. chapitre 6 "Principes éthiques s'appliquant aux investigations ensanté publique, le cadre réglementaire et les bonnes pratiques"), derépondre aux éventuelles demandes de modification, de mandater lespersonnes chargées du contrôle de qualité dans la gestion de la recherche,de prévoir l'indemnisation des personnes incluses dans la recherche encompensation des contraintes subies ; il doit également communiquer sansdélai au Comité de protection des personnes (CPP) et aux autorité de santécompétentes les événements indésirables graves non attendus.

� la date et le numéro de version du protocole pour éviter toute erreur dansl'envoi de la dernière version.

2. Le plan du protocole, la liste des abréviations

A cette étape du protocole il convient d'indiquer le plan puis la liste des abréviationsutilisées dans l'ensemble du document.

3. Le résumé du protocole

Généralement, le résumé reprend en une page si possible les principalescaractéristiques du protocole :

� justification (en moins de 5 lignes),

� objectif principal, - caractéristiques principales de la population de l'étude,

� type d'étude, schéma général ( ou design)

� critère d'évaluation principal (en moins de 8 lignes),

� résultats et/ou bénéfices éventuels attendus (en moins de 8 lignes).

Remarque

Le résumé est important car il est souvent l'élément de sélection du protocole.

4. La justification de l'étude

Dans cette partie du protocole, vous devez définir le thème, le sujet, ou la questionde recherche abordée. Cette partie permet de :

� situer le thème, définir le sujet

� justifier du bien fondé de l'investigation, quelque soit sa nature (recherche,évaluation, ...) : - Quelles sont les questions non résolues, les problèmes existants - Justifier de l'intérêt de leur apporter une réponse (retombées et

perspectives) Cette partie doit être référencée (cf. Les références bibliographiques). Ajouter les hypothèses ici

5. L‘hypothèse et l'objectif de l'étude

L'hypothèse de recherche est une affirmation formulée par le chercheur. Exemple. « La consommation quotidienne augmente le nombre d'apnées nocturnes

Reproduction et diffusion interdite sans accord des auteurs.22

La rédaction du protocole d'une investigation en santé publique

Page 23: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

supérieures à 2 minutes chez les hommes âgés de 60 à 80 ans ». L'objectif de l'étude vise a confirmer ou infirmer cette hypothèse. Sa formulationdoit être précise. L'objectif contient généralement :

� un verbe actif

� le type d'étude adapté

� l'indicateur de résultat ou critère de jugement principal

� l'intervention évaluée le cas échéant

� la définition sommaire de la population

Exemple

Exemple 1. « Estimer l'incidence en 2006 de l'insuffisance cardiaque dans ledépartement de la Meuse » ... et non pas « Étudier l'insuffisance cardiaque »Exemple 2. « Mettre en évidence une relation entre la consommationquotidienne de tabac et le nombre d'apnées nocturnes supérieures à 2minutes chez les hommes âgés de 60 à 80 ans » ... et non pas « Tabac etapnée du sommeil »

Remarque

Dans le cadre d'une recherche-action, il faut savoir différentier l'objectif del'intervention de celui de la recherche. Exemple 1 : « Améliorer la santé des élèves de CM2 » est l'objectif del'intervention Exemple 2 : « Démontrer l'efficacité de telle action de prévention auprèsdes élèves de CM2 » est l'objectif de la recherche.

Enfin, veillez à ne définir qu'un seul objectif principal. Les autres objectifs sontdéclinés sous forme d'objectifs secondaires.

6. Le schéma général de l'étude/ Plan expérimental

Cette partie présente les grandes caractéristiques de l'étude choisies pour répondreà l'objectif, en utilisant des termes standards (grand type d'étude, méthode desélection, méthode de suivi...). Se référer au chapitre 6 - cours "Connaître les différents types d'étudesépidémiologiques analytiques et leurs avantages et inconvénients" .

7. La population et échantillon

La « population » est autant la source des résultats que la cible des conclusionstirées des résultats. Dans un protocole, elle est représentée par un échantillon dont il faut définir lescaractéristiques de manière telle qu'un autre investigateur/ chercheur intéressé àconfirmer ultérieurement les résultats puisse les reproduire à partir d'un échantillonsimilaire. Les critères de sélection impliquent : a. Une population cible qui pourrapossiblement bénéficier des résultats de l'enquête ou de l'intervention(généralisation des résultats de l'étude à une population plus large). b. Unepopulation source à partir de laquelle l'échantillon sera recruté. Exemple : Les critères de sélection impliquent :a. Une population cible qui pourra possiblement bénéficier des résultats del'enquête ou de l'intervention (généralisation des résultats de l'étude à une

Reproduction et diffusion interdite sans accord des auteurs.23

La rédaction du protocole d'une investigation en santé publique

Page 24: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

population plus large). b. Une population source à partir de laquelle l'échantillon sera recruté.

Exemple

Nous souhaitons évaluer l'impact d'une campagne d'information dans uneagglomération X sur la conduite à tenir lorsqu'une personne s'effondre sur la voixpublique, victime d'un accident cardio-respiratoire.

� La population cible de notre investigation correspond à l'ensemble despersonnes qui résident dans l'agglomération X.

� Le choix de la population source dépend de la disponibilité d'une base dedonnées accessible, dans cet exemple, les investigateurs ont opté pour dansl'annuaire téléphonique

Remarque

Si la population source diffère de la population cible sur des caractéristiquessusceptibles d'influencer le résultat de l'enquête (comme c'est probablement le casdans l'exemple ci-dessus, structure d'âge, niveau socio-économique, ...), lesinvestigateurs doivent impérativement en tenir compte au moment del'interprétation des résultats, la généralisation des résultats à la population cibledevient impossible.

c. Un choix de population où l'on est susceptible d'obtenir une réponse, après uneintervention de qualité optimale, et avec un échantillon de dimension raisonnable(cf. calcul du NSN) d. Une surveillance possible des effets parallèles des interventions e. Une sélection sévère des sujets porteurs d'une condition qui peut modulerl'obtention de la réponse f. Une certaine assurance que les sujets vont pouvoir respecter les conditions departicipation

En résumé : Veillez à définir précisément :

� la population - types (territoriale/professionnelle /clientèle) + géographique +

temporelle

� les unités de l'étude - individu/groupe d'individu/actes/épisodes de la vie/... - critères d'inclusion / de non inclusion

� les modalités d'échantillonnage = ensemble des opérations qui vontpermettre de recruter les unités (cf. cours « Les sondages »)- la ou les sources de recrutement- les modalités de sondage

8. L'investigation, les explorations étudiées

Pour tous types d'investigations (évaluation d'une stratégie diagnostique,évaluation d'un réseau de soin, validation d'un instrument de mesure de la qualitéde vie, etc.), l'intervention prévue doit être décrite de façon détaillée.

Reproduction et diffusion interdite sans accord des auteurs.24

La rédaction du protocole d'une investigation en santé publique

Page 25: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

9. La description des données collectées et des méthodesde mesure

Cette partie présente les données qui seront collectées lors de l'investigation, lesmodalités de recueil et les modalités de l'informatisation de ces mêmes données. Quelles données/ informations seront recueillies ?

� Le ou les critères de jugement; les variables explicatives et/oud'ajustement ; les variables de type techniques ou légales (ex : inclusion,consentement, identification)

� Le choix de telles ou telles variables doit être justifié Selon quelles modalités ?

� Précisez bien la ou les sources sollicitées ?

� Présentez le mode de recueil (questionnaire auto-administré, guided'entretien) et les modes d'enregistrement des réponses

� Si possible, proposez une méthode de vérification et de validation desdonnées recueillies

Les modalités de l'informatisation des données

� Précisez les modalités de transmission), le lieu de saisie (centralisation de lasaisie avec transmission des bordereau en version papier, saisie sur site), lapersonne saisissant les données, s'il s'agit d'une simple ou double saisie, lelieu de stockage des données, l'existence d'une procédure de sécurisationphysique et numérique particulière,...

10. L'analyse statistique, l'analyse de contenu

Vous devez présentez le plan général de l'analyse statistique s'il s'agit d'uneinvestigation quantitative :

� Quelles méthodes d'analyse seront utilisées ?

� Quelles variables sont prises en compte?

� Quels tests statistiques sont envisagés ?

� Que fera-t-on des données imparfaites (perdus de vue, non réponses,données absentes ou aberrantes)

Pour rédiger cette partie, l'aide d'un biostatisticien peut être utile. Dans le cas d'une investigation qualitative, vous devez décrire la façon dont seraanalysé le contenu de l'information recueillie.

11. Le déroulement de l'étude, les aspects logistiques

Cette partie présente les éléments de réponses aux questions suivantes : Qui - fait quoi - quand - avec quels moyens ? Des outils peuvent être utilisés pour faciliter la présentation de ces éléments etl'enchaînement des tâches (ex : schéma, diagramme de Gantt)

Reproduction et diffusion interdite sans accord des auteurs.25

La rédaction du protocole d'une investigation en santé publique

Page 26: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

Il convient également de présenter brièvement, si elles existent, les procéduresopérationnelles standardisées (POS). Les POS sont des documents qui fixent les règles d'organisation écrites déterminantles compétences, les moyens et la manière d'accomplir une activité pour parvenir à

Exemple de diagramme de Gantt

Reproduction et diffusion interdite sans accord des auteurs.26

La rédaction du protocole d'une investigation en santé publique

Page 27: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

un but. Pour toute action décrite dans la procédure, le lecteur doit trouver dans sa lectureles réponses aux questions qu'il se pose : CONTEXTE : la mise en application de la procédure ou la fiche technique. QUOI ? De quoi s'agit il ? QUI ? Qui fait ? avec qui ? pour qui ? qui est le responsable ? OU ? Où est applicable cette action ? QUAND ? Quand doit on appliquer ce qui est écrit, avec quels délais...? COMMENT ? Comment met-on en œuvre cette action ? (méthodologie, moyens) COMBIEN ? Toutes quantifications relatives aux autres questions (si nécessaire).

12. Les aspects médico-légaux (éthiques etréglementaires)

Selon la nature de l'investigation, certaines instances sont susceptibles d'êtresollicitées avant le démarrage de l'étude : parmi elles, le Comité de Protection desPersonnes (CPP), le Comité Consultatif sur le Traitement de l'Information enmatière de Recherche dans le domaine de la Santé (CCTIRS), la CommissionNationale de l'Informatique et des Libertés (CNIL) ou encore l'Agence Française deSécurité Sanitaire des Produits de Santé (AFSSAPS).

� Le CPP représente l'équivalent français des "ethical research committee" ou"Comités d'éthique de la recherche" présents dans les pays anglo-saxons etles autres pays européens, son rôle est de s'assurer que tout projet derecherche biomédicale sur l'être humain mené en France respecte diversesmesures (médicales, éthiques et juridiques) visant à assurer la protectiondes personnes qui participeront à cette recherche ;

� Le CCTIRS éclaire la CNIL (Commission Nationale de l'Informatique et desLibertés) sur la justification du traitement de données à caractère personneldans un but de recherche, et, pour cela, d'émettre un avis sur laméthodologie de la recherche ;

� La CNIL est chargée de veiller à la protection des données à caractèrepersonnel et de la vie privée, qu'elles soient directement ou indirectementnominatives ;

� L'AFFSAPS a parmi ses missions celle d'étudier et d'expertiser enpermanence les données qui modifient la connaissance des produits desanté, elle se prononce notamment sur les demandes d'autorisation de misesur le marché (AMM) d'un nouveau médicament, elle est aussi en charge dela pharmacovigilance.

Ces aspects doivent impérativement être présentés dans une partie bien distinctedu protocole.

Remarque

Pour plus de détails, se référer au chapitre 6 "Principes éthiques s'appliquant auxinvestigations en santé publique, le cadre réglementaire et les bonnes pratiques"

13. Les références bibliographiques

La liste des références bibliographiques doit être mise à jour au fur et à mesure quele protocole évolue. Veillez à présenter les références bibliographiques selon lesnormes de Vancouver.

Reproduction et diffusion interdite sans accord des auteurs.27

La rédaction du protocole d'une investigation en santé publique

Page 28: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

14. Les annexes

Les annexes contiennent tous les documents nécessaires à la mise en œuvre del'investigation. Ces documents inclus :

� La demande d'accord de participation à l'étude, ou le formulaired'information et le cas échéant de consentement des sujets, si nécessaire lesnormes de laboratoires et les agréments

� Les outils utilisés : les procédures opérationnelles standardisées

� Le cahier d'observation / bordereau de recueil de données / questionnaires /guides d'entretien dans leur version définitive

� L'évaluation budgétaire détaillée

� Le double des courriers aux différentes instances ainsi que de leur réponse(si acceptation)

� Un curriculum Vitae (si demandé)

Reproduction et diffusion interdite sans accord des auteurs.28

La rédaction du protocole d'une investigation en santé publique

Page 29: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

III - Le calcul dunombre de sujetsnécessaire dansune étudeépidémiologiquedescriptivetransversale

III

Justification de l'échantillonnage 30

Précision de la mesure 30

Éléments du calcul du nombre de sujets nécessaire 34

Considérations pratiques 36

Conclusion 36

Pour l'ensemble de ce chapitre, nous nous placerons dans un contexted'échantillonnage aléatoire simple. D'autres méthodes d'échantillonnage existent etrequièrent des modalités de calcul du nombre de sujets nécessaire particulières quine seront pas présentées ici. Un chercheur vient vous voir pour vous présenter l'objectif de son étudetransversale qui est d'estimer la prévalence de l'infarctus du myocarde dans larégion Lorraine, en population générale. Il se demande combien de sujets il doitinclure dans l'étude pour atteindre son objectif. De la même manière, on pourrait vous demander d'estimer l'âge moyen deshabitants de la région Lorraine ayant présenté un infarctus du myocarde en 2010.On vous demande alors combien de sujets il faudra inclure pour estimer cet âgemoyen.Dans ce cours, vous aurez les éléments nécessaires pour répondre à ces questions. Remarque : Lorsque l'on parle de nombre de sujets nécessaire, le caractère « nécessaire »doit être compris en termes de qualités méthodologiques : ce nombre minimum desujets à inclure permet de garantir un certain niveau de précision et dereproductibilité des estimations produites à partir de données recueillies surl'échantillon.

Reproduction et diffusion interdite sans accord des auteurs.29

Page 30: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

A. Justification de l'échantillonnage

Lorsque l'on veut mesurer un paramètre dans une population, on effectue engénéral une mesure de ce paramètre sur un échantillon de la population. En effet,l'idéal serait de mesurer le paramètre dans l'ensemble de la population, cecipermettrait d'avoir une mesure non biaisée (cf cours sur les biais - chapitre 5) Maiscette mesure sur l'ensemble de la population n'est pas toujours possible, enparticulier pour les raisons suivantes :

� Coût trop élevé

� Manque de temps

� Manque de précision (si plusieurs enquêteurs font la mesure)

� Manque de Faisabilité En définitive, le recueil de données sur une population est possible s'il est limité àun petit nombre de données sur un effectif de taille raisonnable. Dans les cas contraires, on réalise un sondage avant d'effectuer le recueil dedonnées, ce qui permet de :

� Diminuer les coûts

� Diminuer la durée de l'étude

� Recueillir un nombre plus important de données Mais cela requiert une réflexion préalable sur la méthode d'échantillonnage utiliséeafin de limiter les erreurs liées à l'échantillonnage.

B. Précision de la mesure

Les données d'une étude sur un échantillon sont utilisées pour produire uneestimation du paramètre dans la population cible. Plusieurs éléments influencent la valeur de cette mesure :

� L'erreur (ou le biais) de mesure, à relier à la validité de cette mesure

� Le biais de sélection de l'échantillon (Cf cours sur les biais - Chapitre 5)

� L'erreur aléatoire Il est ainsi peu probable que l'estimateur de la mesure sur l'échantillon considérésoit exactement égale à la valeur du paramètre dans la population cible.

1. Fluctuations d'échantillonnage

Si l'on considère une population de 100 000 individus, dont 10% sont malades (10000 individus). Le fait que cette population soit constituée de malades et de nonmalades est une illustration de la variabilité individuelle.Prenons un échantillon de 200 sujets tirés au sort dans cette population, danslequel on compte 20 (10%) malades. La question est de savoir si en répétantl'échantillonnage selon les mêmes modalités, on retrouve à chaque fois la mêmeproportion de malades. La réponse à cette question est négative. En effet, sur les tirages au sort suivants, on retrouve 10 (5%) malades sur le 2°échantillon, puis 19 (9.5%) malades sur l'échantillon suivant puis 2 (1%) maladessur le dernier échantillon. On pourrait même arriver à compter 200 (100%)malades sur l'un des échantillons possibles de 200 personnes.

Reproduction et diffusion interdite sans accord des auteurs.30

Le calcul du nombre de sujets nécessaire dans une étude épidémiologique descriptive transversale

Page 31: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

Évidemment, en l'absence de biais de sélection, on a une probabilité plusimportante de tirer au sort un échantillon de 200 individus comptant 20 maladesqu'un échantillon comptant 200 malades. Toutefois, plusieurs estimationspeuvent être produites à partir des échantillons construits selon les mêmesmodalités, à partir d'une même population. On parle de fluctuations d'échantillonnage. Si l'on avait considéré des échantillons de 2 000 individus, on aurait observé lemême phénomène, à ceci près que la dispersion des valeurs de proportions demalades aurait été moins importante.On comprend bien ce phénomène en le considérant à l'extrême : si on prend deséchantillons de 199999 sujets, c'est-à-dire presque l'ensemble des individus de lapopulation cible, on aura un maximum de chances de retrouver une proportion demalades proche de 10% (la vraie valeur du paramètre en population totale), doncla dispersion sera minimale. Devant l'ampleur de ces fluctuations d'échantillonnage, on comprend bien qu'il estimpossible de résumer l'estimation d'un paramètre en population à la seule valeurde son estimateur sur un échantillon représentatif. Des éléments sur la dispersiondes observations est nécessaire.

2. Intervalle de fluctuation

Lorsque l'on veut exprimer la dispersion du paramètre dans la modalitéd'échantillonnage choisi, on peut utiliser l'intervalle de fluctuation dont les bornessont définies par la formule suivante :

Pour un paramètre quantitatif A, l'intervalle de fluctuation approché à (1- ) d'unemoyenne observée s'écrit :

A±z/2 A ² /n

µA est la moyenne théorique de la variable d'intérêt (A) dans la population σA ² est la variance de A dans la populationzα/2 lu dans la table de la loi normale centrée réduite, pour une valeur de α égale aurisque d'erreur consentin est la taille de l'échantillon.Condition d'application : normalité de la distribution de A

Pour un paramètre qualitatif A, l'intervalle de fluctuation approché à (1- ) d'unpourcentage observé est donnée par la formule :

P A±z/2P A QA /N

PA étant la proportion dans la population pour la variable concernée (A) QA étant le complément de la proportion de A dans la population concernée (QA=1-PA ) zα/2 lu dans la table de la loi normale centrée réduite, pour une valeur de α égale aurisque d'erreur consentin est la taille de l'échantillon Ces calculs supposent que la vraie valeur du paramètre est connue dans lapopulation, ce qui n'est généralement pas le cas. Cette méthode déductive n'estdonc pas applicable. Habituellement, on dispose des mesures effectuées sur un seul échantillon et onsouhaite tirer des conclusions sur la vraie valeur du paramètre dans la population(démarche inductive). Condition d'application : nPA ≥ 5 et nQA ≥ 5

Reproduction et diffusion interdite sans accord des auteurs.31

Le calcul du nombre de sujets nécessaire dans une étude épidémiologique descriptive transversale

Page 32: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

Attention

Important : Ces formules supposent que la vraie valeur du paramètre enpopulation est connue, ce qui n'est généralement pas le cas. Habituellement, on dispose des mesures effectuées sur l'échantillon et on souhaitetirer des conclusions sur la vraie valeur du paramètre en population (démarcheinductive)

-

Reproduction et diffusion interdite sans accord des auteurs.32

Le calcul du nombre de sujets nécessaire dans une étude épidémiologique descriptive transversale

Page 33: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

3. Intervalle de confiance

Lorsque l'on ne connaît pas la vraie valeur du paramètre dans la population (ce quiest le cas le plus fréquent), l'examen de l'ensemble des sujets permettrait de lamesurer. Ce qui est rarement réalisable. On calcule alors la valeur del'estimateur du paramètre étudié à partir des mesures effectuées sur les sujetsd'un échantillon représentatif de la population cible. MAIS en raison des fluctuations d'échantillonnage, on sait que si l'on avait calculél'estimateur à partir d'un autre échantillon représentatif de la population cible, onaurait probablement trouvé une valeur différente.DONC les résultats du calcul de cet estimateur doivent être présentés sous la formed'un intervalle de confiance, construit à partir de l'estimateur produit, au risquede première espèce α fixé a priori.

a) Calcul de l'intervalle de confiance

� Intervalle de confiance d'une proportionLes bornes inférieure et supérieure de cet intervalle sont définies par la formulesuivante :

p0±z/2NnN p0q0

n1

p0 étant la proportion estimée dans l'échantillon pour la variable concernée q0étant le complément de cette proportion dans l'échantillon (q0=1-p0) N étant la taille de la population cible n étant la taille de l'échantillon zα/2 lu dans la table de la loi normale centrée réduite, pour une valeur de α égaleau risque d'erreur consenti

Remarque

Si N est grand alors NnN

≈1 et les bornes de l'intervalle de confiance ne

dépendent alors plus de la taille de la population cible Une formule approchée des bornes de l'intervalle de confiance peut être utilisée :

p0±z/2 p0q0

n

Il existe deux conditions d'application de cette formule approchée : L'échantillon doit être suffisamment grand La population d'origine doit être également suffisamment grande En effet, à partir de la formule (1), on comprend bien que si n et N sontsuffisamment grands, alors

D'une part n1≈n

D'autre part NnN

≈1

Soient pi la proportion calculée pour la borne inférieure qi le complément de cette proportion dans l'échantillon (qi=1-pi) ps la proportion calculée pour la borne supérieure qs le complément de cette proportion dans l'échantillon (qs=1-ps)

Reproduction et diffusion interdite sans accord des auteurs.33

Le calcul du nombre de sujets nécessaire dans une étude épidémiologique descriptive transversale

Page 34: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

Alors la condition d'utilisation de la formule approchée est remplie si

npi≥5ET nqi≥5 ET nps≥5 ET nqs≥5

� Intervalle de confiance d'une moyenneLes bornes inférieure et supérieure de cet intervalle sont définies par laformule suivante :

mA±z/2sA2

n

mA est la moyenne observée de la variable d'intérêt (A) dans l'échantillon SA ² est la variance de A dans l'échantillon zα/2 lu dans la table de la loi normale centrée réduite, pour une valeur de αégale au risque d'erreur consenti n est la taille de l'échantillon.

Remarque

Condition d'utilisation : normalité de la distribution de la variable quantitative.

� Interprétation de l'intervalle de confiance L'intervalle de confiance peut contenir la vraie valeur du paramètre ou pas.Il signifie qu'en l'absence de biais, si l'on reproduit l'échantillonnage selon lemême procédé, et si α est fixé à 5%, alors 95% des intervalles de confianceproduits à partir des estimateurs calculés contiendront la vraie valeur duparamètre étudié.

Attention

Important : une interprétation commune de l'intervalle de confiance est pourtanterronée : elle consiste à dire que l'intervalle de confiance produit à partir d'unéchantillon a 95% de chance de contenir la vraie valeur du paramètre étudié.L'erreur tient au fait que la probabilité de 95% s'applique à l'ensemble desintervalles de confiance produits à partir d'un ensemble d'échantillons, et non pas àun intervalle de confiance en particulier, qui lui contient ou ne contient pas la valeurP. Cette formule permet de comprendre comment la taille de l'échantillon et l'étenduede l'intervalle de confiance sont liés. Plus l'échantillon est grand, moins l'intervalle de confiance est large (plusl'estimation est précise).

C. Éléments du calcul du nombre de sujets nécessaire

1. Facteurs liés à la taille de l'échantillon

� La variance : image de la reproductibilité (reliability en anglais) del'estimation produite - ↑ ↑ ↓Taille échantillon => Reproductibilité => variance

� La valeur attendue du paramètre mesuré : déterminée par l'investigateur

� La précision de la mesure : image de l'écart attendu à la vraie valeur duparamètre mesuré - ↑ ↓Taille échantillon => Écart

Reproduction et diffusion interdite sans accord des auteurs.34

Le calcul du nombre de sujets nécessaire dans une étude épidémiologique descriptive transversale

Page 35: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

Remarque

On n'améliore pas la validité de la mesure (ou en d'autres termes on ne diminuepas le biais ou l'erreur systématique) en augmentant la taille d'un échantillon. Eneffet, si on utilise une balance mal tarée pour mesurer le poids moyen des sujetsd'un échantillon afin d'en déduire le poids moyen d'une population, la déduction dupoids moyen de la population cible sera biaisée par mauvaise tare de la balance(erreur systématique ou biais de mesure). En augmentant le nombre de personnesdans l'échantillon, on n'améliorera pas la validité de la mesure du poids (il y auratoujours ce problème de tare); en revanche on améliore à la fois la reproductibilitéet la précision (la variance sera réduite, l'erreur aléatoire sera diminuée).

2. Formules pour calculer la taille d'un échantillon aléatoiresimple

Préambule : Les formules approchées pourront être utilisées si et seulement si :

� les échantillons sont suffisamment grands ;

� les populations d'étude sont suffisamment grandes.

a) Quand la variable à mesurer est qualitative

Formule exacte

nz/2

2 N P 1P

N12 P 2z/22 P 1P

Formule approchée

nz/2

2 1P

2 P

Dans les formules : P est la proportion attendue dans la population N est la taille de la population ε est l'écart toléré à la proportion zα/2 est lu dans la table de la loi normale centrée réduite, pour une valeur de α égaleau risque d'erreur consenti

b) Quand la variable à mesurer est quantitative

Formule exacte

nz/2

2 N 2

z/22 2N12

Formule approchée

nz/2

2 2

2

Dans les formules : σ² est la variance de la variable dans la population N est la taille de la population ε est l'écart toléré à la moyenne zα/2 est lu dans la table de la loi normale centrée réduite, pour une valeur de α égaleau risque d'erreur consenti

Reproduction et diffusion interdite sans accord des auteurs.35

Le calcul du nombre de sujets nécessaire dans une étude épidémiologique descriptive transversale

Page 36: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

D. Considérations pratiques

Lorsque plusieurs variables sont décrites sur une population, l'idéal est de calculerune taille d'échantillon pour chaque variable, et de choisir la plus grande d'entreelles pour déterminer le nombre de sujets à inclure. L'utilisation des formules de ce cours afin de calculer la taille de l'échantillon pourune étude descriptive est une étape NÉCESSAIRE, mais insuffisante pour mener àbien la réflexion sur la taille de l'échantillon.

Complément

Les formules de calcul du nombre de sujets nécessaire sont en général insuffisantespour connaître le nombre de sujets à inclure en pratique dans une étude, en effet :

� Ces formules produisent l'estimation de la taille de l'échantillon pour :- Une étude descriptive. - Une population particulière. - Une puissance d'étude donnée, ou une précision.

� Les formules mathématiques ne prennent pas en compte certaines variablesd'ajustement.

� Ces formules produisent au mieux une estimation grossière : dans certainessituations, elles peuvent conduire à de mauvaises estimations. Par exempleces formules ne prennent pas en compte le rapport coût dépensé / précisiongagné pour chaque inclusion supplémentaire.

� Résoudre le problème du nombre de sujets à inclure ressort donc d'uneanalyse coût/bénéfice.

� Sachant que les bénéfices d'une étude sont liés à des facteurs politiques,sociaux et biologiques d'une grande complexité qui ne sont pratiquementjamais quantifiés.

En conclusion, si la détermination de la taille d'un échantillon pour une enquêtedescriptive peut être réalisée à partir d'une formule mathématique, le choix final,l'effectif de sujets à inclure, doit tenir compte de considérations pratiques nonquantifiables.

E. Conclusion

Dans ce cours, les éléments nécessaires au calcul du nombre de sujets à incluredans une étude descriptive transversale vous ont été présentés selon la précisionattendue sur le paramètre estimé (proportion ou moyenne). Il est égalementpossible de calculer un nombre de sujets nécessaire à inclure dans un étudedescriptive longitudinale visant à estimer le taux d'incidence d'une maladie. Lesformules pour ce calcul n'ont volontairement pas été exposées dans ce cours. Ellessont en effet très complexes, et seront envisagées ultérieurement. Toutefois, sivous êtes intéressés par ces formules, vous pouvez vous reporter aux références enfin de cours pour les retrouver.

Reproduction et diffusion interdite sans accord des auteurs.36

Le calcul du nombre de sujets nécessaire dans une étude épidémiologique descriptive transversale

Page 37: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

IV - Les méthodes ettechniques de basedu recueil dedonnées dans uneenquêteépidémiologique

IV

Introduction 37

Le recueil des informations 37

Le bordereau de recueil 39

A. Introduction

Le recueil des données se prépare dès la rédaction du protocole de l'enquête. Laqualité de cette démarche dépend directement de la pertinence et de la qualité del'information sur laquelle elle s'appuie. Il est par conséquent essentiel de s'assurertout au long de cette étape que les informations que vous souhaitez recueillir sonten adéquation avec l'objectif de l'enquête, et que les informations que vous allezrecueillir sont bien celles que vous voulez réellement obtenir.

B. Le recueil des informations

1. Objectifs et contraintes

Il existe des liens étroits entre le protocole d'échantillonnage et l'enregistrementdes données, avec le mode de recueil et avec le choix des indicateurs en fonctiondes objectifs, des contraintes et des critères de qualité imposés. L'objectif de l'enquête conditionne toujours la nature des informations àrecueillir.

Exemple

Exemple 1 : Si l'objectif est de décrire le comportement tabagique des footballeursprofessionnels évoluant en France, les informations à recueillir porteront sur :

Reproduction et diffusion interdite sans accord des auteurs.37

Page 38: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

� le profil sociodémographique et sportif des sujets échantillonnés (âge, sexe,ancienneté de la carrière sportive,...),

� le comportement tabagique (statut tabagique, type de consommation,durée,...),

� l 'environnement du sportif (présence de fumeurs dans l'environnement),

� les attitudes du sportif vis-à-vis du tabagisme,

� les connaissances que le sportif a des conséquences du tabagisme sur lasanté.

Il s'agira principalement de données déclaratives. On peut également prévoir pourles fumeurs un test de dépendance au tabagisme, sous condition que ces derniersacceptent de s'y soumettre (test de Fagerstrom par exemple).

Exemple

Exemple 2 : Si l'objectif est d'estimer la prévalence d'une maladie, en plus d'informations sur leprofil des sujets enquêtés, l'investigateur aura besoin d'informations de naturebiologique et clinique recueillies par une équipe médicale pour confirmer laprésence de cette maladie. Dans ces deux exemples, l'investigateur est confronté à des contraintes liées auxmoyens disponibles et à la qualification du personnel mis à sa disposition. A quelmoment pourrez-vous recueillir ces informations ? Certaines informationsnécessitent-elles de faire appel à un médecin, une infirmière ? etc. En résumé, il faut s'assurer que les informations recueillies permettront à l'enquêtede répondre à l'objectif fixé d'une part, et que l'on dispose des moyens nécessairespour les recueillir.

2. Exercice avec corrigé - Le recueil des informations

Vous êtes chargé d'organiser et de planifier une enquête dont l'objectif estd'estimer la prévalence du surpoids et de l'obésité chez les enfants scolarisés enclasse de cours moyen 1ère année en Lorraine. A partir de cet objectif, répondezaux deux questions suivantes :

Q u e s t i o n [Solution n°2 p 50]

1- Quelles informations comptez-vous recueillir ? (10 maximum)2- Quelles sont les contraintes dont vous devrez tenir compte ?

3. Critères de qualité propres à la mesure

Toute mesure doit répondre à des critères de qualité qui lui sont propres. Parcritère de qualité, on entend :

� l'exactitude,

� la sensibilité et la spécificité de la mesure,

� la reproductibilité,

� l'universalité,

� l'objectivité,

� et l'acceptabilité qui dépend des individus enquêtés, de la nature desinvestigations menées et de la présentation générale de l'enquête.

Ces critères seront développés dans l'unité d'enseignement "Recherche clinique et

Reproduction et diffusion interdite sans accord des auteurs.38

Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique

Page 39: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

épidémiologique" au 2ème semestre.

4. Type de données

Les variables recueillies peuvent être quantitatives ou qualitatives. Une variable est dite quantitative lorsque la valeur mesurée sur chaque individureprésente une quantité (exemples : le poids (en kg), la taille (en cm), etc.). Une variable est dite qualitative lorsque la valeur mesurée sur chaque individu(parfois qualifiée de catégorie ou de modalité) ne représente pas une quantité. Elleest peut qualifiée de « nominale » lorsque les modalités de réponse ne sont pashiérarchisées entre elles (exemple : la couleur des cheveux) ou « ordinale » lorsqueles modalités le sont (exemple : totalement insatisfait, plutôt insatisfait, plutôtsatisfait, totalement satisfait).

C. Le bordereau de recueil

Le bordereau est un outil qui répond aux besoins de l'enquête, il doit apporter uneréponse à l'objectif de l'enquête et être sous la forme la plus adaptée à lapopulation enquêtée. Quelques éléments clés :

� La construction du bordereau démarre après avoir balayé les différentsdomaines d'intérêt par rapport à l'objectif qui a été fixé.

� Chaque item qui compose le bordereau ne doit véhiculer qu'une seuleinformation ou idée à la fois.

� Le bordereau de recueil se compose d'informations techniques,d'informations propres à l'enquête/ l'étude (caractéristiques des sujetsenquêtés, indicateurs de maladie, indicateurs d'exposition, indicateurscomportementaux, indicateurs psychologiques, sociologiques, etc.)

Un effort particulier doit être fait sur la présentation, et il doit être, si nécessaire,validé par des experts du domaine exploré, et faire l'objet d'un pré-test avant sonutilisation. Le pré-test consiste à tester préalablement le bordereau auprès d'unpetit groupe de personne dans le but de vérifier son acceptabilité.

1. Construction d'un bordereau

La construction d'un bordereau se déroule en plusieurs phases : phase préliminaire,informations techniques, identification, données de vérification, informationspropres à l'enquête, types de questions.

a) Phase préliminaire

i - Revue de la littérature

La revue de la littérature est essentielle pour s'assurer du bien fondé de votre étuded'une part et pour recueillir toutes les informations nécessaires d'autre part. Ellepermet entre autre de s'assurer de la pertinence du thème abordé, d'identifier leshypothèses déjà testées et celles qui sont restent à tester, de connaître les typesd'enquêtes utilisées, les populations étudiées et le mode de recueil des données

Reproduction et diffusion interdite sans accord des auteurs.39

Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique

Page 40: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

auquel ont eu recours les autres équipes.

ii - Avis d'experts

Le recours à l'avis d'un ou plusieurs experts est souvent nécessaire pour valider lesorientations prises, le choix de certains indicateurs et leur pertinence au regard del'objectif fixé.A l'issu de cette phase préliminaire, il convient de sélectionner les questions les pluspertinentes parmi le panel de questions possibles identifiées.

b) Informations techniques

Les informations techniques qui figurent sur le bordereau concernent des donnéesd'identification, des données de vérification de l'échantillonnage et du recueil del'information.

i - Données d'identification

Elles sont indispensables pour identifier les unités qui font l'objet de l'enquête :l'individu, le service hospitalier, la classe de l'élève ; et les séquences du recueil del'information : sujet, enquêteur, lieux, moment de la mesure. Les données d'identification doivent respecter les règles de confidentialité : lesdonnées fournies à l'enquêteur ou à l'épidémiologiste doivent impérativement êtreanonymes, sauf cas particuliers ayant une autorisation des instances compétentes(CCTIRS, CNIL, ...). Ni le bordereau de recueil, ni le fichier informatisé ne doit fairemention du nom ou du numéro national d'identité. Attention, certaines informations peuvent être indirectement nominatives (initialesdu patient, date de naissance, ...). Exemple d'identification

ii - Données de vérification de l'échantillonnage

Les critères d'inclusion et/ ou d'exclusion prévus dans le protocole de l'étudedoivent faire l'objet d'un recueil particulier, tout comme l'appartenance de l'individuà une strate donnée.

-

Reproduction et diffusion interdite sans accord des auteurs.40

Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique

Page 41: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

iii - Données sur le recueil de l'information proprement dit

Les conditions du recueil imposées par le protocole doivent également faire l'objetd'un recueil particulier. Exemple : un prélèvement doit être réalisé dans desconditions particulières X (à jeun), le jour J, par la méthode Y, geste effectué par lemédecin n°1 (respecter l'anonymat). Il est enfin recommandé de remplir un bordereau pour chaque non réponse quandcela est possible pour suivre le taux de répondeur et décrire les motifs associés auxnon réponses.

c) Informations propres à l'enquête

Les informations propres à l'enquête sont comme leur nom l'indique propres àchaque enquête et sont étroitement liées aux objectifs fixés.On distingue notamment :

� Les indicateurs de maladie comme le diagnostic clinique de la maladie, lesparamètres biologiques, les causes du décès. Il est recommandé d'utiliserdes classifications internationales pour garantir la comparabilité des études(CIM 10 et Classification Internationale du Fonctionnement et de la santé del'OMS, ,DSM IV pour les troubles mentaux).

Exemple d'enregistrement de maladie :

-

Reproduction et diffusion interdite sans accord des auteurs.41

Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique

Page 42: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

� Les indicateurs d'exposition regroupent des indicateurs collectifs(environnement physique, indicateurs locaux – climat), des indicateursindividuels observés (environnement proche, alimentation), déclarés(connaître le passé, les habitudes de vie, ...), des indicateurs génétiques oubiologiques d'exposition (polluants, marqueurs de vitamines), etc.

� Les indicateurs psychologiques, sociologiques comme les activités de la viequotidienne, le bien-être, la qualité de vie, l'anxiété, les stratégiesd'adaptation, ...

d) Types de questions

Selon la nature des informations à recueillir, les questions (ou items) peuventprendre deux formes : soit ouvertes, soit fermées.

i - Questions ouvertes

La réponse obtenue est libre. Les réponses ouvertes sont recommandées lorsquel'investigateur explore un domaine non maîtrisé. Les avantages :

� elles fournissent des informations riches et diversifiées,

� elles peuvent servir de base pour la formulation d'une palette de réponsespossibles pour les questions fermées.

Les inconvénients :

� elles sont délicates à formuler,

� elles peuvent engendrer des réponses vagues ou à côtés du sujet,

� elles fournissent des réponses parfois longues et difficiles à exploiter.

ii - Questions fermées

Le choix des réponses est fixé à l'avance. Elles peuvent prendre différentesformes :

� dichotomique ou binaire (oui/ non),

� à plus de deux modalités de réponses,

� à réponse unique ou à choix multiple,

� avec classement ou situation sur une échelle (EVA par exemple)

� attention au « faux » intérêt de la modalité « Autre » pour laquelle unemention « précisez » doit être proposée.

Elles peuvent être formulées à partir d'une question ouverte :

� cela nécessite une analyse fine et structurée du contenu des réponses à laquestion ouverte,

� la remplacer par une question fermée nécessite de formuler des modalitésde réponse pertinentes qui couvrent suffisamment le contenu des réponses àla question ouverte.

Elles peuvent présenter des catégories de réponses exhaustives et mutuellementexclusives :

� toutes les possibilités de réponses sont présentes,

� chaque réponse ne peut donc se situer que dans une seule catégorie. Leurs avantages :

� elles sont faciles à administrer et à interpréter,

� elles constituent une aide à la mémoire et à la réflexion du répondeur,

� elles permettent les comparaisons,

Reproduction et diffusion interdite sans accord des auteurs.42

Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique

Page 43: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

� elles reflètent la variété et la richesse des propositions de réponses. Leurs inconvénients :

� en étant trop restrictives, elles peuvent engendrer une perte d'informations,

� elles risquent d'induire des choix de réponses peu réfléchis et entachés dedésirabilité sociale (considéré comme « bien » ou « positif » dans lasociété),

� elles peuvent être difficiles à rédiger,

� elles peuvent être trop restrictives, et ne pas mentionner toutes lesréponses possibles.

Remarque

Evitez un nombre de modalités de réponses impair, la modalité centrale risquant dese transformer en modalité « refuge » : « ni pour / ni contre », « ni bon / nimauvais », « ni satisfait / ni insatisfait », etc.

2. Organisation et présentation du bordereau (mode depassation)

a) Structure du bordereau

i - Longueur du bordereau :

La longueur du bordereau dépend du thème abordé par l'étude et du temps allouépour y répondre ou disponible pour le remplir. Il n'y a pas de longueur idéaledéfinie. Pour ne pas décourager l'enquêteur ou le répondeur, il faut veiller à ce que lequestionnaire ne comporte pas trop de questions. Pour limiter le risque de lassitude du répondeur, il faut veiller à ce que le temps deremplissage n'excède pas 30 minutes ; au-delà, la qualité des réponses peut enpâtir. Comme nous l'avons déjà mentionné en début d'exposé, il est impératif de prendreen compte les contraintes propres à l'enquête.

ii - Place des questions d'identification :

Elles sont positionnées au début ou à la fin du bordereau. Certains auteursrecommandent de les placer au début pour mettre en confiance la personneenquêtée.

iii - Ordre des questions :

L'enchaînement des questions doit être le plus naturel possible, sans rupture. Lerisque pour l'enquêté est de « perdre le fil de ses pensées », trop de va-et-vientrisquent d'altérer les réponses. Il est important de doser le niveau de difficulté des questions :

� du général au particulier,

� du simple au compliqué.

iv - Formulation des questions (items) :

Voici quelques recommandations à respecter concernant la formulation desquestions :

� la formulation doit être accessible à tous (niveau enfant de 10-12 ans pourune enquête chez les adultes), la personne enquêtée doit pouvoir répondre

Reproduction et diffusion interdite sans accord des auteurs.43

Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique

Page 44: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

sans aucune difficulté,

� le niveau conceptuel ne doit pas être trop abstrait,

� le vocabulaire employé doit être simple et familier (attention aux termestrop techniques),

� évitez les mots à plusieurs sens, les formes grammaticales peu claires(double négation),

� précisez le cadre de référence (l'unité par exemple),

� posez des questions neutres pour ne pas influencer l'enquêté,

� évitez les questions chargées.

b) Présentation du bordereau

Le bordereau doit être accompagné, si nécessaire, d'une lettre d'information quiprésente l'enquête et son ou ses objectifs.La mise en page doit être claire et la présentation du bordereau soignée :

� prévoyez un titre, des transitions si nécessaire,

� numérotez les questions, - formulez des explications simples pour leremplissage,

� si le bordereau contient plusieurs pages, prévoyez le maintien duquestionnaire (agrafes, spirales, etc.) et la numérotation des pages,

� enfin, dans le cadre d'un entretien ou d'un questionnaire auto-administré,n'oubliez pas d'adresser vos remerciements pour la participation.

3. Modes de passation

Le choix du mode de passation va conditionner la présentation générale dubordereau et la formulation des questions.Le bordereau peut être auto-administré, administré par un enquêteur en face-à-face ou utilisé comme simple grille de recueil lorsque les informations sontcollectées à partir de dossiers médicaux par exemple.

a) Auto-administration

i - Ce mode de passation est très sensible à la qualité duquestionnaire :

� les questions et les instructions doivent être écrites et formulées enconséquence,

� la présentation générale et la mise en page doivent être particulièrementsoignées pour donner « envie » d'y répondre,

� la lettre d'introduction doit également faire l'objet de toutes les attentions aumoment de sa rédaction, la clarté et la précision de l'information sontcruciales (ne pas hésiter à faire relire cette lettre par plusieurs personnesavant usage).

ii - Les avantages :

� il est moins coûteux,

� il permet de toucher une population cible plus large,

Reproduction et diffusion interdite sans accord des auteurs.44

Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique

Page 45: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

iii - Les inconvénients

� un taux de non réponse plus élevé,

� une auto-sélection,

� moins de réponses de bonne qualité, très dépendant de la compréhensiondes questions, de la capacité à répondre,

� ne permet pas de garantir que la personne sollicitée est bien celle qui arépondu (fréquent dans un foyer).

Pour améliorer le taux de retour, joignez au questionnaire une enveloppeaffranchie, prévoyez des relances téléphoniques ou postales (attention à adapter lecontenu de la lettre d'information qui accompagne le questionnaire) et danscertains cas, mentionnez les intéressements s'il y en a. Le répondeur peut aussi bien être un individu tout venant, un patient ou unprofessionnel de santé. → le pré-test de l'auto-questionnaire est vivement recommandé.

b) Interrogatoire par un enquêteur

i - Ce mode de recueil implique la formation de l'enquêteur/trice

L'enquêteur doit être sélectionné et préalablement formé. Il doit être motivé,correctement informé du déroulement de l'enquête, de ses objectifs et de sonintérêt. Il doit aussi faire l'objet de contrôles pour vérifier la qualité de son travail.Le principal risque est l'influence qu'il peut avoir sur la réponse aux questions.

ii - Le bordereau doit être adapté

Une attention particulière doit être portée à la standardisation du questionnaire et àses modalités d'utilisation pour éviter « l'effet » enquêteur. Les consignes doiventêtre claires et différentiables des questions.

iii - Les avantages :

� moins de refus,

� des réponses de meilleure qualité,

� moins de réponses manquantes.

iv - Les inconvénients :

� plus coûteux que l'auto-administration,

� risque d'orienter les réponses.

4. Quelques remarques sur la forme

� Il est recommandé d'utiliser des cases à cocher bien disjointes pour éviterque la croix ne se trouve à cheval sur deux modalités :

-

Reproduction et diffusion interdite sans accord des auteurs.45

Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique

Page 46: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

� Les réponses de type « oui/ non » sont sans ambiguïté :

-

Reproduction et diffusion interdite sans accord des auteurs.46

Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique

Page 47: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

� En général, évitez les questions (items) mixtes :

� Préférez :

-

-

Reproduction et diffusion interdite sans accord des auteurs.47

Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique

Page 48: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

� La forme guide souvent la réponse :

5. Qualité du recueil de l'information

La qualité du recueil de l'information dépend comme nous l'avons vu du typed'informations recueillies : délai écoulé entre la survenue de l'événement et lerecueil de l'information, importance de l'événement, nature de l'événement, ...ainsi que des caractéristiques des sujets interrogés, de l'interrogatoire et del'enquêteur.

6. Test (ou pré-test) et validation

C'est une étape trop souvent négligée, elle est pourtant recommandée. On l'appelle test, pré-test ou enquête pilote. Son objectif est de vérifier la faisabilitéde l'enquête, la pertinence et l'acceptabilité du bordereau de recueil (ouquestionnaire). Si des problèmes sont identifiés à ce stade, des ajustements sont possibles. Ce quiest oublié ou mal formulé est difficilement rattrapable ensuite. En pratique, ce test :

� s'effectue sur un petit groupe de personnes issues de la même populationenquêtée ou ayant des caractéristiques similaires,

� s'effectue dans les mêmes conditions que celles prévues pour l'enquête,

� permet de vérifier la formation des enquêteurs,

� permet de vérifier l'acceptabilité du contenu du bordereau à travers leniveau de compréhension des questions, la durée de passation, «l'impression » des personnes testées,

� permet de vérifier que les données recueillies sont celles nécessaires pourrépondre aux objectifs de l'enquête.

7. Conclusion

Préalablement au recueil de l'information, il convient de bien définir l'objectif del'enquête, d'analyser toutes les contraintes et définir les critères de qualité. Quant àla construction du bordereau, il s'agit d'un travail important, long et technique.

-

Reproduction et diffusion interdite sans accord des auteurs.48

Les méthodes et techniques de base du recueil de données dans une enquête épidémiologique

Page 49: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

Solution desexercices de TD

> Solution n°1 (exercice p. 17)

Tableau 3 : -

Strate

500 100 0,2 10 10,00% 2,78%1300 200 0,15 100 50,00% 36,11%

Total 1800 300 110 38,89%

fi = ni/N

i pi = nifumeur/ni

Nombre d'élèvesdans la strate i

Nombre d'élèves

dans l'échantillon

pour la strate i

Fraction de

sondage

Nombre de fumeurs pour la strate i

Proportion de fumeurs

dans la strate i

Ni

ni

fi

nifumeur p

iN

ip

i/N

Lycée rural Lycée urbain

N= ΣNi

ps= Σ N ip i N

Reproduction et diffusion interdite sans accord des auteurs.49

Page 50: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

Au total, dans la population de laquelle est issu l'échantillon, on compte 1800élèves. L'échantillon comporte 300 élèves, dont 100 fumeurs. Lorsqu'on prend en comptela stratification sur le caractère rural ou urbain, la proportion de fumeurs est38,9%.

> Solution n°2 (exercice p. 38)

Réponse question n°1 Cette enquête implique de recueillir les caractéristiques socio-démographiques etanthropométriques des enfants pour définir leur statut pondéral : le poids, la taille,l'âge, le sexe. Dans le cadre d'une enquête de prévalence, la représentativité del'échantillon est primordiale pour permettre la généralisation du résultat. Outre lesinformations sur la localisation de l'école (urbain/ rural), des informations sur lesdéterminants du surpoids et de l'obésité peuvent également être recueillies :sédentarité, pratique d'une activité physique, etc. Vous pouvez enfin recueillir desinformations relatives au déroulement de la mesure sur le terrain, elles vouspermettront (1) de vérifier si les modalités du recueil se sont ou non écartées de laprocédure prévue (infirmière scolaire pour recueillir les donnéesanthropométriques, enfant accompagné ou non pour le remplissage des donnéessur les activités, etc.) et (2) de comprendre le niveau de participation à l'enquête(mesures effectuées dans le cadre de la visite médicale traditionnelle ouspécialement prévue pour l'étude, à quel moment dans la semaine, disponibilité ounon du matériel, etc.). Mais attention à ne collecter que les informationsvéritablement utiles à l'enquête. Réponse question n°2 Dans cette enquête, vous serez principalement confronté à des contraintes liéesaux caractéristiques de l'échantillon (enfants en classe de CM1) et aux moyensnécessaires à l'enquête (pèse-personne, toise, ...). S'agissant d'une enquêteréalisée en milieu scolaire, un accord préalable du rectorat de l'Académie concernéeest indispensable. De plus, si vous prévoyez de questionner les enfants scolarisés,sur leur activité physique par exemple, un accord préalable des parents doit êtreobtenu. Vous ne manquerez pas de rappeler aux parents le caractère anonyme del'enquête et les mesures qui pourraient être proposées en cas de repérage d'unenfant en surpoids ou obèse. Vous devrez vous appuyer sur une personnecompétente et autorisée à effectuer des mesures anthropométriques chez cesenfants (médecin, infirmière) et envisager avec cette dernière le moment opportunpour effectuer ces mesures, lors d'une visite médicale par exemple. Vous devrezégalement vérifier la disponibilité du matériel dans les écoles concernées et sinécessaire fournir les éléments manquants. Enfin, à l'issue de l'enquête, si vousrepérez des enfants en situation de surpoids ou obèses, vous devrez prévoir etproposer une prise en charge adaptée aux familles.

Reproduction et diffusion interdite sans accord des auteurs.50

Annexes

Page 51: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

Solution des Quiz

> Solution n°1 (quiz p. 11)

A. Sondage aléatoire simple

B. Sondage stratifié

C. Sondage en grappe

D. Sondage systématique

E. Méthode des quotas

> Solution n°2 (quiz p. 12)

A. Sondage aléatoire simple

B. Sondage stratifié

C. Sondage en grappe

D. Sondage systématique

E. Méthode des quotas

F. Sondage à 2 degrés

> Solution n°3 (quiz p. 12)

A. Sondage stratifié

B. Sondage en grappe

C. Sondage aléatoire simple

D. Sondage à 2 degrés

E. Sondage à 3 degrés

> Solution n°4 (quiz p. 12)

Reproduction et diffusion interdite sans accord des auteurs.51

Page 52: Chapitre 3 - École de santé publique - Nancy - formations · La justification de l'étude ... On veut mesurer la prévalence de l'accouchement prématuré en Côte d'Or en 2004

A. Sondage à 3 degrés

B. Sondage en grappe

C. Sondage aléatoire simple

D. Sondage stratifié

E. Méthode des quotas

Reproduction et diffusion interdite sans accord des auteurs.52

Annexes