30
Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données 4. Exemple de tableau EXCEL 5. Éviter d’éventuels problèmes

Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Embed Size (px)

Citation preview

Page 1: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

1

EXCEL et base de données

1. Variables et données2. Saisie de données: quelques règles3. EXCEL et saisie des données4. Exemple de tableau EXCEL5. Éviter d’éventuels problèmes

Page 2: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

2

1.1 Variables et données

• Les données correspondent aux valeurs des variables mesurées pour chacun des individus (ou patients).

• Les variables sont celles déjà prévues et décrites dans le protocole de recherche.

Page 3: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

3

1.2 Variables et données (suite)

• Les variables sont – pertinentes (si possible, éviter d’ajouter des variables

autres que celles prévues dans le protocole)– définies au plan opérationnelle

• instruments de mesures• codes pour les valeurs

– les codes sont déjà établis. Par exemple:

» AGE: en années (37, 64, …)» SEXE: F pour féminin, M pour masculin» Symboles pour valeurs N/A et valeurs manquantes» Etc.

Page 4: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

4

1.3 Variables et données

SOURCES DES DONNÉES: – les individus et/ou – les dossiers (médicaux ou autres)

Page 5: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

5

2. Saisie des données

Pour constituer la base des données, celles-ci peuvent être saisies– à l’aide de fiches ou formulaires en papier – à l’aide de logiciel

Page 6: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

6

2.1 Quatre petites règles (suite)

1. S’assurer de la fiabilité de la saisie des données:

– Pratiquer, si possible, une double saisie, en vérifiant les données qui sont non concordantes d’une saisie à l’autre.

– Simplifier le processus de saisie des données de sorte que la première phase de la saisie soit le plus près possible de la base de données finale.

– Éviter les transcriptions manuelles de transcriptions. Chaque transcription manuelle amène son lot d’erreurs. Par contre, les transcriptions électroniques, elles, sont sans erreur.

Page 7: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

7

2.2 Saisie des donnéesquatre petites règles

2. Recueillir l’information la plus fine possible

Exemple: si l’âge est mesuré en années,

– préférer enregistrer 36, 42, 53, etc.

plutôt que– entre 35 et 39– entre 40 et 45– entre 50 et 54– etc.

Page 8: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

8

2.3 Quatre petites règles (suite)

3. S’en tenir à l’information sur les variables de base

Exemple:

pour la variable IMC, les valeurs du poids et de la taille suffisent à sa mesure. Il n’est pas nécessaire de recueillir directement les valeurs de l’IMC ou d’en calculer sa valeur au moment de la cueillette de l’information.

Page 9: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

9

2.4 Quatre petites règles (suite)

4. Pour les variables qui réfèrent à la durée d’un phénomène, il est préférable

d’enregistrer directement les dates (ou temps) de début et de fin de ce phénomène, si ces dates (ou temps) sont disponibles

plutôt que

de calculer la durée puis d’enregistrer cette durée.

Page 10: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

10

3.1 EXCEL et saisie des données

• En vertu de la petite règle 4, il nous apparaît préférable d’utiliser un logiciel pour la saisie des données.

• Plusieurs logiciels sont disponibles:– SAS, SPSS, ACCESS, LOTUS, DBASE,

SPHYNX, EXCEL, etc.

• Notre préférence : EXCEL

Page 11: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

11

3.2 Logiciel EXCEL

• Logiciel– simple d’utilisation (contexte WINDOWS)– universellement connu– accessible– tableur efficient

• Nous limitons la présentation d’EXCEL au contexte de la saisie de données

Page 12: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

12

3.3 Logiciel EXCEL

• EXCEL se prête très bien à – la saisie des données – la transcription (exportation ou importation)

des données en format SAS, DBASE, SPSS, etc.

– la création de tableaux interactifs– des analyses statistiques– la création de graphiques

Page 13: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

13

3.4 Tableau EXCEL

Page 14: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

14

3.5 Tableau EXCEL (suite)

• Chaque ligne représentera un individu pour qui sont mesurées les variables.(La première ligne est réservée aux noms des

variables)

• Chaque colonne représentera les valeurs de la variable unique, identifiée à la première ligne et mesurée pour chaque individu (La première colonne, de préférence à toute autre, est

réservée à une nécessaire variable-identification des individus: numéro de dossier, numéro de randomisation, numéro séquentiel ou autre.)

Page 15: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

15

3.6 Tableau EXCEL (suite)

• La cellule au croisement d’une LIGNE et d’une COLONNE donne la valeur – de la variable (correspondant à la

colonne)

– pour l’individu (correspondant à la ligne)

Page 16: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

16

4.1 EXEMPLE Tableau EXCEL

Page 17: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

17

4.2 Exemple (suite)

• Dans le tableau:– 8 variables :

• IDN: identification de l’individu• AGE: âge • SEXE: sexe• TD: tension diastolique• TS: tension systolique• FUME: le fait de fumer• DATE: la date d’observation• HEURE: l’heure d’observation

– 10 patients: IDN=1, 2, 3, 4,…,10

• On remarque deux cellules vides: une pour TD du patient IDN= 5 et l’autre pour FUME du patient IDN=7

Page 18: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

18

5.1 Éviter d’éventuels problèmes

1. Pour désigner les variables:– utiliser des noms évocateurs:

(TD pour tension artérielle diastolique)

– caractères alphanumériques et _(TD1 ou TD_1 pour tension artérielle diastolique au

temps 1)

– éviter tous caractères spéciaux, accents, tels!, « , /, $, %, ?, &, *, (, ), +, =, <, >, ^, ç, #, {, etc.(Ne pas écrire ÂGE mais plutôt AGE)

Page 19: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

19

5.2 Éviter … (suite)

2. Pour coder les valeurs d’une variable:– si la variable est quantitative, le code est la valeur

numérique: AGE=37, TD=70, …– chaque valeur a un code unique:

(pour la variable SEXE, F et f sont considérés comme deux codes distincts)

– une valeur manquante est désignée par une cellule vide (voir diapositives 15 et 16)

– on s’assure du format de la cellule pour inscrire le type de donnée (voir dans le menu Format Cellule Standard, Nombre, Date, …)

Page 20: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

20

5.3 Éviter … (suite)

Page 21: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

21

5.4 Éviter … (suite)

2. Les formats de cellule les plus utilisés:– STANDARD pour les valeurs alphanumériques – NOMBRE pour les valeurs numériques (décimales

et valeurs négatives comprises)– DATE pour les dates

(format suggéré: 2009-10-27) (L’entrée 27 oct 2009 sera automatiquement convertie en 2009-10-27)

– HEURE pour le temps (format suggéré: 15:20 pour 15 heures 20 minutes

ou 15:20:35 pour 15 heures 20 minutes 35 secondes)

Page 22: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

22

5.5 Éviter … (suite)

3. Pour corriger la donnée d’une cellule, simplement retaper la donnée dans cette même cellule

4. Pour changer les codes d’une variable, utiliser dans Edition la fonction Remplacer

5. Pour ordonner les observations suivant une variable, cliquer sur la cellule où apparaît le nom de cette variable, puis dans le menu Données, cliquer sur Trier. (Le tri pour cette variable est automatiquement étendu à toutes les variables). Dans la petite fenêtre qui s’ouvre, on peut faire son choix sur le type de triage, croissant ou décroissant. On peut aussi choisir une deuxième, et même une troisième, variable pour un tri subordonné au premier. Puis, on clique sur OK. (Voir exemple de tri ci-après)

Page 23: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

23

5.6 Éviter … (suite)

6. En présence de plusieurs variables, on peut utiliser plusieurs feuilles-excel pour un même fichier, ce qui facilite la visualisation des données.

Dans ce cas, répéter sur chaque feuille la variable-identification des individus. Cette précaution facilitera une fusion éventuelle des feuilles en une même base de données

Page 24: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

24

5.7 Éviter … (suite)

7. Ne pas oublier – d’enregistrer régulièrement le fichier des

données recueillies– de faire quelques copies de sécurité de la

base de données

Page 25: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

25

Exemple de tri

• Référer à la base de données décrite à la diapo #16.

• Tri projeté:– Trier les données suivant la variable TS en

ordre décroissant, puis suivant la variable AGE en ordre croissant.

– Étendre ce tri à l’ensemble des données. (En d’autres termes il faut que le tri exercé sur ces deux variables tiennent compte de toutes les autres variables).

Page 26: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

26

Exemple … (suite)

1. Choix de la cellule de la variable TS

Page 27: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

27

Exemple … (suite)

Choix du type de tri pour TS et de la variable AGE

Page 28: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

28

Exemple… (suite)

Résultat

Page 29: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

29

Exemple … (suite)

Observations

• On observe dans ce nouveau tableau – que les valeurs de TS sont disposée en ordre

décroissant– que, pour les deux sujets (IDN=3 et 9) ayant

144 pour TS, la variable AGE est en ordre croissant, 37 puis 40

– que les valeurs de toutes les autres variables ont bougé en fonction de ces deux tris, (conservant ainsi intégralement les observations faites sur chacun des individus)

Page 30: Paul-Marie Bernard Université Laval 1 EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données

Paul-Marie Bernard Université Laval

30

Enfin,

Vous découvrirez bien d’autres trucs!

Pour commentaires, suggestions et questions, me rejoindre à:

Paul-Marie Bernard