60
ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De l’analyse de contenu à l’analyse lexicale

ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Embed Size (px)

Citation preview

Page 1: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

ANALYSE DES DONNEES

TEXTUELLES

Analyse des données textuelles.

De l’analyse de contenu à l’analyse lexicale

Page 2: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Situations et problématiques

Questionnaires ouverts

Interviews non directives

Bases documentaires

Ecrits, rapports….

Courriers documents transactionnels

Revue de la littérature

Recherches exploratoires

Exploration préalable à une étude quantitative

Contrôle qualitatif sur les enquêtes fermées

Contrôle rédactionnel

Voir des exemples en fin de diaporama

Page 3: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Questionnaires : un contexte structuré

Questions ouvertes

Introduction sans à priori

Précisions

Association d ’idées

Questions fermées

Identités

Opinions

Comportements

Page 4: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Les questions ouvertes

Questions Autres précisez

Suggestions ou compléments suite à une questions fermées

Question ouvertes introductives

Associations de mots

Le sens de la réponse est fixé par celui de la question

Les possibilité d ’expressions sont limitées par un cadre contraint

On contrôle les effets de la fermeture

On ouvre sur d ’autres conjectures

Page 5: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Des textes plutôt pauvres et bien situés

Le sens de la réponse

• est défini par celui de la question

Que diriez vous de …...

Texte

Contexte

Dans les questionnaire fermés le texte est Plutôt pauvre

Défini

Situé

Age

Sexe

Csp

•et situé par par l ’identité du locuteur.

Page 6: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Entretiens individuels avec relance par reformulation.

Entretiens collectifs avec prise de parole libre.

La démarche est exploratoire : laisser de la liberté à la conversation

L ’interview est structuré par les tours de paroles.

Les interventions sont plus ou moins riches et abondantes.

Un fil directeur peut structurer l ’ensemble.

Interviews non directifs, entretiens de groupe

Page 7: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Prise de paroles et liberté de la conversation

Interview non directif Entretien de groupe

Questions

Réponses

Animateur

Participants

Page 8: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Le monologue ou le récit

L ’absence de structuration enfouit le sens dans le texte

Page 9: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Recherches documentaires et bibliographies

Bases de données bibliographiques (Doc thèse, Electre…)

Collection de documents structurés (coupures de presse, annonces, messageries, pages html…)

Rapports

Textes libres, discours

Des corpus plus ou moins fragmentés et structurés :

Fragmentation marquée par la répétition.

Structuration marquée par la composition : rubriques, parties donnent une indication sur le sens du texte

Linéarité textuelle

Organisation implicite

Page 10: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

La complexité des données textuelles

Différents type de corpus

Complexité de nature

Complexité d'organisation

Complexité des éléments

Complexité et double langage

Page 11: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Corpus et texte

Répétitif

Non répétitif

Structuration forte (question, rubrique définissant le texte et son contexte)

Questions ouvertes dans questionnaires fermés. Bases de données documentaires, ou autre collections structurées

Document technique Document juridique

Structuration faible (locuteurs, statut de texte, contextes)

Interviews non directives Tables rondes Ensembles de documents structurés en partie Collections d’articles de presse

Pièce de théâtre

Pas de structuration

Collections non structurées : courriers, discours, romans…

Discours, roman….

En dernière analyse, l’analyse d’un corpus conduit

toujours à celle d’un texte monobloc définit par la structuration du corpus

Le corpus est l’ensemble des données dont on veut prendre connaissance

Page 12: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Complexité de nature

Signifiant

SignifiéSigne

Le double mouvement de la langue selon Ricoeur :

"l'un sépare le signe de la chose et le rapporte à d'autres signes dans la cloture du système linguistique, l'autre qui applique le signe à la réalité, le rapporte au monde et ainsi ne cesse de compenser le mouvement de la différence par celui de la référence".

(Saussure) (Pierce)

Page 13: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Complexité d ’organisation

Synonymie et polysémie : ‘nous avions vu des avions et des aéroplanes’

Mots, phrases, discours : le sens se forme dans l ’organisation des mots entre eux– mots : les sens du lexique– phrases : les contraintes de la syntaxe– discours : les effets du contexte et de la rhétorique

‘Le pilote ferme la porte’ (ferme-t-il la porte, ou porte-t-il fermement l’hotesse de l’air ? Seul le

contexte permet de le dire !)

Le langage est formé déléments au sens instable et relatif

Page 14: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Complexité des éléments

Formes graphiques : chaîne de caractères sans séparateur avfrds, pomme, terre

Mot : forme graphique signifiante pomme, terre Mot composés, locution : suite de formes graphique

assimilable à un mot pomme_de_terre, a_peu_près Expression : suite de mots revenant fréquemment

dans l’usage et faisant sens : de temps en temps, juste à temps

Des lettres (les caractères) aux lettres (la littérature) il faut passer par bien des mots !

Page 15: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Double articulation et ambiguité

Enoncé le contenu du message ou sens de surface

Enonciation le comportement ou sens caché

Ambiguité du langage et niveau de lecture

Viendrez vous ce soir à la fête que j’organise ?

Paul : Oui certainement

Pierre : Je n’y manquerai pas

Le sens de surface est le même il faudra compter avec au moins 2 invités.L’énociation indique que Paul sera un convive plus enjoué que Pierre. Celui ci redouble le négation pour dire oui !

Page 16: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Les stratégies d’analyse

Restituer le texte pour lecture : Verbatim

Lire et interpréter le texte pour codification : Analyse de contenu

Réduire le texte pour accélérer la lecture : Approximation lexicale

Coder ou mesurer le texte pour révéler ses structures cachées :Lexicométrie

Page 17: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Lire et interpréter

Lectures et commentaires

Extraits et citations

– Simplicité

– ..... mais subjectivité

Texte

Connaissance

Du commentaire composé à la technique de la citation, les classes de lycée…

Page 18: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Faire du verbatim, sélectionner des extraits

Restituer le texte

Extraire selon le contexte :

qui dit quoi ?

Extraire selon le contenu : avec quels mots

Texte

Connaissance

Extraits, verbatim

Contexte

Page 19: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Exemple d’extrait d’une base bibliographique

PARIS_9 :

n° 44 : APPLICATION DU MARKETING ET COMPORTEMENT DU CONSOMMATEUR DANS DES ENVIRONNEMENTS SPECIFIQUES. ; PRAS (BERNARD) ; 1993n° 181 : UNE ETUDE EMPIRIQUE DES EFFETS DE LA PERSONNALITE ET DES STYLES COGNITIFS SUR L'IMPLICATION DU CONSOMMATEUR ET SUR SES MANIFESTATIONS. ; PINSON (CHRISTIAN) ; 1992…...

PARIS_1 :

n° 353 : CONTRIBUTION A L'ETUDE DES LIAISONS ENTRE L'IMPLICATION DU CONSOMMATEUR ET SON ACTIVITE DE RECHERCHE D'INFORMATION PREALABLE A L'ACTE D'ACHAT . ; GREGORY (PIERRE) ; 1990n° 685 : LES SERVICES DE LA DISTRIBUTION DU MEUBLE ET LE COMPORTEMENT DU CONSOMMATEUR. ; NGUYEN HUU CHAU ; 1987n° 751 : L'INFLUENCE DE LA MARQUE SUR LE COMPORTEMENT DU CONSOMMATEUR. ; LASSEGUE (PIERRE) ; 1986

GRENOBLE_2 :

n°1043 : LE COMPORTEMENT DU CONSOMMATEUR D'ENERGIE DOMESTIQUE. ; JOLIBERT (ALAIN) ; 1983n°1192 : UNE APPROCHE INTERPRETATIVE A L'ETUDE DU COMPORTEMENT DU CONSOMMATEUR. ; JOLIBERT (ALAIN) ; 1982n°1316 : VALEURS RELATIVES DES ELEMENTS D'INFORMATION DANS LE PROCESSUS D'EVALUATION DES PRODUITS PAR LE CONSOMMATEUR: UN MODELE CONCEPTUEL ET VERIFICATIONS EMPIRIQUES. ; JOLIBERT (ALAIN) ; 1982….

Sélection :

consommateur

Structuration :

Trié par université

On s’intéresse aux recherches sur le consommateur et aux universités où elles se déroulent

Page 20: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Analyse de contenu

Lire et découper

Construire une grille thématique et la documenter

Evaluer et comparer les thèmes

Plus objectif, ... mais lourd et fastidieux

Texte

Connaissance

Thématique

Page 21: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Exemple d’analyse de contenu

Réponses à une question ouverte dans un questionnaire web

Analyse de récits produits à partir d’un test projectif

Une première analyse permet d’établir le modèle de codage grâce auquel on repère les thèmes. (code book)

Page 22: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Approximation lexicale : les principes

Du corpus au lexique : réduire l'effort de lecture

Du sens de surface, aux actes de langage

Une nouvelle lecture

Texte, corpus

Lexique

Remplacer la lecture du texte par celle de ses subsituts lexicaux

Page 23: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Les fondements épistémologiques

• Parmi leurs nombreux apports :

• Les actes de langages

• Les modèles cognitifs

Page 24: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

L'acte de langage (Searl, Austin...)

Etudier l'énonciation comme processus de décision

Actes de langage, les facteurs de l’énonciation

mot, acte de langage

les objets du monde

les habitudes socialesla variété individuelle

la langue qu’on parle

Page 25: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Modèles mentaux, la structure des l’énoncés

Nos modèles mentaux

Structurent nos énoncés

... qui portent la trace de ces modèles

Corpus

?

Page 26: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Les énoncés : de quoi s’agît-il ?

Découvrir les mots clé

Mettre à jour les convergences thématiques

Page 27: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Approcher les énoncés par le lexique

Découvrir les mots clés : Lexique brut, mots outils et lexique réduit. (mots outils = sans signification particulière : articles, pronoms….. )

Soulever les ambiguités : Lexique lemmatisé. (lemme : forme racine d’un mot; masculin singulier pour un nom ou un adjectif, infinitif pour un verbe)

Concentrer l’attention : lexique catégorisé; les noms, les verbes les adjectifs. (les noms décrivent les objets du monde, les verbes les actions et les adjectifs les évaluations…)

Repérer les rigidités du langage : les segments répétés (les formules toutes faites, la langue de bois….)

Agréger en champs sémantiques : les dictionnaires thématiques (on réduit encore la variété lexicale pour parvenir au niveau des concepts : habitation = villa=maison= logement =domicile…)

Page 28: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Exemple de lexiques : si vous gagnez au loto

je 1182 j 653 de 613 une 566 en 464 à 412 le 385 des 362 un 362 maison 355

Lexiquemaison 355 enfants 286 voiture 196 voyage 192 ferais 182 voyages 158 achèterais 150 famille 122 argent 118 acheter 115

Lexique réduit

maison 363 faire 357 acheter 350 voyage 311 enfant 288 placer 237 voiture 197 donner 187 voyager 147 aider 122

Lexique lemmatisé

10 mots couvrent 31% du corpus

Si vous gagniez au loto que feriez vous (990 réponses) ?

Page 29: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Verbesacheter 350 placer 195 donner 187 voyager 148 aider 122 partir 91 travailler 91 profiter

81 investir

76 changer 63

Nomsmaison 354 voyage 310 enfant 259 voiture 194 argent 118 famille 117 monde 81 don 75 vacance 79 placement 71

Adjectifsbeau 72 petit 41 humanitaire 32 grand 29 bon 26 immobilier 19 tout 13 nouvel 12 personnel 11 gros 8

Si vous gagnez au loto : lexiques catégorisés

acheter maison : 140placer argent : 59faire voyage : 55arrêter travailler : 52

tour monde : 50faire profiter : 44donner enfant : 40acheter voiture : 37

Segments répétés

Page 30: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Concordances et associations lexicales

Mettre en évidence les variations sémantiques en examinant le contexte des mots : lexiques relatifs.

Mettre à jour les réseaux sémantiques et modèles mentaux : AFC et cartes cognitives.

Page 31: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Variations sémantiques : le texte en contexte

Plus que ne l'imaginent les acteurs politiques, les responsables économiques, les intellectuelsje constate que les rouages politiques, économiques et sociaux de notre pays sont atteintsLe milieu politique donne aux Français le spectacle d'un interminablevolontiers tous les responsables politiques dans le même panierl'existence d'une alternative politiquece peu de marge à la décision politique

Concordances

pivot -2 à -1 pivot +1 à +2261 mots-355 occ 150 mots-351 oc

être-V 17 être-V 13volonté-N 7 économique-A11Europe-P 5 avoir-V 7pouvoir-N 5 commun-A 6action-N 4 social-A 6décision-N 4 contractuel-A 5responsable-N 4 étranger-A 4véritable-A 4 européen-A 4

pouvoir-V 4

Lexiques relatifs

pivot : politique

Page 32: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Les thématiques d’un discours de réforme

Axe 1 (11.2%)

Axe 2 (9.7%)

aller

%

réforme

impôt

faire

impôt_sur_le_revenu

année

baissebaisser

famille

franc

payerrevenu

salaire

donner

taux

cinq

créer

exemple

parler

retraite

travailler

venir

an

baisse_des_impôt

cotisation

deuxenfant

gagner

proposer

raison

salarié travail

vouloir

Csg

épargne

mettre

ministre

parlement

pays

revenu_du_capitalsécurité_social

vivre

Discours du Premier Ministre 199(analyse factorielle des correspodances sur le haut du lexique lemmatisé et réduit.

Page 33: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

L ’énonciation :comment parle-t-on ?

Caractériser l’expression : – volume, – richesse, – complexité…

Caractériser la communication et le style :– modalisation– embrayage..

Page 34: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Focus groupe sur les marques9 participantes

Corpus : 21 565 formes

Lexique : 2 067

Répétition : 10,43

Focus groupe : mesures d’énonciation

Les embrayeurs

Sans surprise, l’animatrice sur utilise le vous Geneviève a un fort égo, marqué par un usage intensif de j et je ….

Page 35: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Analyse de discours et communication

Dynamique du discours.

Le texte a été découpé en 5 parties de taille égale. Une AFC montre qu’il se développe conformément aux règles de la réthorique :

La dernière partie revient sur les thèmes présentés en premier lieu, après développement consacré aux différents points du discours

Elocution et communication

Les phrases sont plus courtes en début et fin de discours, le recours aux chiffres croit régulièrement sans jamais être abandonné. L’usage du ‘je’ marque l’engagement du début et de la fin, l’adresse se fait au ‘vous’ de l’audience qui disparaît avec l’avancée du disours !

Discours du Premier Ministre 1995

Page 36: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Analyse contingente :qui dit quoi?

Analyse des énoncés : spécialisation thématique.

Analyse de l ’énonciation : distinction stylistique.

Par rapport à l’identité du locuteur : qui dit quoi ?

Par rapport à dautres données de contexte : dans quelles circonstances, pourquoi ?

Page 37: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

... dans leur contexte

Axe 1 (84.7%)

Axe 2 (8.5%)

acheter_maisonplacer_argent

faire_voyage

arrêter_travailler

tour_monde

faire_profiteracheter_voiture

aider_enfant

acheter_maison_voiture

maison_voiture

18-24

25-34

35-49

50-64 65+

donner_enfant

Qui dit quoi ?

Les segments répétés...

acheter maison : 140placer argent : 59faire voyage : 55arrêter travailler : 52tour monde : 50faire profiter : 44donner enfant : 40acheter voiture : 37aider enfant : 34mettre côté : 34

Si vous gagniez au loto que feriez vous (990 réponses) ?

L’AFC montre des différences significatives selon l’âge dans l’usage des ségments répétés.

Page 38: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Les cartes perceptuelles : le loto

Les associations lexicales révèlent les thèmes présents dans les réponses

Les spécificités selon le contexte : l’âge structure le contenu des réponses

Page 39: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Analyse de l’énoncé Analyse de l’énonciation

En fonction del’identité

Spécialisations thématique,jargons professionnels

Compétence et distinctionlangagière, sociolectes

Par rapport auxcomportementsou aux opinions

Contraintes situationnellesChaînage argumentatifs ou

idéologique.

Traces dans l’expressiondes comportements ou

opinions.

Les problématiques de l ’analyse contingente

Page 40: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Du texte à la mesure, du quali. au quanti.

Le texte est pris comme objet d’observation pour mesurer des comportement ou opinions dont il porte la trace .

Par exemple :

• la longueur d ’une réponse est prise comme indicateur de l ’intérêt porté à l ’objet de la question.

•la propension à utiliser le vocabulaire de la sécurité est un indicateur de l ’importance accordée à la sécurité.

On peut ainsi à partir de données textuelles construire des données analogues à celles recueillies par le truchement d’échelles d ’opinion.

Page 41: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Codification et mesures lexicales

Coder automatiquement le texte en fonction des mots utilisés

Mesurer l'énonciation : longueur, richesse, banalité

Evaluer les contenus par la mesure d'intensités lexicales

Corpus

Lexique

Variablesnominales

Variablesnumériques

Page 42: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Exemple : la communication interne

Insatisfactions

Propositions

Indicateur d'engagement proactif :lg (proposition) / lg (insatisfaction)

CATEGORIE

Ouvrier

Cadre

Maîtrise

Employé

ENSEMBLE

DiagnosticLg.

PropositionLg.

Engagement

60,52 33,04 0,86

45,24 22,67 0,72

61,07 26,15 0,60

57,18 27,35 0,53

56,65 27,61 0,68

La longueur des réponses donne une indication des insatisfactions (qu’est ce qui ne va pas dans l’entreprise ?) et de la capacité à s’engager (quelles propositions feriez vous ?)Le rapport (col.3) entre ces 2 mesures (col.2/col.1), montre que pour promouvoir le changement il faut mieux s’appuyer sur les ouvriers et et les cadres. Néanmoins quelque soit la catégorie les réponses sont plus longues pour critiquer que pour proposer.

Page 43: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Le retour au texte

Lexique

Approximation lexicale

Variables d ’origine lexicale

Analyse de données

Corpus

textuel

Extraits

Extraits

Extraits

Verbatim

Page 44: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Navigation lexicale

Citations Lexiques relatifs

Mots spécifiques

Page 45: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Verbatim sélectif

Rechercher les mots spécifiques selon le contexte

Phrases caractéristiques

....et résumés

Page 46: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Les logiciels

LE SPHINX LEXICA

SPAD T

ALCESTE

TROPES, NUDIST.....

Page 47: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Pour maîtriser Sphinx Lexica

Télécharger le mode opératoire de LexicaTélécharger le manuel

Consulter les exemples sur le site•Le rêve des français

•Présidentielles 1995

•Présidentielles 2002

Utiliser les données présentent dans le dossier Enquêtes du répertoire où le logiciel est installé. Voir Loto et dans le dossier Exemples voir Analyse de discours

Page 48: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Mettre en œuvre : les étapes

Découpages et annotations Réduction de la variété lexicale Recherche de classes thématiques fondées sur les

cooccurences Mise en évidence des spécificité lexicales selon

les éléments de contexte Modélisation du corpus : du textes aux

dimensions d’intensité lexicales.

Page 49: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Du corpus à la base de données : découpage annotations et balises

Séparateurs : fragmenter le texte– niveau 1 ^t :paragraphe– niveau 2 .?! : phrases– ......

Annotations : créer des variables de contexte– jalons : tous les fragments jusqu’au prochain jalon– marques : le fragment concerné– mots clés codés

Balises : utiliser les indications (balises) présentent dans le texte– Question, réponse pour les interviews non directives– Nom de l’intervenant pour les tables rondes– Rubrique pour une base de données bibliographique

Page 50: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Réduction de la variété lexicale

Lemmatiser, réduire et créer un nouveau corpus

Identifier les catégories grammaticales Rechercher les segments répétés, les lier et

créer nouveau texte Appliquer des dictionnaire ou un thésaurus

Page 51: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Recherche de classes thématiques Sélectionner les éléments pertinents du lexique réduit et

catégorisé Effectuer une AFC multiple : les zones de la carte indiquent les

thèmes du discours Construire la typologie classant les fragments selon les zones

thématiques de la carte Produire le verbatim caractéristique des thèmes

Si vous gagniez au loto. Les associations lexicales révèlent les thèmes présents dans les réponses

Page 52: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Caractériser le contexte - spécificités lexicales

Sélectionner les éléments pertinents du lexique réduit et catégorisé

Rechercher parmis ces éléments ceux qui sont spécifiques des catégories de contexte étudiées (surreprésentés dans ces catégories)

Produire la carte de zones de langage de chaque catégorie Illustrer avec les phrases caractéristiques de chaque contexte

Si vous gagniez au loto. L’âge structure le contenu des réponses (carte des spécificité lexicales)

Page 53: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Exemple : questions ouvertes

Provoquer la réponse la plus spontanée possible

Recueillir le contenu de la mémoire

immédiate

Faire approfondir la réflexion

Elaboration d ’un texte construit

Protocole d ’association de mots

Page 54: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Exemple : questionnaire ouvert

1. Citez les 5 évènements sportifs qui vous ont le plus marqué au cours de l'année 1992.

2. Pour vous suivre un évènement sportif c'est....Compléter en citant les mots qui vous viennent spontanément à l'esprit.

3. Si on vous dit sportif, quels noms de grands sportifs vous viennent spontanément à l'esprit

4. Citez 5 verbes qui selon vous expriment le mieux l'action des grands sportifs

6. Citez les 5 adjectifs qui vous viennent à l'esprit pour qualifier les sportifs de haut niveau.

7. Citez 5 marques qui dans votre esprit riment avec Sport

8. A votre connaissance quelles sont les marques qui pratiquent le plus le sponsoring sportif.

9. Citez les 5 adjectifs qui caractérisent le mieux les marques que vous venez de citer.

attributs attributs

Sportifs

Evénements

Marques

Signalétique individuelle

Phrases à compléter

Evocations spontanées

Association de mots

Image du sport et image de marque (Etude sur le sponsoring)

Page 55: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Exemple : recueil de pharses témoins

1. Sexe 1- Homme 2- Femme

2. Age 2- Moins 30 ans 2- 30 à 50 ans 3- Plus de 50 ans

3. Catégorie 1- Employé 2- Ouvrier 3- Cadre 4- Maîtrise

4. Considérez vous que l'information dans votre

société est : 1- Insuffisante 2 - Suffisante

5. Comment communique-t-on à l'interne dans votre société. Phrases témoins des dysfonctionnements

6. Quelles propositions formuleriez vous pour améliorer la communication interne ? Phrases témoins des améliorations envisagées

Les réponse aux questions ouvertes ne sont pas une transcription exacte des propos prononcés

La méthode des phrases témoins réalise un compromis entre interview non directif et questionnaire fermé

La communication interne

Page 56: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Exemple : Entretien de groupe

Animatrice: "....Mon rôle aujourd'hui c'est d'écouter tout ce que vous avez à dire, de vous aider à parler le plus librement possible, de vous proposer des méthodes, de vous proposer des thèmes de réflexion.……suivent 10 lignes d’introduction.Euh...On va a priori terminer vers 16h30, est-ce que ça va pour tout le monde ? est-ce que ...."

Catherine: " Pas plus tard !"

Geneviève: " Pas au-delà !"

Animatrice: "Pas au delà. A priori ça devrait tenir, si vous travaillez bien. ….. 3lignes

Catherine: "Oui, peu importe. Je m'appelle Catherine B......, je travaille à la bibliothèque de l'I.A.E. J'ai trente quatre ans. Ce que j'aime, là, comme ça spontanément, ça m'est difficile à dire, donc ça viendra peut-être dans le cours de la discussion, mais là, comme ça, je vois pas trop."

Animatrice: " Ok, est-ce qu'on tourne , ou est-ce que.....?"

Christine: " Oh, on va tourner, non ?"

Animatrice: " Oui."

Geneviève: " Geneviève C....., j'ai cinquante et un an, je suis orthophoniste... Mes goûts, non je peux pas les dire comme ça. On se

67 pages (times 12)

1271 paragraphes

3301 lignes

23 818 mots

Une animatrice et 8 participantes

1271 tours de paroles

14 périodes dans la table ronde

Le texte est balisé

balise

Page 57: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Exemple : Interview non directif

7 interviews de responsables techniques, commerciaux et administratifs

20 à 30 pages par interview

4 988 répliques

Question : 8 324 mots

Réponses : 71 501 mots

Entretien avec Philippe Michielin 28/04/98

Pouvez vous me présenter la situation telle que vous la voyez ?Les personnes qui sont chef de marché chez nous sont tout à fait nouveau dans cette mission là, peut-être à l'exception de Giletta, je ne sais pas si vous l'avez vu. Giletta avait exactement le même profil au ….10 lignesfacile. Donc là aujourd'hui le CDM est dans un pôle, spécifiquement, le directeur du pôle qui en est l'animateur, si il ne peut pas il délègue à un chef de marché, ce qu'à fait Raymond Charfolé, parce que lui il est aussi ...

Directeur commercial

Exactement. Moi je l'ai pas délégué, parce que c'est vraiment dans ma mission et Alain Capmas y a rajouté, et là aussi c'était un manque, une représentation commerciale. Ce n'était pas le cas auparavant. …12 lignesqu'au mois de juillet des Etats-Unis, donc il va falloir qu'il s'installe gentiment le pauvre et il sera efficace au plus tôt en septembre.

Quand vous dites le responsable, c'est au niveau du labo ?

Voilà. Parce que Alain avait du vous l'expliquer je pense il y a des laboratoires, dès qu'ils seront réunis, il y aura quand même des gens affectés aux différents pôles, et il y aura un responsable, il ne sera pas dans un bureau, parce que s'il y a un responsable pour deux chercheurs, il va chercher aussi. Mais il sera plutôt notre ….concurrents ils sont là depuis dix ans, bille en tête, alors que nous on change tout le temps, vous réfléchissez par exemple à un produit de ragréage et au bout de la deuxième réunion, il y en a un qui dit, en 1995, au mois de septembre, c'est exactement ce qu'on avait fait. Parce que les gens sont loin d'être cons ils ont à peu près le même savoir que nous mais voilà encore une dilution, des gens qui étaient partis ailleurs, qui sont plus là, c'est pas facile.

Et ça, vous avez l'impression que ça va un peu se stabiliser ...

J'ai pas l'impression, j'en suis sûr, si tant est qu'on ait une organisation pérenne , c'est ce que je dis et que par exemple la phase de présentation des plans marketing 99 qui doit se faire à mi-année 98 est un

recherche sur les processus d’innovation

Il faut introduire dans le texte les balises Q: et R: pour indiquer la structure du corpus

Q>

R>

Page 58: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Exemples sur le site du Sphinx

http://www.lesphinx-developpement.fr

•Le rêve des français•Présidentielles 1995•Présidentielles 2002

Page 59: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Exemple : Le rêves des français

Une question ouverte

6 questions fermées pour la signalétique

994 répondants pour un échantillon

représentatif des français

Le rêve des français

Page 60: ANALYSE DES DONNEES TEXTUELLES Analyse des données textuelles. De lanalyse de contenu à lanalyse lexicale

Exemples : Etudes quali sur le web

Question ouverte : Les qualités du présidents Campagne

Test projectif : Les différences culturelles Interculturalité

Réception des œuvre littérairesRéception

Décision de recrutementDécision

Education contre le racismeRacisme