24
Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de Clédat, Anne Papadopoulos et Nicolas Razafindratsima, et le service des enquêtes INED

Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

Embed Size (px)

Citation preview

Page 1: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

Comparaison des données de différentes sources dans l'enquête

Familles-Employeurs

Volet ménage-individu / Volet employeur / Répertoire SIRENE

Bernard de Clédat, Anne Papadopoulos et Nicolas Razafindratsima, et le service des enquêtes INED

Page 2: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

Plan de la présentation

1. Introduction

1.1. L’enquête « familles et employeurs »

1.2. Sources de données et problématique

2. Comparaison des données selon les différentes sources

2.1. Comparaison des données déclarées par le salarié et son employeur

2.2. Comparaison des données déclarées par l’employeur dans EFE et dans SIRENE

3. Conclusion

Page 3: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

1. Introduction

1.1 L’enquête « Famille et employeurs

• Etudier la conciliation entre la vie professionnelle et la vie familiale

• Enquête en 2 volets :

Ménage : 9 547 individus de 20 à 49 ans interrogés en face à face sur un questionnaire portant notamment sur les conditions de travail

Employeur : 2673 établissements de 20 salariés ou plus interrogés par voie postale ou par internet (questionnaire auto-administré)

Page 4: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

1. Introduction

1.2. Sources de données et problématique

Comparaisons possibles :

• Réponses volet employeurs EFE / Réponses volet ménage EFE (3050 individus travaillant dans 2673 établissements)

Remarque : Le volet ménage s’est déroulé en 2 vagues réparties sur 2004 et 2005 ; le volet employeur lui a succédé en 2 vagues sur 2005.

Mise en concordance automatique effectué par l’INSEE

Page 5: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

1. Introduction

1.2. Sources de données et problématique

Comparaisons possibles :

• Réponses volet employeur EFE / employeur SIRENE (uniquement 1679 établissements appariés)

SIRENE : Système Informatique pour le Répertoire des ENtreprises et des Etablissements créé en 1973

• Avantages : exhaustivité

• Inconvénients : mise à jour de la base suite par exemple à un changement d’activité voir une cessation

Remarque : base de données SIRENE correspondant à l’état en décembre 2005 (léger décalage possible)

Page 6: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

1. Introduction

1.2. Sources de données et problématique

Variables fournies par l’INSEE d’après le répertoire SIRENE :

• siren + nic = siret identifiant unique de l’établissement

• efets = effectif total de l’établissement comparable à ef_etab

• marchet = secteur (marchand, non marchand privé, non marchand public) comparable en regroupant les modalités de pubpriv

• nes16 = activité principale de l’établissement comparable à nes16

• siege = établissement siège ou non de l’entreprise non comparable à EFE

• fcest (date de cessation) + dreat (date de réactivation) + cexat (active ou non) = l’entreprise a cessé d’exister ou non

Page 7: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

1. Introduction

1.2. Sources de données et problématique

Divergences à différents niveaux pour des variables non imputées et ne prêtant pas à confusion a priori :

• Effectif total

• Secteur d’activité

Analyser les caractéristiques des individus et des établissements expliquant le degrés de cohérence

Construire un indicateur de cohérence des données provenant des différentes sources

Page 8: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

2. Comparaison des données selon les différentes sources

2.1 Comparaison des données salarié/employeur

• Construction de l’indicateur de cohérence des déclarations d’effectif total

Tableau croisé des tranches d’effectifs employeur / salarié (pourcentage)

Remarque : Comparaison effectuée sur 2743 observations renseignées dans les deux volets

Page 9: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

Choix de construction de 3 degrés de cohérence :

- Cohérence totale (68,3 %) : même tranche

- Cohérence forte (23,1 %) : une tranche d’écart

- Incohérence (8,7 %) : au moins deux tranches d’écart

Remarque : Une tranche d’écart peut signifier un écart important

• Construction de l’indicateur de cohérence des déclarations d’effectif total

2. Comparaison des données selon les différentes sources

2.1 Comparaison des données salarié/employeur

Page 10: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

En fonction du statut public/privé (selon la déclaration de l’employeur)

Pourcentage de déclarations incohérentes plus élevé dans la fonction publique territoriale et le secteur public nationalisé

2. Comparaison des données selon les différentes sources

2.1 Comparaison des données salarié/employeur

• Etude des déclarations « incohérentes » concernant l’effectif total

Page 11: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

En fonction du statut public/privé et de l’écart

2. Comparaison des données selon les différentes sources

2.1 Comparaison des données salarié/employeur

• Etude des déclarations « incohérentes » concernant l’effectif total

On distingue 3 groupes

Page 12: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

•Etapes du codage de l’activité principale de l’établissement (nes16)

2. Comparaison des données selon les différentes sources

2.1 Comparaison des données salarié/employeur

Etapes du codage de la déclaration « en clair » de l’individu :

1. 1er codage effectué par l’INSEE intégré dans CAPI

2. Codage supplémentaire INED afin de retrouver la Nomenclature Economique de Synthèse en 16 postes adoptée par l’INSEE (nes16)

Codage de la déclaration « en clair » de l’employeur :

Codage INED à partir de la Nomenclature Economique de Synthèse en 16 postes adoptée par l’INSEE (nes16)

Page 13: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

• Etude des discordances fortes concernant l’activité principale

2. Comparaison des données selon les différentes sources

2.1 Comparaison des données salarié/employeur

Dans l’«Ind. des biens d’équipement », seulement 29, 4 % des déclarations de l’employeur correspondent à celles de l’individu

Exemples « types »

Page 14: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

• Etude des discordances fortes concernant l’activité principale

2. Comparaison des données selon les différentes sources

2.1 Comparaison des données salarié/employeur

Dans le secteur des «activités immobilières », seulement 40,7 % des déclarations de l’employeur correspondent à celles de l’individu

Exemples « types »

Page 15: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

• Etude des discordances fortes concernant l’activité principale

2. Comparaison des données selon les différentes sources

2.1 Comparaison des données salarié/employeur

Dans le secteur des «Services aux entreprises », seulement 40,1 % des déclarations de l’employeur correspondent à celles de l’individu

Exemples « types »

Page 16: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

• Construction de l’indicateur de cohérence concernant l’activité principale de l’établissement (nes16)

2. Comparaison des données selon les différentes sources

2.1 Comparaison des données salarié/employeur

Construction de la variable « Domaine » (10 modalités) à partir de nes16 et nes36

• Agriculture

• Industries

• Construction

• Commerce

• Transports

• Activités financières et immobilières

• Services

• Education

• Santé, action sociale

• Administration

Page 17: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

• Construction de l’indicateur de cohérence concernant l’activité principale de l’établissement (nes16)

2. Comparaison des données selon les différentes sources

2.1 Comparaison des données salarié/employeur

Choix de construction de 3 degrés de cohérence :

- Cohérence totale (69,89 %) : même activité

- Cohérence forte (8,97 %) : activité différente mais même domaine

- Incohérence (21,15) %) : domaine différent

Remarque : Comparaison effectuée sur 3045 observations renseignées dans les deux volets

Page 18: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

• Etude des discordances fortes concernant l’activité principale

2. Comparaison des données selon les différentes sources

2.1 Comparaison des données salarié/employeur

La plupart des données « incohérentes » peut finalement provenir des différences de déclaration et/ou de classement

Certaines modalités du pré-codage de l’INSEE ne trouvent pas de correspondance dans la nomenclature économique de synthèse

Difficulté à déterminer si les déclarations discordantes proviennent des caractéristiques des établissements et des individus (amalgame entre le secteur (public / privé) et l’activité, confusion entre la profession et l’activité, entre les différentes industries notamment pour « biens intermédiaires » et « biens d’équipement) ou du double codage

Page 19: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

1679 observations bien appariées 1567 observations comparables( 71 hors champs EFE + 41 tranches d’effectifs employeur manquantes)

•Etude de l’indicateur de cohérence des déclarations d’effectif total

2. Comparaison des données selon les différentes sources

2.1 Comparaison des données employeur EFE/SIRENE

Page 20: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

2. Comparaison des données selon les différentes sources

2.1 Comparaison des données employeur EFE/SIRENE

68 % appartiennent aux secteurs d’activité « Education, santé, action sociale » et « administration » (43 % sur l’ensemble du fichier) ;

63 % appartiennent au secteur public dont 55 % à la fonction publique d’état (10% sur l’ensemble du fichier) ;

Selon l’individu, 71 % des établissements ne sont pas les seuls de l’entreprise ou organisme pour lequel il travaille (57 % sur l’ensemble du fichier) ;

On retrouve en grande majorité des collèges, lycées et écoles

Remarque : 306 établissements (soit 19 % des établissements appariés) ont un effectif nul d’après SIRENE

Page 21: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

•Etude des établissements avec un effectif SIRENE différent de 0 (N = 1268)

2. Comparaison des données selon les différentes sources

2.1 Comparaison des données employeur EFE/SIRENE

Choix de construction de 3 degrés de cohérence :

- Cohérence totale (83,68 %) : même tranche

- Cohérence forte (12,93 %) : une tranche d’écart

- Incohérence (3,39 %) : au moins deux tranches d’écart

Page 22: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

•Etude des établissements avec un effectif SIRENE différent de 0 (1268) et montrant des incohérences au niveau des effectifs

2. Comparaison des données selon les différentes sources

2.1 Comparaison des données employeur EFE/SIRENE

Majorité d’établissements appartenant au secteur de la fonction publique territoriale

Sur estimation SIRENE par rapport à l’employeur

Etablissements gérés par la commune (crèches, écoles maternelles, mairies, conservatoire, etc.)

Page 23: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

1679 obs bien appariées 1608 obs comparables (71 hors champs EFE)

•Etude de l’indicateur de cohérence des déclarations d’activité principale

2. Comparaison des données selon les différentes sources

2.1 Comparaison des données employeur EFE/SIRENE

Page 24: Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de

3. Conclusion

Conséquences sur la pondération (effectif variable fondamentale)

Construction de la typologie au moyen par exemple d’une régression logistique ou d’une analyse factorielle

Notion de service, d’établissement, d’entreprise, de lieu de travail, d’établissement payeur, de SIRET, d’adresse, de nom

Problème de codages à partir de nomenclatures diverses mais aussi perception différentes de l’individu et de l’employeur

Pour la grande majorité des établissements les données sont cohérentes

Quand les données semblent « incohérentes », les raisons possibles sont les suivantes :

Si on accepte une certaine marge d’erreur :