1 / 24

Bernard de Clédat, Anne Papadopoulos et Nicolas Razafindratsima, et le service des enquêtes INED

Comparaison des données de différentes sources dans l'enquête Familles-Employeurs Volet ménage-individu / Volet employeur / Répertoire SIRENE. Bernard de Clédat, Anne Papadopoulos et Nicolas Razafindratsima, et le service des enquêtes INED. Plan de la présentation. 1. Introduction

madison
Télécharger la présentation

Bernard de Clédat, Anne Papadopoulos et Nicolas Razafindratsima, et le service des enquêtes INED

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Comparaison des données de différentes sources dans l'enquêteFamilles-EmployeursVolet ménage-individu / Volet employeur / Répertoire SIRENE Bernard de Clédat, Anne Papadopoulos et Nicolas Razafindratsima, et le service des enquêtes INED

  2. Plan de la présentation 1.Introduction 1.1. L’enquête « familles et employeurs » 1.2. Sources de données et problématique 2.Comparaison des données selon les différentes sources 2.1. Comparaison des données déclarées par le salarié et son employeur 2.2. Comparaison des données déclarées par l’employeur dans EFE et dans SIRENE 3.Conclusion

  3. Introduction1.1 L’enquête « Famille et employeurs • Etudier la conciliation entre la vie professionnelle et la vie familiale • Enquête en 2 volets : Ménage : 9 547 individus de 20 à 49 ans interrogés en face à face sur un questionnaire portant notamment sur les conditions de travail Employeur : 2673 établissements de 20 salariés ou plus interrogés par voie postale ou par internet (questionnaire auto-administré)

  4. Introduction1.2. Sources de données et problématique Comparaisons possibles : • Réponses volet employeurs EFE / Réponses volet ménage EFE (3050 individus travaillant dans 2673 établissements) Remarque : Le volet ménage s’est déroulé en 2 vagues réparties sur 2004 et 2005 ; le volet employeur lui a succédé en 2 vagues sur 2005. Mise en concordance automatique effectué par l’INSEE

  5. Introduction1.2. Sources de données et problématique Comparaisons possibles : • Réponses volet employeur EFE / employeur SIRENE (uniquement 1679 établissements appariés) Remarque : base de données SIRENE correspondant à l’état en décembre 2005 (léger décalage possible) SIRENE : Système Informatique pour le Répertoire des ENtreprises et des Etablissements créé en 1973 • Avantages : exhaustivité • Inconvénients : mise à jour de la base suite par exemple à un changement d’activité voir une cessation

  6. Introduction1.2. Sources de données et problématique Variables fournies par l’INSEE d’après le répertoire SIRENE : • siren + nic = siret  identifiant unique de l’établissement • efets = effectif total de l’établissement  comparable à ef_etab • marchet = secteur (marchand, non marchand privé, non marchand public)  comparable en regroupant les modalités de pubpriv • nes16 = activité principale de l’établissement  comparable à nes16 • siege = établissement siège ou non de l’entreprise  non comparable à EFE • fcest (date de cessation) + dreat (date de réactivation) + cexat (active ou non) = l’entreprise a cessé d’exister ou non

  7. Introduction1.2. Sources de données et problématique Divergences à différents niveaux pour des variables non imputées et ne prêtant pas à confusion a priori : • Effectif total • Secteur d’activité Construire un indicateur de cohérence des données provenant des différentes sources Analyser les caractéristiques des individus et des établissements expliquant le degrés de cohérence

  8. 2. Comparaison des données selon les différentes sources2.1 Comparaison des données salarié/employeur • Construction de l’indicateur de cohérence des déclarations d’effectif total Tableau croisé des tranches d’effectifs employeur / salarié (pourcentage) Remarque : Comparaison effectuée sur 2743 observations renseignées dans les deux volets

  9. 2. Comparaison des données selon les différentes sources2.1 Comparaison des données salarié/employeur • Construction de l’indicateur de cohérence des déclarations d’effectif total Choix de construction de 3 degrés de cohérence : • Cohérence totale (68,3 %) : même tranche • Cohérence forte (23,1 %) : une tranche d’écart • Incohérence (8,7 %) : au moins deux tranches d’écart Remarque : Une tranche d’écart peut signifier un écart important

  10. 2. Comparaison des données selon les différentes sources2.1 Comparaison des données salarié/employeur • Etude des déclarations « incohérentes » concernant l’effectif total En fonction du statut public/privé (selon la déclaration de l’employeur) Pourcentage de déclarations incohérentes plus élevé dans la fonction publique territoriale et le secteur public nationalisé

  11. 2. Comparaison des données selon les différentes sources2.1 Comparaison des données salarié/employeur • Etude des déclarations « incohérentes » concernant l’effectif total En fonction du statut public/privé et de l’écart On distingue 3 groupes

  12. 2. Comparaison des données selon les différentes sources2.1 Comparaison des données salarié/employeur • Etapes du codage de l’activité principale de l’établissement (nes16) Etapes du codage de la déclaration « en clair » de l’individu : • 1er codage effectué par l’INSEE intégré dans CAPI • Codage supplémentaire INED afin de retrouver la Nomenclature Economique de Synthèse en 16 postes adoptée par l’INSEE (nes16) Codage de la déclaration « en clair » de l’employeur : Codage INED à partir de la Nomenclature Economique de Synthèse en 16 postes adoptée par l’INSEE (nes16)

  13. 2. Comparaison des données selon les différentes sources2.1 Comparaison des données salarié/employeur • Etude des discordances fortes concernant l’activité principale Dans l’«Ind. des biens d’équipement », seulement 29, 4 % des déclarations de l’employeur correspondent à celles de l’individu Exemples « types »

  14. 2. Comparaison des données selon les différentes sources2.1 Comparaison des données salarié/employeur • Etude des discordances fortes concernant l’activité principale Dans le secteur des «activités immobilières », seulement 40,7 % des déclarations de l’employeur correspondent à celles de l’individu Exemples « types »

  15. 2. Comparaison des données selon les différentes sources2.1 Comparaison des données salarié/employeur • Etude des discordances fortes concernant l’activité principale Dans le secteur des «Services aux entreprises», seulement 40,1 % des déclarations de l’employeur correspondent à celles de l’individu Exemples « types »

  16. 2. Comparaison des données selon les différentes sources2.1 Comparaison des données salarié/employeur • Construction de l’indicateur de cohérence concernant l’activité principale de l’établissement (nes16) Construction de la variable « Domaine » (10 modalités) à partir de nes16 et nes36 • Agriculture • Industries • Construction • Commerce • Transports • Activités financières et immobilières • Services • Education • Santé, action sociale • Administration

  17. 2. Comparaison des données selon les différentes sources2.1 Comparaison des données salarié/employeur • Construction de l’indicateur de cohérence concernant l’activité principale de l’établissement (nes16) Choix de construction de 3 degrés de cohérence : • Cohérence totale (69,89 %) : même activité • Cohérence forte (8,97 %) : activité différente mais même domaine • Incohérence (21,15) %) : domaine différent Remarque : Comparaison effectuée sur 3045 observations renseignées dans les deux volets

  18. 2. Comparaison des données selon les différentes sources2.1 Comparaison des données salarié/employeur • Etude des discordances fortes concernant l’activité principale Certaines modalités du pré-codage de l’INSEE ne trouvent pas de correspondance dans la nomenclature économique de synthèse Difficulté à déterminer si les déclarations discordantes proviennent des caractéristiques des établissements et des individus (amalgame entre le secteur (public / privé) et l’activité, confusion entre la profession et l’activité, entre les différentes industries notamment pour « biens intermédiaires » et « biens d’équipement) ou du double codage La plupart des données « incohérentes » peut finalement provenir des différences de déclaration et/ou de classement

  19. 2. Comparaison des données selon les différentes sources2.1 Comparaison des données employeur EFE/SIRENE • Etude de l’indicateur de cohérence des déclarations d’effectif total 1679 observations bien appariées 1567 observations comparables ( 71 hors champs EFE + 41 tranches d’effectifs employeur manquantes)

  20. 2. Comparaison des données selon les différentes sources2.1 Comparaison des données employeur EFE/SIRENE Remarque : 306 établissements (soit 19 % des établissements appariés) ont un effectif nul d’après SIRENE 63 % appartiennent au secteur public dont 55 % à la fonction publique d’état (10% sur l’ensemble du fichier) ; 68 % appartiennent aux secteurs d’activité « Education, santé, action sociale » et « administration » (43 % sur l’ensemble du fichier); Selon l’individu, 71 % des établissements ne sont pas les seuls de l’entreprise ou organisme pour lequel il travaille (57 % sur l’ensemble du fichier) ; On retrouve en grande majorité des collèges, lycées et écoles

  21. 2. Comparaison des données selon les différentes sources2.1 Comparaison des données employeur EFE/SIRENE • Etude des établissements avec un effectif SIRENE différent de 0 (N = 1268) Choix de construction de 3 degrés de cohérence : • Cohérence totale (83,68 %) : même tranche • Cohérence forte (12,93 %) : une tranche d’écart • Incohérence (3,39 %) : au moins deux tranches d’écart

  22. 2. Comparaison des données selon les différentes sources2.1 Comparaison des données employeur EFE/SIRENE • Etude des établissements avec un effectif SIRENE différent de 0 (1268) et montrant des incohérences au niveau des effectifs Majorité d’établissements appartenant au secteur de la fonction publique territoriale Sur estimation SIRENE par rapport à l’employeur Etablissements gérés par la commune (crèches, écoles maternelles, mairies, conservatoire, etc.)

  23. 2. Comparaison des données selon les différentes sources2.1 Comparaison des données employeur EFE/SIRENE • Etude de l’indicateur de cohérence des déclarations d’activité principale 1679 obs bien appariées 1608obs comparables (71 hors champs EFE)

  24. 3. Conclusion Si on accepte une certaine marge d’erreur : Pour la grande majorité des établissements les données sont cohérentes Quand les données semblent « incohérentes », les raisons possibles sont les suivantes : Notion de service, d’établissement, d’entreprise, de lieu de travail, d’établissement payeur, de SIRET, d’adresse, de nom Problème de codages à partir de nomenclatures diverses mais aussi perception différentes de l’individu et de l’employeur Conséquences sur la pondération (effectif variable fondamentale) Construction de la typologie au moyen par exemple d’une régression logistique ou d’une analyse factorielle

More Related