190 likes | 291 Vues
Diffusion des données. Alain GAUGRIS Division de statistique des Nations unies. Atelier régional pour les pays africains sur la mise en oeuvre des Recommandations internationales sur les statistiques du commerce de distribution. 17-20 juin 2008, Bamako, Mali. SOMMAIRE. Reporting national
E N D
Diffusion des données Alain GAUGRISDivision de statistique des Nations unies Atelier régional pour les pays africains sur la mise en oeuvre des Recommandations internationales sur les statistiques du commerce de distribution 17-20 juin 2008, Bamako, Mali
SOMMAIRE Reporting national 1. Confidentialité statistique 2. Calendrier de diffusion des données 3. Révision des données 4. Diffusion des métadonnées Reporting international Liste des variables sur les SCD recommandées pour le reporting international
Reporting national Diffusion des données • Activité-clé des ONS • Responsibilités des ONS • Fournir aux décideurs, à la communauté des affaires et aux autres utilisateurs de l’information statistique de la plus haute qualité • Motiver les répondants à participer aux enquêtes statistiques • Protéger la confidentialité des répondants
1. Confidentialité statistique • Les informations individuelles sur les unités statistiques classifiées dans la section G de CITI, Rev.4 sont généralement considérées confidentielles • La confidentialité statistique est nécessaire pour gagner et garder la confiance de: • Ceux qui répondent aux enquêtes statistiques • Ceux qui utilisent l’information statistique • Les Principes fondamentaux de la Statistique officielle des Nations unies (Principe 6) • Les lois nationales de la statistique (ou toute autre régulation gouvernementale) • Les définitions nationales de la confidentialité des règles d’accès aux microdonnées peuvent varier, mais elles doivent être cohérentes avec le Principe fondamental n°6
1. Les SCD et la confidentialité statistique • Les ONS diffusent habituellement les SCD sous la forme de tableaux statistiques • La confidentialité statistique est protégée si les données présentées sous forme de tableaux ne permettent pas l’identification directe ou indirecte des unités statistiques, ce qui équivaudrait à la divulgation d’informations individuelles • Identification directe • si les données d’une unique unité statistique sont présentées dans une cellule • Identification indirecte • si les données undividuelles peuvent être dérivées des données diffusées (e.g. parce que les unités sont trop peu nombreuses, ou parce qu’une ou deux unités dominent dans la cellule)
1 Le contrôle de la divulgation statistique L’idée est de trouver un équilibre optimal entre l’amélioration de la protection de la confidentialité et la réduction de la qualité des données • Les méthodes de contrôle de la divulgation • Ensemble de méthodes pour réduire le risque de divulguer les informations relatives aux unités individuelles • Elle sont pertinentes à toutes les étapes du processus de production statistique Identification des cellules sensibles Identification des cellules qui tendent à révéler directement ou indirectement des informations sur les unités statistiques individuelles Première étape du contrôle de divulgation statistique
1. Méthodes de protection de la confidentialité • Agrégation • Une cellule confidentielle dans un tableau est agrégée avec une autre cellule et ainsi l’information est diffusée pour l’agrégat et non pas pour les deux cellules individuellement • Suppression • Supprimer les enregistrements d’une banque de données ou d’un tableau lorsqu’ils contiennent des données confidentielles • Suppression primaire - valeurs dans les cellules sensibles ne sont pas publiées tandis que les valeurs originales d’autres cellules le sont • Suppression secondaire –d’autres cellules sont également supprimées afin de garantir la protection des valeurs • Autres méthodes • Contrôle par arrondi – la valeur originale de chaque cellule est modifiée en l’arrondissant par excès ou par défaut • Perturbation – une variante du contrôle par arrondi qui utilise la programmation linéaire
1. Les règles de la confidentialité pour les SCD • Les règles de la confidentialité pour les SCD devraient être en accord avec les pratiques et législation nationales des pays • Critères de confidentialité • Nombre d’unités dans une cellule • Prédominance de la contribution d’une ou de plusieurs unités sur la valeur totale de la cellule • Décision quant à l’exacte définition des critères de confidentialité en termes de nombre d’unités par cellule et de degré de prédominance – laissée aux ONS • Règles de confidentialité peuvent être allégées dans les cas individuels en demandant la permission au(x) répondant(s) dominant(s) de divulguer ses (leurs) données
1. Recommandations Les pays sont encouragés à développer leurs propres méthodes de divulgation statistique, correspondant à leurs circonstances spécifiques • Si la suppression est préférée comme méthode de protection de la confidentialité de SCD • Toute donnée jugée confidentielle devrait être rapportée au niveau suivant de classification de manière à protéger la confidentialité • La protection de la confidentialité doit résulter en un minimum de perte d’information
2. Calendrier de diffusion des données (1/2) Les pays devraient développer un calendrier et annoncer à l’avance les dates précises auxquelles les SCD seront publiées • Prévoir un calendrier de publication • Cela garantit des bonnes relations entre les ONS en tant que producteurs et la communauté des utilisateurs • Le calendrier des publications devrait être posté sur le site web de l’ONS au début de chaque année • Fraîcheur des SCD • Mensuellement – 45 jours après le mois de référence • Trimestriellement – 3 mois après la fin du trimestre de référence • Annuellement – 18 mois après la fin de l’année de référence
2. Calendrier de diffusion des données (2/2) • Principaux éléments à prendre en compte pour le développement d’un calendrier de publication • Choix du moment (timing) de la collecte des données initiales à partir des enquêtes de SCD • Dans quelle mesure les données dérivées des principales sources de données sont sujettes à révision • Mise en phase avec la préparation de documents importants sur la politique économique nationale nécessitant les SCD • Modes de diffusion des données
3. Révision des données • C’est une partie essentielle des pratiques de compilation de SCD des pays • Elles sont une conséquence de l’arbitrage entre fraîcheur des données publiées et leur fiabilité, leur précision et leur complétude • Elles sont menées au bénéfice des utilisateurs, afin de leur fournir des données aussi précises et fraîches que possible • Elles touchent à la fois les SCD annuelles et de court terme, mais avec plus d’acuité ces dernières
3.1 Raisons de la révision • Les révisions font partie des procédures statistiques “normales” (révisions courantes) – menées à des intervalles de temps réguliers, lorsque: • De nouvelles informations deviennent disponibles • Changement méthodologique • Changement dans les sources de données • Changement de l’année de base • Les révisions peuvent aussi naître de la correction des erreurs qui peuvent surgir dans les sources de données ou lors du traitement des données • Les révisions spéciales – menées à des intervalles de temps plus longs et surtout irréguliers • Ré-évaluation des données • Investigation avancée de nouvelles structures économiques
3.2 Politique de révision Les pays sont encouragés à développer une politique de révision des SCD bien conçue, soigneusement gérée et coordonnée avec les autres pans de la politique de révision statistique Caractéristiques essentielles d’une politique de révision bien établie: • Calendrier prédéterminé • Stabilité raisonnable d’une année à l’autre • Notification claire des raisons et des effets • Accès aisé à des séries chronologiques suffisamment longues de données révisées (pour les utilisateurs) • Documentation suffisante des révisions incluse dans les publications statistiques et les bases de données
4. Diffusion des métadonnées Les pays sont encouragés à développer et à diffuser des métadonnées sur les SCD • La mise à disposition de métadonnées satisfaisantes et d’une évaluation de la qualité des SCD est aussi importante aux yeux des utilisateurs que la mise à disposition des données elles-mêmes • Composants des métadonnées • Couverture des données, périodicité et fraîcheur • Accès par le public • Intégrité des données diffusées • Qualité des données • Résumé méthodologique • Formatsde diffusion
Reporting international – données annuelles E X E M P L E
Reporting international – données trimestrielles E X E M P L E
Reporting international – données mensuelles E X E M P L E