Dans le cadre de l’atteinte de son objectif n°1 (créer au sein de l’INS une unité de mission capable de gérer, d’analyser et de diffuser l’information relative à la nutrition) et plus particulièrement dans le souci de pouvoir collecter et traiter les données des Directions Statistiques des Ministères Clés du Programme PNIN, une seconde formation en anonymisation des données s’est déroulée du 27 Mai au 31 Mai 2019 à l’Institut National de la Statistique du Niger (INS). Au-delà d’une faible habitude de transmission des bases de données des Directions Statistiques vers l’INS (organe de coordination du Système Statistique National), il existe également une véritable crainte sur l’anonymisation des données et les risques d’identification des personnes, ménages enquêtés, structures. Ainsi, l’INS dans le cadre du processus d’Assurance Qualité et les Services producteurs d’informations statistiques ont saisi l’opportunité de renforcer leurs compétences dans le domaine de l’anonymisation des données afin de mieux répondre à l’obligation de protection des données et des personnes, ménages, entreprises.
Pour cette seconde formation, la première journée a permis de rassembler les bénéficiaires de la première formation en anonymisation des données (un an après) afin de voir les avancées réalisées et les contraintes rencontrées. Cette première Journée a permis également de rappeler les concepts des méthodes qui avaient été présentées lors de la première formation en Mai 2018. Les journées du 28 Mai au 31 Mai 2019 ont été consacrées à une seconde session de formation.
Alors que l’anonymisation est souvent perçue à tort comme un procédé utilisé pour faire disparaître le nom et le prénom (simple pseudonymisation), la formation a rappelé les véritables concepts pour qu’une base de données devienne anonyme. Après avoir rappelé que le plus important était de savoir dire les mots « anonymisation » et « pseudonimisation » sans se tromper, la formation a permis de renforcer les connaissances sur les clefs et principes d’une bonne pseudonymisation en partant des risques de ré-identification à travers les quasi-identifiants ou QID les plus courants (âge, sexe, lieu d’habitation…) et les deux métriques les plus utilisées pour rendre compte du risque de ré-identification d’une base de données : le k-anonymat et la l-diversité. D’autres aspects ont été abordés tels que le floutage des QID et l’impact sur le k-anonymat ou la mesure de la l-diversité.
La première Journée a concerné les représentants des différentes Directions de l’INS, du HC3N, du Ministère de l’Enseignement Primaire (MEP), du Ministère de la Santé Publique (MSP) qui avaient bénéficié de la première session de formation en Mai 2018. La deuxième session de formation a concerné les représentants des Ministères Clés de la PNIN (Agriculture et Elevage, Education Primaire, Santé, Hydraulique et Assainissement, Environnement et Développement Durable) ainsi que des cadres des Directions de l’Institut National de la Statistique (INS), soit au total une vingtaine de personnes. La formation a été rythmée par des sessions théoriques et des exercices pratiques. Compte tenu des niveaux différents des participants, un maximum de mise en pratique a été réalisé sous Excel pour les bénéficiaires ayant peu l’habitude d’utiliser les logiciels de traitement des données (SPSS, STATA) et sur une base fictive.
L’objectif final de la PNIN est de parvenir à diffuser une information relative à la nutrition de qualité, vulgarisée, harmonieuse et accessible à tous. Plus spécifiquement, la formation a donné les outils permettant de : 1) Protéger et accroître la notion du secret statistique et de l’anonymisation des données auprès des producteurs nationaux d’informations statistiques ; 2) Mettre à disposition des utilisateurs les bases de données de l’INS et des Secteurs, que cela soit sur le Portail Anado de l’INS ou du Portail de la PNIN.
Télécharger le rapport de formation Anonymisation des données Mai 2019