Aller au contenu principal

Anonymisation des données dans Excel, tutoriel

Ce tutoriel explique comment utiliser la méthode d'anonymisation des données dans Excel avec le logiciel XLSTAT.

Jeu de données pour réaliser une anonymisation des données

Le jeu de données est un échantillon de 12 observations venant des résultats d’une enquête sur le salaire de personnes. Il présente pour chaque observation 4 variables : le genre, le code postal du lieu de résidence, le niveau des études et le salaire. L'objectif de ce tutoriel est de transformer ce jeu de données pour le rendre illisible à tout le monde.

Paramétrer une anonymisation des données dans XLSTAT

Une fois XLSTAT lancé, cliquez sur le menu Préparation des données / Anonymisation des données comme ci-dessous.

Menu XLSTAT - Préparation des données La boîte de dialogue Anonymisation des données apparaît.

Boîte de dialogue XLSTAT 01 - Anonymisation des données

Dans l'onglet Général, sélectionnez les données sur la feuille Excel que vous souhaitez transformer et cochez l’option anonymiser les libellés si vous souhaitez que le nom des variables genre, code postal, niveau d’étude et salaire soit aussi transformé.

Sélectionnez ensuite l'option Feuille pour afficher les résultats sur une nouvelle feuille, cochez l’option Libellés des variables pour considérer la première ligne de la table de données comme celle des étiquettes et ajoutez la colonne avec les libellés des observations.

Dans l'onglet Options, choisissez la méthode aléatoire puis cochez l’option supprimer les espaces à gauche et à droite de mon texte.

Boîte de dialogue XLSTAT 02 - Anonymisation des données Dans l'onglet Données manquantes, vous optez pour la première option qui est de ne pas accepter les données manquantes.

Boîte de dialogue XLSTAT 01 - Anonymisation des données Dans l’onglet Sorties, vous choisissez l’ensemble des propositions. Cliquez alors sur le bouton OK pour que les calculs commencent. Les résultats sont affichés dans une nouvelle feuille nommée Anonymisation des données.

Interprétation des résultats

Le premier résultat est un tableau résumant les données initiales qui sont affichées dans le même ordre que celui de la feuille de données.

Résultats 01 - Anonymisation des données Le deuxième tableau correspond à la transformation aléatoire de ces données sélectionnées. Les données qualitatives ont été remplacées par des chaines de caractères et les données quantitatives ont été mélangées sur chaque colonne. Le libellé des variables ont aussi été remplacées par des chaines de caractères aléatoires.

Résultats 02 - Anonymisation des données Le dernier tableau décrit la correspondance entre la valeur des données initiales et celles anonymisées pour les variables qualitatives. Résultats 03 - Anonymisation des données

Cet article vous a t-il été utile ?

  • Oui
  • Non