Rechercher et supprimer des doublons dans Excel
Ce tutoriel explique comment supprimer des doublons dans un tableau Excel avec XLSTAT.
Jeu de données pour supprimer des doublons avec XLSTAT
Le tableau de données contient des enregistrements de ventes avec une colonne pour l’identifiant commande, une colonne pour l’identifiant client, et une autre pour le montant de la vente.
Les données sont fictives et ont été générées pour ce tutoriel.
But de ce tutoriel
Il est parfois nécessaire de dédoublonner un tableau de données : certaines observations peuvent être présentes plusieurs fois suite à la fusion de plusieurs sources de données, ou suite à des erreurs de saisie. Ici, nous souhaitons détecter s’il y a des commandes répétées et les supprimer.
Paramétrer la suppression des doublons avec XLSTAT
1. Une fois XLSTAT lancé, sélectionnez la commande Gestion des données dans le menu Préparation des données :
2. La boîte de dialogue Gestion des données apparaît : 3. Sélectionnez les colonnes A-C dans le champ Données. Ensuite, choisissez la méthode Dédoublonner. La première ligne de la sélection comprend des en-têtes donc il faut activer l’option Libellés des variables. Cliquez OK pour générer le rapport XLSTAT.
Résultats d’une suppression des doublons
Trois observations dupliquées ont été détectées et supprimées. Le tableau final contient alors 18 commandes uniques. La transformation du tableau initial est affichée ci-dessous :
Cet article vous a t-il été utile ?
- Oui
- Non