Aller au contenu principal

Echantillonnage stratifié dans Excel

Ce tutoriel explique comment générer un sous-échantillon d'observations à partir d'un jeu de données en utilisant la méthode d'échantillonage stratifié dans Excel avec le logiciel XLSTAT.

Jeu de données pour un échantillonnage stratifié

Le jeu de données utilisé dans ce tutoriel correspond à la liste des employés d'une compagnie ainsi que certaines données sur leur genre (homme/femme) et leur type de temps de travail (plein temps/temps partiel). L'équipe des ressources humaines veut conduire une enquête sur les conditions de travail dans l'entreprise qui sera représentative de l'opinion générale sans interroger la totalité des employés. Ils vont donc faire un échantillonnage stratifié.

Il y a 46% de femme et 54% d'homme dans l'entreprise. Les employés à temps partiel sont majoritairement des femmes 25 % du total contre 9% pour les hommes.

data-sampling-descriptive-statistique.png

Paramétrer un échantillonnage stratifié

Ouvrez la boîte de dialogue Echantillonnage de données qui est accessible via le menu Préparation des données.

Menu Préparation des données dans XLSTAT

Sélectionnez toutes les données disponibles en sélectionnant les quatre colonnes (employés, genre, temps de travail, strate).

Choisissez l'option Aléatoire stratifié (2). Cette option prend en compte les proportions dans chaque strate.

Nous voulons sélectionner seulement 20 employés pour répondre à l'enquête. Entrez la valeur "20" pour le Taille de l'échantillon.

Dans le champs Strates, vous pouvez soit sélectionner la colonne "Strate" du jeu de données soit les variables qui doivent définir les strates ici les deux variables "Genre" et "Temps de travail".

Le nom des variables est inclus dans le jeu de donnée il faut donc cocher la case Libellés des variables.

Par contre, il n'est pas nécessaire de changer l'ordre des résultats donc on ne sélectionne pas l'option Mélanger.

Quand vous avez fini de paramétrer la boîte de dialogue, cliquez sur OK. Échantillonnage de données dans XLSTAT

Résultats d'un échantillonnage stratifié

Les résultats de l'échantillonnage stratifié apparaissent dans une nouvelle feuille Excel "Echantillonnage des données". Vous trouvez une table de 20 échantillons, vous n'aurez probablement pas les mêmes résultats car il y a un tirage au hasard des échantillons à inclure. Cependant vous devez avoir le même nombre d'échantillon par starter, soit :

  • 4 femmes employées à plein temps,
  • 5 femmes employées à temps partiel,
  • 9 hommes employés à temps plein,
  • 2 hommes employés à temps partiel.

data-sampling-result.png

Ci-dessous vous avez les statsitiques descriptives qui sont calculées sure l'échantillon stratifié. Celles-ci sont comparés aux statistiques de la population :

  • un échantillon de 20% pour représenter les 22% de femme employées à temps plein de la population,
  • un échantillon de 25% pour représenter les 25% de femme employées à temps partiel de la population,
  • un échantillon de 45% pour représenter les 44% d'homme employés à temps plein de la population,
  • un échantillon de 10% pour représenter les 9% d'homme employés à temps partiel de la population.

data-sampling-result-2.png

Cet article vous a t-il été utile ?

  • Oui
  • Non