Asymétrie et aplatissement d’une distribution dans Excel
Ce tutoriel explique comment calculer et interpréter le coefficient d’asymétrie et d’aplatissement pour des données quantitatives sous Excel en utilisant XLSTAT.
Jeu de données pour calculer les coefficients d’asymétrie et d’aplatissement
Les données représentent le temps passé par des élèves du Bac scientifique à compléter un examen de mathématique et un examen de logique. 40 élèves ont été sélectionnés dans trois écoles pour réaliser ces tests. Le temps est mesuré en minutes. Le tableau de données présente les élèves en lignes et les temps d’exécution pour chaque examen ainsi que le nom de l’école en colonnes.
Le but ici est d’étudier deux caractéristiques spécifiques des distributions de variables quantitatives : 1. L’asymétrie, ou dissymétrie, qui mesure l'écart de la distribution par rapport à la symétrie 2. L’aplatissement, qui reflète la répartition des données autour de leur centre.
Dans cet objectif, nous utiliserons la fonction Statistiques Descriptives de XLSTAT. Cet outil nous permettra de calculer des indices statistiques par type d’examen et par école afin de comparer l’asymétrie et l’aplatissement de différents sous-échantillons. Le paramétrage sera suivi de l’interprétation des sorties.
Paramétrer la boîte de dialogue des statistiques descriptives
1. Une fois XLSTAT lancé, sélectionnez le menu XLSTAT / Description des données / Statistiques Descriptives.
2. La boîte de dialogue Statistiques Descriptives apparaît.
3. Dans l’onglet Général, sélectionnez les colonnes TestMath et TestLogique dans le champ Données quantitatives et la colonne Ecole dans le champ Sous-échantillons. Activez également l’option Libellés Variable-Modalité afin d’utiliser des libellés longs dans les résultats. Ensuite, choisissez l'option Feuille pour que l'affichage des résultats soit effectué sur une nouvelle feuille du même classeur. Cochez également l'option Libellés des échantillons puisque le nom des variables est inclus dans la sélection.
4. Dans l'onglet Options, activez les options suivantes :
5. Dans l’onglet Sorties, cliquez sur le bouton Toutes afin de sélectionner toutes les sorties proposées.
Interpréter les coefficients d’asymétrie et d’aplatissement
Le tableau de résultats est affiché dans une nouvelle feuille nommée Desc. Les statistiques calculées sont présentées en colonnes par type de test (numérique et logique) et par école (A, B et C). XLSTAT propose plusieurs coefficients pour mesurer l’asymétrie et l’aplatissement. Dans cet exemple, nous avons choisi d’utiliser le coefficient de Fisher pour l’interprétation. Ce coefficient n'est pas biaisé sous hypothèse de normalité des données. Vous trouverez toutes les définitions et formules dans le menu Aide (cliquez sur le bouton Aide de la boite de dialogue).
a. Interprétation du coefficient d'asymétrie
Une distribution est dite symétrique si les observations se répartissent de manière uniforme autour la moyenne, le mode et la médiane (ex : distribution normale). La valeur du coefficient d’asymétrie pour une telle distribution est égale à zero. En revanche, si la valeur du coefficient est positive (>0) alors la distribution est étalée à droite de la moyenne. Si la valeur est negative (<0) alors la distribution est étalée à gauche de la moyenne.
Dans cette partie, nous allons interpréter les résultats provenant de l’examen de mathématique (voir ci-dessous). Les échantillons étudiés reflètent les trois types d’asymétrie décrite en haut:
- Une asymétrie positive est estimée pour l’école A (1.42). La moyenne (50.69) est alors supérieure à la médiane (49.3).
- Une asymétrie négative est estimée pour l’école B (-1.63). La moyenne (48.77) est alors inférieure à la médiane (49.54)
- Une asymétrie proche de zéro est estimée pour l’école C. La moyenne (49.6) est alors très proche à la médiane (49.8).
Les histogrammes nous permettent de valider ces observations. En effet, la queue de la distribution A est étalée à droite tandis que la queue de la distribution B est étalée à gauche. Enfin, le dernier histogramme montre des données symétriquement distribuées.
b. Interprétation de l’aplatissement
La mesure d’aplatissement apporte des informations importantes autour les extrémités et le pic d’une distribution. Un coefficient d’aplatissement positif indique une distribution avec un pic moins plat et des extrémités plus épaisses par rapport à la distribution normale (distribution leptokurtique). Un coefficient négatif indique une distribution plus plate avec des extrémités moins épaisses par rapport à la distribution normale (distribution platykurtique). L'aplatissement de la distribution normale est égal à 0 (distribution mésokurtique).
Pour cette partie, nous interpréterons les résultats provenant de l’examen de logique (voir ci-dessous).Nous constatons des différences entre les trois échantillons :
- Un aplatissement positif est estimé pour l’école A (5,40).
- Un aplatissement négatif est estimée pour l’école B (-1,32).
- Un aplatissement proche de zéro est estimé pour l’école C.
Nous pouvons distinguer les mêmes types d’aplatissement à travers les histogrammes. Précisément, une distribution leptokurtique, une distribution platykurtique et une distribution mésokurtique sont représentées par les trois histogrammes de haut en bas.
Aller plus loin : Comment visualiser l’asymétrie et l’aplatissement d’une distribution ?
L’histogramme est l’un des outils de visualisation les plus utilisés dans ce but car il permet de repérer rapidement les caractéristiques d’une distribution de données quantitatives. En un seul graphique il est possible d’avoir une idée de l’asymétrie et l’aplatissement d’une distribution. Vous pouvez voir ici comment générer des histogrammes avec XLSTAT.
Cet article vous a t-il été utile ?
- Oui
- Non