Aller au contenu principal

Quel outil de statistiques descriptives choisir ?

Guide de choix d’outil de statistiques descriptives en fonction de la situation

La description statistique est une partie essentielle d’une analyse statistique qui permet d’avoir un premier aperçu pertinent de vos données avant d’utiliser des méthodes plus avancées. Dans cet objectif, plusieurs outils numériques (ex : moyenne, mode, variance…) et graphiques (ex : histogramme, boîte à moustaches) existent qui permettent de résumer un ensemble de données et d’étudier ses caractéristiques comme la tendance centrale et la dispersion. Ces outils peuvent être également utilisés pour décrire l’association parmi plusieurs variables.

Le choix d’un outil de statistiques descriptives peut être lié aux caractéristiques des variables, comme leur type et leur nombre, ainsi qu’à l’objectif de l’étude. Nous avons préparé une grille qui vous aidera à choisir une méthode appropriée selon votre situation.

La première colonne de la grille ci-dessous concerne le type de données à étudier. Trois types de données sont présentés :

  • Quantitatives : il s'agit de variables qui décrivent une quantité. Elles s’expriment en valeurs numériques (ex : l’âge, la taille, le poids).

  • Qualitatives : réfèrent des variables qui décrivent une qualité non-quantifiable (ex: la couleur). Ces variables sont également appelées catégorielles ou nominales. Les valeurs d’une telle variable sont appelées modalités, catégories ou niveaux (ex : vert, rouge...).

  • Mixtes : incluent des variables quantitatives et qualitatives.

La deuxième colonne indique le nombre de variables. Les solutions proposées sont appropriées à la description d’une variable (analyse univariée) ou la description de l’association entre deux (analyse bivariée) ou plusieurs variables. La grille inclut également des exemples pour chaque situation.

La grille

Les solutions affichées sont les tests les plus courants en statistiques descriptives. Elles sont toutes disponibles dans XLSTAT. La liste n’est cependant pas exhaustive. D’autres situations / outils existent.

Description des données Objectif Exemple Outil numérique Outil graphique
Quantitatives Une variable (analyse univariée) Obtenir la distribution de fréquences Combien d’individus par groupe d’âge ont assisté à cet évènement? (ici la variable étudiée est l’âge en tant que variable quantitative) Tableau des fréquences
Mesurer la tendance centrale d’un échantillon Quelle est la note moyenne de cette classe ? Moyenne, médiane, mode Boîtes à moustache (box plots) Scattergram Strip plot
Mesurer la dispersion d’un échantillon Comment les notes de cette classe sont dispersées autour de la note moyenne ? Amplitude, écart-type, variance, coefficient de variation, quartiles Boîtes à moustache Scattergram Strip plot
Etudier les caractéristiques de forme d’une distribution Les salaires des employés dans cette société suivent-ils une distribution symétrique ? Coefficients d’asymétrie et d’aplatissement Histogramme
Contrôler visuellement si un échantillon suit une distribution donnée identifier le pourcentage d'élèves théorique ayant des notes supérieures à un seuil Diagrammes de probabilité
Mesurer la position d’une valeur au sein d’un échantillon Quelle valeur sépare les 5% supérieurs des données ? (95% centile) Quantiles/centiles Boîtes à moustache
Détecter des valeurs extrêmes La hauteur de 184cm est-elle une valeur extrême pour cette équipe de basket ? Boîtes à moustache
Deux variables (analyse bivariée) Décrire l’association entre deux variables quantitatives La biomasse de plante change-t-elle avec la concentration de Pb ? Coefficients de corrélation Carte de corrélation Nuage de points
Plusieurs variables Décrire l’association entre plusieurs variables quantitatives Quelle est l’évolution du taux de fertilité, de l’espérance de vie et de la population dans ce pays de 2010 à 2015 ? Coefficients de corrélation Motion charts (jusqu’à 3 variables + une variable temps) Nuage de points (jusqu’à 3 variables)
Décrire l’association entre trois variables quantitatives sous des conditions spécifiques Comment visualiser les proportions relatives de ces trois ingrédients mesurés sur 10 glaces ? Diagramme ternaire
Deux matrices avec plusieurs variables Décrire l’association entre deux matrices de variables quantitatives L’évaluation de 12 jus de canneberge varie-t-elle entre ces deux panels de juges ? Coefficient RV
Qualitatives Une variable (analyse univariée) Obtenir la fréquence de différentes modalités Combien de clients ont été satisfaits ou pas par le service ? Tableau des fréquences (tri à plat)
Détecter la modalité la plus fréquente Quelle est la couleur des cheveux la plus courante dans ce pays ? Mode Diagramme en bâtons Diagramme en secteurs
Deux variables Décrire l’association entre deux variables qualitatives Comment un attribut change en fonction de la présence d’un autre attribut Tableau de contingence (tri croisé) Vue 3D du tableau de contingence Barres empilées Barres multiples
Mixtes (quantitative & qualitative) Deux variables Décrire l’association entre une variable binaire et une variable continue La concentration d’une molécule chez la souris change-t-elle en fonction du sexe de la souris (F/H) ? Corrélation bisérielle
Décrire l’association entre une variable qualitative et une variable continue La longueur des sépales est-elle différente parmi trois espèces de fleurs ? Statistiques descriptives univariées pour la variable quantitative par modalité de la variable qualitative Boîtes à moustache
Trois variables Décrire l’association entre une variable qualitative et deux variables quantitatives Le montant d’argent dépensé sur un site commercial varie-t-il en fonction de l’âge et du revenu des clients ? Nuage de points (avec la variable qualitative comme groupe)

Source: Introductory Statistics: Exploring the World Through Data: Robert Gould and Collen Ryan

Cet article vous a t-il été utile ?

  • Oui
  • Non