Aller au contenu principal

Nuage de points avec ellipses de confiance sous Excel

Ce tutoriel explique comment créer un graphique en nuages de points avec ellipses de confiance avec Excel en utilisant XLSTAT.

Jeu de données pour créer un graphique en nuages de points avec ellipses de confiance sous XLSTAT

Dans ce tutoriel, nous utiliserons un tableau de données représentant des clients d’un site commercial en lignes et le nombre de connexions à la page Facebook du site, la somme d’argent dépensée sur le site, ainsi que la classe d’âge du client en colonnes (15 – 30 ; 30 – 45 ; > 45).

But de ce tutoriel

Dans ce tutoriel, nous utiliserons la fonction nuage de points d’XLSTAT en activant l’option ellipses de confiance à 95% afin d’explorer des profils de clients d’un site internet commercial.

Paramétrer un graphique en nuages de points avec ellipses de confiance sous XLSTAT

Cliquer sur le menu XLSTAT / Visualiser des données / Graphique en nuages de points

Au sein de l’onglet Général, nous affecterons le nombre de connexions Facebook à l’axe des X et la somme d’argent dépensée à l’axe des Y. Par ailleurs, activer l’option Groupes et sélectionner la colonne classes d’âge dans le champ approprié.

Scatter plot general tab

Dans l’onglet Options, activer l’option Ellipses de confiance.

Scatter Plot options tab

Interpréter un graphique en nuages de points avec ellipses de confiance sous XLSTAT

scatter plot with conf ellipses

Globalement, nous remarquons un lien positif entre le nombre de connexions Facebook et la somme d’argent dépensée sur le site. Cette conclusion est relativement triviale.

Les choses deviennent plus intéressantes lorsque nous comparons les différentes classes d’âge entre elles.

Les clients ayant un âge supérieur à 45 ans (points violets en bas à gauche dans le graphique) se connectent relativement peu à Facebook et dépensent moins d’argent en comparaison aux deux autres catégories d’âge. L’ellipse associée à cette classe ne chevauche aucune des deux autres ellipses. Nous pouvons donc dire que cette classe d’âge est relativement différente des deux autres en ce qui concerne le nombre de connexions Facebook et l’argent dépensé.

Les clients dont l’âge est compris entre 35 et 45 ans (points verts) sont ceux qui dépensent le plus d’argent. Ils se connectent à Facebook bien plus souvent que les clients plus âgés, mais un peu moins souvent que les clients plus jeunes.

La classe d’âge la plus jeune (15 – 30 ans, points bleus) est caractérisée par le nombre de connexions Facebook le plus élevé et des dépenses relativement importantes (mais légèrement moins importantes que celles de la classe intermédiaire). Vu que leurs ellipses de confiance présentent un chevauchement, on peut dire que les classes d’âge jeune et intermédiaire sont relativement similaires.

Diverses interprétations peuvent être proposées. Par exemple, on pourrait dire que les clients jeunes passent beaucoup de temps sur Facebook mais ont des capacités d’investissement limitées. Les clients appartenant à la classe la plus âgée sont moins attirés par les réseaux sociaux et préfèrent dépenser leur argent dans de « vrais » magasins. Les clients d’âge intermédiaire ont un capital plus élevé que les clients plus jeunes, tout en ayant grandi avec la technologie internet (ce qui explique le fait qu’ils visitent Facebook presque aussi souvent que les clients les plus jeunes).

Aller plus loin : augmenter le nombre de dimensions exploitées grâce à l’ACP

Ce type d’analyses exploratoires peut être exécuté avec un nombre bien plus élevé de variables. L’Analyse en Composantes Principales (ACP) est un outil très populaire permettant de réduire le nombre de dimensions d’un jeu de données, permettant ainsi des interprétations de profils sur des graphiques à deux dimensions.

Cet article vous a t-il été utile ?

  • Oui
  • Non