Aller au contenu principal

Modèle de Weibull dans Excel, tutoriel

Modèle de régression de Weibull (modèle paramétrique de survie)

Le modèle de régression de Weibull est une méthode utile lorsqu’on veut déterminer l’impact de variables explicatives sur le temps de survie d’un patient en supposant une distribution sous-jacente (en général celle de Weibull) . Il s’applique à des données de survie, c’est-à-dire une variable temps, une variable de censure (variable binaire) et des variables explicatives. Ce modèle est basé sur une estimation par maximum de vraisemblance.

Jeu de données pour la création d'un modèle paramétrique de survie

Nous illustrons l’application du modèle paramétrique de survie (aussi appelé modèle de Weibull) sur des données provenant du livre de J.D. Kalbfleisch et R.L. Prentice (The Statistical Analysis of Failure Time Data, Wiley, 2002, p. 119) sur les cancers du poumon.

La variable daysurv représente le temps de survie, la variable censoring est une variable binaire de censure (0 : données censurées, 1 : mort du patient). Les variables explicatives sont le niveau de performance du patient au début de l’étude (perfstatus), le nombre de mois depuis le diagnostic au début de l’étude, l’âge du patient au début de l’étude, le fait d’avoir suivi un traitement avant le traitement actuel.

Notre but est de déterminer l’impact d’un certain nombre de variables explicatives sur le temps de survie des patients.

Paramétrer un modèle paramétrique de survie

Pour activer la boîte de dialogue du modèle de Cox, lancez XLSTAT, puis sélectionnez la commande XLSTAT / Analyse de survie / Régression paramétrique de survie.

Weibull model menu

Sélectionner les données de dates (daysurv), l’indicateur d’état (censoring) et comme variables explicatives l’ensemble des autres variables. Sélectionnez la distribution de Weibull.

régression paramétrique de survie boite de dialogue

Les autres onglets de la boîte dialogue permettent de paramétrer l’estimation et les sorties.

Ainsi, on peut choisir quelle méthode on désire utiliser afin de :

  • paramétrer les critères de convergence,
  • faire de la sélection de variable (ascendante ou descendante),
  • supprimer les données manquantes (il faut que les données de dates et de censure soient complètes).

Une fois que vous avez cliqué sur le bouton OK, les calculs commencent puis les résultats sont affichés.

Interpréter les résultats d'un modèle paramétrique de survie

Des statistiques générales sont d’abord affichées :

Statistiques descriptives weibull

Nous voyons que le nombre de temps distincts est différent du nombre d’observations. Il faut donc utiliser une méthode afin de prendre en charge les temps égaux.

Les deux tableaux suivant résument les indices de qualité du modèle, le premier en les comparant au modèle indépendant (c’est-à-dire sans impact des variables explicatives) et le second donne des statistiques importantes dans le cadre de l’analyse d’un modèle de survie paramétrique (la statistique du rapport de vraisemblance, la statistique de Wald et celle du score).

qualité ajustement Weibull

L’ensemble des statistiques sont significatives et nous pouvons donc conclure que le fait de prendre en compte des variables explicatives et une distribution de probabilité apporte une information supplémentaire significative.

Le tableau suivant est un tableau classique de modèle de régression.

Coefficients Weibull

Nous voyons qu'aucune variable n'a d'impact significatif. Par contre la modélisation par la loi de Weibull donne une constant et un paramètre d'échelle tout deux significatifs.

Finalement la fonction de survie cumulée est affichée en prenant en compte les variables explicatives et la distribution de probabilité de Weibull.

Graphique fonction de survie

Cette petite étude nous amène donc à un certain nombre de conclusions. Nous avons vu que les facteurs utilisés ne sont pas significatifs. La modélisation par la distribution de Weibull offre une bonne qualité d'ajustement et permet de faire des prévisions de manière aisée.

D’autres fonctions sont présentes dans XLSTAT-Life tel que l’affichage de la fonction de risque à la moyenne des variables explicatives, ainsi que l’affichage et la représentation graphique des résidus. Ces fonctions permettront d’effectuer des analyses plus poussées.

Cet article vous a t-il été utile ?

  • Oui
  • Non