Direkt zum Inhalt

Zweistufige LS-Regression (2SLS) in Excel

Dieses Tutorium wird Ihnen helfen, eine zweistufige kleinste Quadrate Regression in Excel mithilfe der XLSTAT Software einzurichten und zu interpretieren.

Daten für die Durchführung einer zweistufigen kleinsten Quadrate Regression

Die Daten entsprechen dem Beispiel Angebot-Nachfrage nach Lebensmitteln von Kmenta [Kmenta, J. (1971). Elements of Econometrics, 565-582]. Dieser Datensatz setzt sich zusammen aus 5 Variablen: dem Lebensmittelverbrauch pro Kopf (FCH), dem Verhältnis aus Lebensmittelpreisen und dem allgemeinen Preis (RFP), dem verfügbaren Einkommen (DI), dem Verhältnis des Vorjahrespreises (RPP) und der Zeit in Jahren 1922-1941 (Jahr). Der FCH und der RFP sind endogene Variablen und das DI, der RPP und das Jahr sind exogen.

Absicht dieses Tutoriums

Wir möchten herausfinden, wie der Lebensmittelverbrauch sich im Verhältnis zu den Lebensmittelpreisen und dem allgemeinen Preis und dem verfügbaren Einkommen ändert. Da eine der erklärenden Variablen exogen ist, werden die Variablen DI, RPP und Jahr als instrumentale Variablen verwendet, und wir schätzen die Parameter nach der zweistufigen kleinsten Quadrate Methode.

Erstellen einer zweistufigen kleinsten Quadrate Regression

Nach dem Öffnen von XLSTAT wählen Sie den Befehl XLSTAT/XLSTAT-MX/Zweistufige kleinste Quadrate oder klicken Sie auf den entsprechenden Button der Symbolleiste Modellierung der Daten.

SLS_MENU_EN.PNG

Sobald Sie auf den Button geklickt haben, erscheint das Dialogfeld.

Die Daten werden in einer Tabelle mit 20 Beobachtungen und 5 Variablen dargestellt. Der FCH ist die abhängige Variable, die Variablen RFP und DI sind die erklärenden Variablen und die Variablen DI, RPP und Jahr werden als instrumentale Variablen verwendet. Da wir den Spaltennamen für die Variablen ausgewählt haben, lassen wir die Option Variablenbeschriftungen aktiviert. SLS_GENERAL_EN.PNG

In der Registerkarte Optionen kann der Benutzer die Toleranz, das Niveau der Konfidenzintervalle und die Option festlegen, ob die Konstante im Modell berücksichtigt wird oder nicht. Hier übernehmen wir die Vorgabewerte. SLS_OPTIONS_EN.PNG

Die Berechnungen beginnen, sobald Sie auf OK geklickt haben. Die Ergebnisse werden dann in einem neuen Tabellenblatt angezeigt.

Interpretieren der Ergebnisse

Die ersten Ergebnisse, die angezeigt werden, sind die Statistiken für die verschiedenen Variablen. Als nächstes zeigt eine Tabelle die Anpassungskoeffizienten des Modells an. Der R² (Bestimmtheitskoeffizient) zeigt den Prozentsatz der Variabilität der abhängigen Variablen an, was durch die erklärenden Variablen erklärt wird. Je näher der R² an 1 liegt, desto besser ist die Anpassung. SLS_TAB1_EN.PNG

Es ist wichtig, die Ergebnistabelle der Varianzanalyse zu untersuchen (siehe unten). Die Ergebnisse ermöglichen es uns festzustellen, ob die erklärenden Variablen signifikante Informationen (Nullhypothese H0) für das Modell liefern oder nicht. In anderen Worten, sie bieten Ihnen die Möglichkeit, sich selbst zu fragen, ob es gültig ist, den Mittelwert zum Beschreiben der Gesamtpopulation zu verwenden, oder ob die von der erklärenden Variablen gelieferten Informationen nützlich sind oder nicht. SLS_TAB2_EN.PNG

Der Fishers F-Test wird verwendet. Angesichts der Tatsache, dass die Wahrscheinlichkeit entsprechend dem F-Wert niedriger als 0,0001 ist, bedeutet das, dass wir einen niedrigeren Risikowert als 0,01 % für die Annahme, dass die Nullhypothese (keine Auswirkung auf die beiden erklärenden Variablen) falsch ist, verwenden würden. Daher können wir mit Sicherheit daraus schließen, dass die drei Variablen eine signifikante Menge an Informationen liefern.

Die folgende Tabelle liefert Details zum Modell (Parameter, SD, ...). Diese Tabelle ist hilfreich, wenn Vorhersagen erforderlich sind oder wenn Sie die Koeffizienten des Modells für eine gegebene Population mit den für eine andere Population erhaltenen vergleichen möchten. SLS_TAB3_EN.PNG

Darüber hinaus geben uns die Tabelle und die Grafiken die Möglichkeit, sich die standardisierten Residuen genauer anzusehen. Diese Residuen müssen normal verteilt sein, d. h. dass 95 % der Residuen im Intervall [-1,96, 1,96] liegen sollten. Mithilfe des Histogramms der Residuen können wir die Residuen, die außerhalb dieses Intervalls liegen, schnell veranschaulichen.

plot 2SLS

Hier liegt keiner der Werte außerhalb des Intervalls.

War dieser Artikel nützlich?

  • Ja
  • Nein