PLS-Pfadmodell in Excel erstellen und ausführen

Dieses Tutorium zeigt Ihnen, wie Sie ein einfaches partielles kleinste Quadrate Pfadmodellierungs (PLS-PM)-Projekt in Excel mithilfe der Software XLSTAT erstellen und ausführen.

Prinzipien des PLS Path Modeling

Die partielle kleinste Quadrate Pfadmodellierung (PLS-PM) ist ein statistischer Ansatz für die Modellierung komplexer multivariabler Beziehungen (Strukturgleichungsmodelle) unter beobachteten und latenten Variablen. Seit einigen Jahren erfreut sich dieser Ansatz wachsender Beliebtheit in verschiedenen Wissenschaften (Esposito Vinzi et al., 2007). Strukturgleichungsmodelle umfassen eine Reihe von statistischen Methodologien, die die Schätzung eines kausalen theoretischen Netzwerks aus Beziehungen ermöglichen, die latente komplexe Konzepte verbinden, von denen jedes mithilfe einer Reihe von beobachtbaren Indikatoren gemessen wird.
Die erste Darstellung des abgeschlossenen PLS-Ansatzes für Pfadmodelle mit latenten Variablen wurde veröffentlicht von Wold im Jahre 1979, und die wichtigsten Verweise auf den PLS-Algorithmus stammen von Wold (1982 und 1985).
Herman Wold stellte dem „hard modelling“ von LISREL (Jöreskog, 1970) (starke Verteilungsannahmen, mehrere hundert Fälle erforderlich) das PLS „soft modelling“ gegenüber (sehr wenige Verteilungsannahmen, wenige Fälle können ausreichen). Diese beiden Ansätze für das Strukturgleichungsmodell wurden in Jöreskog and Wold (1982) verglichen.
Vom Standpunkt des Strukturgleichungsmodells ist der PLS-PM-Ansatz ein komponentengestützter Ansatz, bei dem das Konzept der Kausalität hinsichtlich einer linearen konditionellen Erwartung formuliert wird. Der PLS-PM-Ansatz sucht nach optimalen, linearen, prädiktiven Beziehungen anstatt nach kausalen Mechanismen und bevorzugt somit einen Prädiktions-/Relevanzorientierten Entdeckungsprozess gegenüber der statistischen Untersuchung kausaler Hypothesen. Zwei sehr wichtige Fachveröffentlichungen zum PLS-Ansatz für das Strukturgleichungsmodell sind Chin (1998, mehr anwendungsorientiert) und Tenenhaus et al. (2005, mehr theoretisch orientiert).
Darüber hinaus kann PLS Path Modeling zur Analyse mehrere Tabellen verwendet werden, und stehen in direktem Zusammenhang mit klassischeren Datenanalysemethoden, die in diesem Feld verwendet werden. In der Tat können PLS-PM auch als ein sehr flexibler Ansatz für eine Multi-Block- oder (Mehrfachtabellen-)Analyse sowohl mithilfe des hierarchischen PLS Path Modeling als auch des bestätigenden PLS Path Modeling angesehen werden (Tenenhaus and Hanafi, 2007). Dieser Ansatz zeigt deutlich, wie die „datengesteuerte“ Tradition von Mehrfachtabellen-Analysen auf gewisse Weise mit der „theoriegesteuerten“ Tradition des Strukturgleichungsmodells vermischt werden kann, sodass die Analyse der Multi-Block-Daten angesichts der aktuellen Erkenntnisse über konzeptuelle Beziehungen zwischen Tabellen ermöglicht wird.
In diesem Tutorium zeigen wir Ihnen Schritt für Schritt, wie Sie ein Projekt erstellen, ein Modell definieren, die Parameter schätzen und die Ergebnisse analysieren. Dieses Tutorium basiert auf der folgenden Abhandlung: [Tenenhaus M., Esposito Vinzi V., Chatelin Y.-M. and Lauro C. (2005). PLS Path Modeling. Computational Statistics & Data Analysis, 48(1), 159-205].

PLS Path Modeling mit XLSTAT-PLSPM

Datensatz für die PLS Path Modeling-Analyse

Die Anwendung basiert auf Daten aus dem echten Leben. 250 Kunden von Mobiltelefonbetreibern wurden einigen Fragen gestellt, um ihre Loyalität modellieren zu können. Das PLSPM-Modell basiert auf dem European Customer Satisfaction Index (ECSI). Im ECSI-Modell stehen die latenten Variablen (Konzepte, die nicht direkt gemessen werden können) wie nachfolgend dargestellt miteinander in Beziehung.

Jede latente Variable ist mit einer oder mehreren Manifestvariablen, die gemessen werden, verbunden. In diesem Anwendungsfall liegen die Fragen zu Manifestvariablen auf einer Skala von 0-100. Beispielsweise lauten die fünf Manifestvariablen für die latente Variable Image:

Man kann sich drauf verlassen, was der Betreiber sagt und tut
Er ist stabil und fest etabliert
Er leistet einen sozialen Beitrag zur Gesellschaft
Er ist um das Wohl der Kunden bemüht
Er ist innovativ und vorausschauend

Ein XLSTAT-PLSPM-Projektblatt mit den Daten und Ergebnissen, die in diesem Tutorium behandelt werden, kann hier heruntergeladen werden.
XLSTAT PLSPM-Projekte sind spezielle Excel-Arbeitsmappen-Vorlagen. Beim Erstellen eines neuen Projekts beginnt der Standardname mit PLSPMBook.
Sie können die Vorlage dann unter dem gewünschten Namen speichern. Achten Sie aber darauf, den Befehl „Speichern“ oder „Speichern unter“ des XLSTAT-PLSPM-Menüs zu verwenden, um die Vorlage im Ordner, der für die PLSPM-Projekte bestimmt ist, mit der Erweiterung *.ppmx zu speichern.

Hinweis: Wenn Sie die Datei PLSPathModeling_ECSI.ppm öffnen, sieht die grafische Darstellung möglicherweise schlecht aus. Dies lässt sich auf die Tatsache zurückführen, dass die Darstellung von Ihren Bildschirmeinstellungen abhängt. Um die Anzeige zu verbessern, klicken Sie auf den Button „Optimieren der Anzeige“ (siehe unten).
Ein rohes XLSTAT-PLSPM-Projekt enthält zwei Tabellenblätter, die nicht entfernt werden können:

D1: Dieses Tabellenblatt ist leer, und Sie müssen alle Eingangsdaten, die Sie in diesem Tabellenblatt verwenden möchten, hinzufügen.
PLSPMGraph: Dieses Tabellenblatt ist leer und wird zum Entwerfen des Modells verwendet. Wenn Sie dieses Tabellenblatt auswählen, wird das Menü „Pfadmodellierung“ oben links auf der Seite angezeigt.

Einrichten einer PLS Path Modeling-Analyse

Um das in diesem Tutorium verwendete Projekt zu erstellen, haben wir zuerst ein neues Projekt mithilfe des Menüs XLSTAT-PLSPM generiert:

PLS Path Modeling ist eine komplexe Methode, und das PLSPM-Modul von XLSTAT verfügt über viele Optionen und Eigenheiten. Um die Anwendung eines einfachen Modelles zu vereinfachen, stehen zwei Anzeigen zur Verfügung.

Die Standard-Anzeige, genannt „klassisch“, zeigt die Hauptfunktionen, die für die Anwendung von PLS Path Modeling notwendig sind, und eine komplexere Anzeige, genannt „Expertenanzeige“, zeigt zahlreiche neue Optionen wie Mehrfachgruppen-Tests, Schätzung des Moderatoreffekts, Superblock-Verfahren....an. Zum Ändern dieser Option klicken Sie auf den Button XLSTAT-PLPM-Optionen der XLSTAT-PLSPM-Symbolleiste.**

Wir haben dann das Projekt als PLSPM_ECSI.ppmx mithilfe des Befehls Speichern unter im gleichen Menü gespeichert.

Danach haben wir die Daten kopiert, die in der Excel-Datei verfügbar waren, und haben sie in das D1 Tabellenblatt des Projekts eingefügt. Sobald dieser Vorgang abgeschlossen ist, sind Sie bereit, mit dem Erstellen des Modells zu beginnen. Fahren Sie mit dem Tabellenblatt PLSPMGraph fort. Die Symbolleiste wird in der oberen rechten Ecke dieses Tabellenblatts angezeigt. Sie finden Details zur Funktion jedes Buttons in der Hilfe.

Um mehrere latente Variablen in einer Zeile zu erstellen, doppelklicken Sie auf den kreisförmigen Button, sodass er gedrückt bleibt, während Sie Variablen hinzufügen:

Sie können dann die Pfeile hinzufügen, die anzeigen, wie die latenten Variablen zusammenhängen. Um einen Pfeil hinzuzufügen, klicken Sie auf die latente Variable, von der er ausgehen soll, drücken Sie dann die Strg.-Taste und klicken Sie auf die latente Variable, an der der Pfeil enden soll. Dann klicken Sie auf den Pfeil-Button oder verwenden die folgende Tastenkombination: Strg+L.

Wenn alle Pfeile hinzugefügt wurden, können Sie die Manifestvariablen definieren, die sich auf jede latente Variable beziehen (dies kann auch nach dem Hinzufügen der latenten Variablen erfolgen). Um Manifestvariablen zu einer latenten Variable hinzufügen, wählen Sie die latente Variable und klicken Sie auf den Button MV in der Symbolleiste:

Dies aktiviert das Tabellenblatt D1 und zeigt ein Dialogfenster an, in dem Sie der latenten Variablen einen Eigennamen geben, die Manifestvariablen in D1 auswählen und einige Einstellungen definieren.

Der Modus muss definiert werden. Im Modus A (reflektiver Modus) ist die latente Variable dafür verantwortlich, was für die Manifestvariablen gemessen wird, und im Modus B (formativer Modus) konstruieren die Manifestvariablen die latente Variable. Beispielsweise sah das Dialogfenster so aus, nachdem es für die latente Variable Erwartung ausgefüllt wurde:

Das erhaltene Modell hat die folgende Form:

Sobald die Manifestvariablen für jede latente Variable definiert wurden und die latenten Variablen verknüpft wurden, können Sie mit der Berechnung des Modells beginnen. Zum Ausführen des Modells klicken Sie auf den Button Wiedergabe.

Das Dialogfenster Ausführen erscheint, in dem viele Optionen verfügbar sind. Für dieses Tutorium wurden die folgenden Optionen verwendet:

PLS Path Modeling basiert auf einem iterativen Algorithmus und muss somit initialisiert werden. Für diese Anwendung werden Manifestvariablen (beobachtete Variablen) ohne vorherige Transformationen behandelt (4 verschiedene Einstellungen stehen zur Verfügung), da alle Variablen sich auf derselben Skala befinden. Die Anfangswerte für die externen Gewichte sind die Werte des ersten Eigenvektors bei der Durchführung einer Hauptkomponenten-Analyse auf den Manifestvariablen, die mit einer latenten Variablen verbunden sind (2 verschiedene Einstellungen sind verfügbar).

Wir verwenden das Zentroid-Schema für die Schätzung der inneren Gewichte. Konfidenzintervalle erhält man über wiederholte Bootstrap-Stichproben.

In unserem einfachen Beispiel gibt es keine fehlenden Daten im Datensatz. Somit akzeptieren wir keine fehlenden Werte.

Schließlich werden für die Ausgabe alle Felder markiert (außer Korrelationen) und wir untersuchen im folgenden Teil jede Ausgabe.

Ergebnisse und Interpretation eines PLS-PM-Projekts

In den Ergebnissen werden Informationen zu den Manifestvariablen, dem Messmodell und dem Strukturmodell zuerst zusammengefasst.

Numerische Ergebnisse für eine PLS Path Modeling-Analyse

Die ersten wichtigen Elemente sind die Blocktreue-Indizes:

In dieser Anwendung sind latente Variablen reflektiv. Die Blöcke müssen eindimensional sein. Wir können sehen, dass Dillon-Goldsteins Rho größer als 0,7 ist und dass der erste Eigenwert immer weitaus größer als der zweite ist. Erwartung und Loyalität haben schlechte Werte für Cronbach -Alpha, und eine zweite Dimension könnte signifikant sein. In diesem Tutorium konzentrieren wir uns auf den Fall mit einer Dimension. Wenn Sie an weiteren Dimensionen interessiert sind, können Sie die Korrelationen zwischen Manifestvariablen und Faktoren in einer Hauptkomponenten-Analyse untersuchen, die für jeden Block von Manifestvariablen angewendet wird. Wir konzentrieren uns nicht auf diesen Punkt und berücksichtigen nur eine Dimension. Die Anwendung des PLS Path Modeling ergibt die Tabelle mit GoF-Indizes:

Anwendung des PLS Path Modeling ergibt die Tabelle mit GoF-Indizes:

Wir können sehen, dass der absolute GoF 0,465 beträgt und sehr nahe an der Bootstrap-Schätzung liegt. Der Wert lässt sich schwer interpretieren; er könnte beim Vergleichen der globalen Qualität von zwei Beobachtungsgruppen oder zwei verschiedenen Modellen nützlich sein. Die relative GoF ist sehr hoch. Das gilt ebenfalls für die GoF der inneren und äußeren Modelle. Dann sollten Sie die Cross-loadings überprüfen:

Wie im Fall unseres Datensatzes sind die Loadings zwischen Manifestvariablen und ihrer eigenen latenten Variablen am höchsten. Dann werden die äußeren Gewichte und Korrelationen in zwei großen Tabellen gesammelt. Wenn wir die Korrelationen zwischen Manifestvariablen und latenten Variablen untersuchen:

Wir können beispielsweise sehen, dass die Manifestvariablen CUSA3 und CUSA2 einen größeren Effekt auf die Zufriedenheit haben als CUSA1. Diese Tabellen zeigen den Einfluss jeder Manifestvariablen auf die zugeordnete latente Variable. Die mit dem strukturellen Modell zusammenhängenden Ergebnisse folgen. Für jede latente Variable werden Informationen zum strukturellen Modell gesammelt. Im Fall der Zufriedenheit haben wir:

Ein R’² von 0,672 gilt als gutes Ergebnis. Wir können sehen, dass die wahrgenommene Qualität den größten Effekt auf Zufriedenheit hat, und dass der Einfluss der Erwartung nicht signifikant ist. Die letzte Tabelle fasst die Ergebnisse zusammen und zeigt, dass der wahrgenommene Wert zu 64 % des R’² der Zufriedenheit beiträgt. Das Diagramm veranschaulich diese Ergebnisse:

The

Die nächste Tabelle zeigt verschiedene, prädiktive Qualitätsindizes, die sowohl mit den äußeren als auch den inneren Modellen für jede latente Variable verbunden sind. Mittelwerte dieser Indizes ergeben einen globalen Qualitätswert. Wir sehen, dass der Mittelwert aller R’² 0,378 ist und der R’² der Zufriedenheit am höchsten ist. Kommunalitäten sind immer größer als Redundanzen, da der PLSPM-Ansatz die Messmodelle in seinem Schätzungsverfahren begünstigt.

Einer der größten Vorteile von PLSPM sind die Scores der latenten Variablen. Sie werden angegeben und können für andere statistische Bearbeitungen mit XLSTAT verwendet werden. Diese Studie hat gezeigt, wie das XLSTAT-PLSPM-Modul im Fall echter Daten zu verwenden ist. Sobald das Modell gezeichnet wurde, ist das Verfahren einfach. Sobald das Modell bestätigt wurde, kann die Interpretation des Ergebnisses durch das Lesen der Tabellen mit Pfadkoeffizienten und Korrelationen erfolgen.

Grafische Ausgabe für die PLS Path Modeling-Analyse

Sie können viele Arten von Ergebnissen im Pfadmodell mit XLSTAT-PLSPM anzeigen. Wählen Sie aus allen möglichen Indizes, die Sie beim Klicken auf den Button „Auswahl der anzuzeigenden Ergebnisse“ erhalten:

**Das Dialogfenster „Ergebnisse“ erscheint. Es hat drei Seiten: Die erste Seite betrifft die Anzeige von Indizes der latenten Variablen: Die zweite Seite betrifft die Anzeige von Koeffizienten und Indizes auf den Pfeilen zwischen latenten Variablen Die dritte betrifft die Anzeige von Koeffizienten und Indizes auf den Pfeilen zwischen Manifestvariablen und latenten Variablen: Die Ergebnisse werden im Pfadmodell im Tabellenblatt PLSPMgraph angezeigt, wenn Sie auf den Button „Anzeigen der Ergebnisse“ klicken.

Sie können das gesamte Diagramm auswählen und es in ein anderes Dokument kopieren.

War dieser Artikel nützlich?

Ja
Nein