Direkt zum Inhalt

Anleitung zum Einlesen von großen CSV- oder Textdateien in Excel

In dieser Anleitung wird gezeigt, wie Sie Text- und CSV-Datendateien in Excel laden und anschließend mithilfe der XLSTAT-Funktion Datenverwaltung analysieren.

Diese Importmethode lädt Daten in den Arbeitsspeicher des Computers und nicht in das Arbeitsblatt. Daher können wir Dateien laden, die die Standardgröße des Excel-Arbeitsblatts überschreiten (1.048.576 Zeilen und 16.384 Spalten in Excel 2016).

Datasatz

Ein Verkaufsleiter zeichnet täglich zwei Dateien auf. Die erste enthält die Produkt-IDs und die Rechnungen (Tabelle 1), während die zweite die Bestell-IDs jeder Filiale (Tabelle 2) enthält.

Klicken Sie hier, um Tabelle 1 herunterzuladen. Klicken Sie hier, um Tabelle 2 herunterzuladen. Klicken Sie hier, um die Ausgabedatei herunterzuladen.

Ziel dieser Anleitung​

Der Verkaufsleiter möchte den Gesamtrechnungsbetrag für jede Filiale festlegen. Zu diesem Zweck möchte er die Daten nicht in das Excel-Arbeitsblatt laden, sondern arbeitet direkt mit dem Arbeitsspeicher. Zuerst fügen wir die beiden Dateien zusammen, um jede Rechnung mit dem richtigen Geschäft abzugleichen. Dann berechnen wir den Rechnungsbetrag nach Geschäft.

Einrichten des Dialogfelds "Datei Import" für die Datenverwaltung

Schritt 1: Verbinden Sie zwei Tabellen

Wenn XLSTAT aktiviert ist, wählen Sie den Menüunkt XLSTAT / Datenvorbereitung/ Datenverwaltung. ​

Nachdem Sie auf die Schaltfläche geklickt haben, wird folgendes Dialogfeld angezeigt: Wählen Sie im Feld Methode die Option Zusammenführen (Innen). Es erscheinen zwei neue Felder: Tabelle 1 und Tabelle 2.

Um eine Textdatei als Datenquelle zu verwenden, klicken Sie auf das Maussymbol, bis das orangefarbene Papierblatt angezeigt wird (Abbildung 4). Neben jedem Tabellenfeld wird ein Fragezeichen angezeigt (eingekreiste Schaltfläche, Abbildung 4).

Klicken Sie zum Laden der ersten Datei auf das Fragezeichen neben Tabelle 1. Das Dialogfeld Datei Import wird angezeigt (Abbildung 5). Stellen Sie die Parameter ein, um demoDMAJoin_Order.txt einzulesen**.** Die Parameter sind: a) das Trennzeichen, welches jede Spalte separiert (in dieser Datei wird TAB verwendet), b) das Textqualifikationsmerkmal, das ein komplexes Element definiert (d. h. ein Element mit Leerzeichen, Trennzeichen usw.),c) das Feld Beginn des Imports in der Zeile, um die ersten Zeilen, die als Überschrift verwendet werden, zu überspringen (hier werden keine übersprungen) und d) das Feld Kommentar-Qualifikationsmerkmal, das für kommentierten Text in der Datei erforderlich ist (hier wird für jede Zeile der gesamte Text nach dem Zeichen "#" nicht geladen).

Klicken Sie auf die Schaltfläche OK, um die Parameter zu speichern.

Um eine Vorschau vor dem Laden der Datei anzuzeigen, klicken Sie auf die Schaltfläche Vorschau. Sie können jetzt die Variablen im Dialogfeld auswählen. Wiederholen Sie den gleichen Vorgang mit Tabelle 2.​ Klicken Sie auf OK, um die Ergebnisse in einem neuen Arbeitsblatt namens Zusammengeführt (Innen) anzuzeigen.

Schritt 2: Aggregieren (Gruppieren) von Daten

Der nächste Schritt ist die Berechnung der Gesamtabrechnung nach Filiale. Wählen Sie erneut den Menüpunkt XLSTAT / Vorbereiten der Daten / Datenverwaltung aus. Klicken Sie einmal auf das orangefarbene Papierblatt, um in den Mausauswahlmodus zu wechseln, und wählen Sie die Gruppierungsmethode aus. Klicken Sie auf das Feld Daten und wählen Sie die Spalten Rechnung und Laden aus. Wählen Sie schließlich den Gruppierungsschlüssel Laden.

Die Ergebnisse der Datenaggregation werden in einem neuen Arbeitsblatt mit dem Namen Gruppe angezeigt. Die Gesamtabrechnung beträgt: 109 € für Filiale A, 97 € für Filiale B und 27 € für Filiale C.

Was kommt als nächstes?

Die Funktion zur Datei Importierung wird zunächst an die Funktion Datenverwaltung angepasst, wird jedoch noch an weitere Methoden angepasst. Diese Methode fügt XLSTAT neue Möglichkeiten hinzu, da Ihre Daten nicht in ein Arbeitsblatt, sondern direkt in den Arbeitsspeicher geladen werden. Auf diese Weise können Sie Daten mit mehr Elementen als der Excel-Arbeitsblattgröße laden (1.048.576 Zeilen mal 16.384 Spalten).

War dieser Artikel nützlich?

  • Ja
  • Nein