Zusammenfügen unterschiedlicher Daten

/>Wenn man Variablen in zwei verschiedenen Dateien hat, kann man sie einfach mit einem Statistikprogramm zu einer Datei zusammenfügen. Sind beide Datensätze im selben Format ist das auch nicht weiter ein Problem.
Wenn man aber Verlaufsdaten (Bild2) und Querschnittsdaten (Bild1, jeweils klicken zum vergrößern) hat und diese zusammenfügen will, dann ist das nicht ganz so einfach. Je nachdem wie man es macht, kommen ganz unterschiedliche Ergebnisse zustande.

[tipp]
Für Testzwecke sollte man sich einen kleinen Datensatz mit ein paar Variablen und maximal 10 Fällen zusammenstellen. Das kann man schnell von Hand machen. Durch den kleinen und überschaubaren Datensatz, kann man sofort erkennen, wenn etwas schief gelaufen ist. Die Fehlersuche gestaltet sich ebenfalls einfacher und man kann alles besser nachvollziehen.
[/tipp]

Das Problem dabei ist die mehrfach auftretende Identifikationsnummer der Fälle in den Verlaufsdaten. Wenn man beispielsweise die verschiedenen Bildungsabschnitte erfasst, jeweils mit Anfangs- und Enddatum. Die verschiedenen Abschnitte stehen nun jeweils in einer separaten Zeile und jede Zeile muss natürlich die ID des Falls beinhalten. Bei den Querschnittsdaten ist aber pro Fall nur eine Zeile vorhanden. Da bei SPSS ja gerne das Menü benutzt wird, erkläre ich es kurz was man im Menü auswählen muss und danach noch an der Syntax. Im Menü sollte man unbedingt „Variablen hinzufügen“ benutzen. Im folgenden Menü muss eine Schlüsseltabelle ausgewählt werden. Dabei ist wichtig, dass die Datei, die die Querschnittsdaten enthält die Schlüsseltabelle ist, da nur hier jede ID genau einmal enthalten ist. Macht man es anders herum, oder wählt man „Beide Dateien liefern Fälle“ aus, so führt dies zu einer Fehlermeldung bzw. zu einem unbrauchbaren Ergebnis.

Am Ende sollen die Daten der Querschnittsdatei in jeder Zeile Stehen und nicht nur in einer. Denn ansonsten kann man im Zweifel keine Variable berechnen, wenn die dafür benötigten Daten in unterschiedlichen Zeilen stehen.

In der Syntax sieht das dann so aus. Der Befehl zum Zusammenfügen der Daten lautet MATCH, TABLE ist das Datenset, das als Schlüsseltabelle dient. FILE ist die andere Datei und das BY sagt SPSS welche Variable als Identifkation für die Fälle dient. Mit DATASET ACTIVATE werden die Daten in dieses Datenblatt geschrieben.


DATASET ACTIVATE DatenSet_spell.
MATCH FILES /FILE =*
/TABLE='DatenSet_quer'
/BY ID.
EXECUTE.

spellquerHat man dies nun durchgeführt, so sollte die Tabelle so aussehen wie in Bild 3. Die Querschnittsdaten werden jeweils so lange wiederholt, wie es Episoden in der Verlaufsdaten gibt. VAR7-9 sind die Querschnittsdaten. Jetzt kann man mit beiden Datensätzen Berechnungen durchführen, oder neue Variablen generieren.

Speichere in deinen Favoriten diesen permalink.

Eine Antwort zu Zusammenfügen unterschiedlicher Daten

  1. sylvi sagt:

    Vielen vielen Dank,
    bin sehr froh, dass ich diese Seite gefunden habe!
    Bin beim zusammenfügen meiner Datensets schon verzweifelt!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert