Variablen definieren
Hier wird zuerst allgemein und dann an einem einfachen Beispiel erklärt, wie man vorgehen muß, wenn man einen Datensatz neu anlegt.
Inhaltsverzeichnis
Erstellen der Datenoberfläche
Bevor man Daten eingeben kann, müssen die Variablen definiert werden. Dazu wechselt man zur Variablenansicht. Beim Definieren der Variablen kann man mehrere Einstellungen für die Variablen vornehmen, die das Verhalten von SPSS beim Rechnen mit diesen Variablen steuern und teilweise die Arbeit erheblich erleichtern. Name
Variablennamen in SPSS durften früher maximal acht Zeichen lang sein (in den neuen Versionen ist das anders, aber im Interesse der Übersichtlichkeit und der Abwärtskompatibilität kann es nicht schaden, sich weiterhin an diesen Grundsatz zu halten). Variablennamen sollten möglichst ‚sprechend’ sein, also dem Nutzer einen Anhaltspunkt geben, was in dieser Variable gespeichert wird. Variablennamen wie ‚Wert1’ ‚Wert2’ etc. sind spätestens bei der Auswertung sehr verwirrend.
Typ
Hier wird in einem Auswahlfenster festgelegt, um welchen Typ Variable es sich handelt. Am häufigsten sind numerische Variablen (z.B. 1 für männlich, 2 für weiblich, Alter, Körpergröße etc.). Stringvariablen enthalten Texte. Sie sind sehr schwer auszuwerten. Für numerische Variablen kann man zusätzlich die Zahl der Stellen und der Nachkommastellen angeben. Achtung: Wenn negative Werte vorkommen können (z.B. bei der Bewertung von Politikern auf einer Stapel-Skala), muß für das Minus-Zeichen eine Stelle reserviert werden.
Spaltenformat und Dezimalstellen
Hier werden bei numerischen Variablen die unter ‚Typ’ erwähnten Angaben über die Zahl der Stellen festgelegt.
Variablenlabel
Eine Bezeichnung für die Variable, die auch mehr als acht Zeichen umfassen darf. Bei Auswertungen wird dieses Label mit angegeben, so daß man weiß, worum es in der analysierten Variable überhaupt geht. Beispielsweise kann man der Variable POLPRAEF das Variablenlabel ‚Politische Präferenz’ zuordnen. Das ist dann etwas klarer als der bloße Variablenname.
Wertelabels
Wenn man z.B. eine 1 für männlich und eine 2 für weiblich in den Datensatz einträgt, kann man den Werten in diesem Menü Bezeichnungen zuweisen. Sie werden bei Auswertungen mit ausgegeben. Man muß immer daran denken nach der Eingabe eines Wertelabels ‚Hinzufügen’ zu klicken, sonst funktioniert das Abschließen des Vorgangs mit ‚OK’ nicht richtig.
Fehlende Werte
Hier wird festgelegt, daß bestimmte Werte bei der Analyse nicht berücksichtigt werden sollen. Das ist beispielsweise dann nötig wenn man z.B. 9 für ‚keine Angabe’ verschlüsselt hat und nur mit den Fällen rechnen möchte, in denen eine Angabe gemacht wurde. Dann setzt man die 9 an dieser Stelle als ‚fehlenden Wert’ ein. Speziell bei Mittelwertvergleichen muß darauf geachtet werden, daß Sonderverschlüsselungen (wie 999 := "Alter nicht angegeben") bei der Berechnung der Mittelwerte nicht berücksichtigt werden.
Spalten und Ausrichtung
Mit diesen Einstellungen kann man das Aussehen der großen Datentabelle (‚Datenmatrix’) verändern.
Messniveau
Hier kann man einstellen, welches Datenniveau diese Variable haben soll. SPSS bietet drei Skalenniveaus an:
- Metrisch. Damit sind Ratioskalen (mit absolutem Nullpunkt, z.B. Alter) und Intervallskalen (mit willkürlichem Nullpunkt, z.B. Grad Celsius) gemeint.
- Ordinal. Ordinalskalen bringen Werte in eine Reihenfolge, ohne daß gesichert wäre, daß die Abstände zwischen den Skalenpunkten gleich sind. Beispiel: Schulnoten.
- Nominal. Nominalskalen sind einfache Zuweisungen von Zahlen zu Ausprägungen, z.B. 1 für ‚männlich’ und 2 für ‚weiblich’.
Das Meßniveau bestimmt, wie man mit den Daten der Variable rechnen kann. Manchmal ist es sinnvoll (bzw. wird einfach so gemacht), mehr zu berechnen, als man eigentlich darf. Deshalb ist es nicht verkehrt, das Meßniveau bei allen Variablen auf ‚Metrisch’ stehen zu lassen. Man muß dann lediglich beim Rechnen selbst daran denken, was man mit welchen Daten rechnen kann, und was nicht.
Beispiel
Ein Beispiel für einen sehr einfachen Datensatz, der z.B. aus einem sozialwissenschaftlichen Experiment stammen könnte:
Folgende Daten liegen auf den DIN-A4-Fragebögen vor:
Gruppe (gehört der Befragte zur Experimentalgruppe A oder zur Kontrollgruppe B?) Geschlecht Alter Meinung über die SPD (fünfteilige Skala) Meinung über die CDU (fünfteilige Skala)
Folgendermaßen kann die Umsetzung in SPSS-Variablen aussehen (wobei hier davon ausgegangen wird, daß Variablennamen nur acht Zeichen lang sein können, wie das bei früheren SPSS-Versionen der Fall war); genannt werden der Variablenname, die Ausprägungen und die empfohlenen Variablenlabels und das (offizielle) Meßniveau:
GRUPPE: 1=Experimentalgruppe; 2=Kontrollgruppe (Nominalskala) SEX: 1=männlich; 2=weiblich; 9=keine Angabe (Nominalskala) ALTER: Alter in Jahren (Ratioskala/metrisch) SPDMNG: 1=sehr schlechte Meinung über die SPD; 3=ambivalente Meinung über die SPD; 5=sehr gute Meinung über die SPD; 9=keine Angabe (Ordinalskala) CDUMNG: 1=sehr schlechte Meinung über die CDU; 3=ambivalente Meinung über die CDU; 5=sehr gute Meinung über die CDU; 9=keine Angabe (Ordinalskala)