Fälle auswählen

Aus Meinungsklima.de
Version vom 17. April 2019, 13:03 Uhr von Trg (Diskussion | Beiträge) (Beispiele: erweitert, kat)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springenZur Suche springen

Fälle auswählen... erreicht man über das Menü "Daten". Man kann damit Fälle aus dem Datensatz ausblenden oder löschen.

Hauptmenü

Das Hauptmenü der Funktion "Fälle auswählen..." ermöglicht es,

  • Fälle nach einer bestimmten Bedingung auszuwählen
  • eine Zufallsstichprobe aus den Fällen zu ziehen
  • einen bestimmten Fall-Bereich auszuwählen
  • eine Variable des Datensatzes als Filterkriterium auszuwählen
  • einzustellen, ob die Fälle, die nicht ausgewählt sind, gefiltert (ausgeblendet) oder gelöscht (aus dem Datensatz entfernt) werden sollen. Meistens filtert man nur, weil die Daten normalerweise später wieder eingeblendet und weiter analysiert werden.

Auswählen falls

Die wichtigste Funktion von "Fälle auswählen..." ist "Auswählen falls". Man erreicht das entsprechende Menü durch Klicken auf die Schaltfläche "Falls...".

Links sieht man die Liste der zur Verfügung stehenden Variablen des Datensatzes. In das Feld oben rechts werden die Kriterien für die Fallauswahl geschrieben; das geschieht zum Teil über die Tastatur, zum Teil auch mit der eingeblendeten Operator-Tastatur. In dem Kästchen unten rechts können mathematische und logische Funktionen ausgewählt werden.

Beispiel: Aktiv bleiben sollen nur Fälle, bei denen in der Variable Geschlecht (SEX) eine 1 steht und die Werte in der Variable ALTER größer als 22 sind (also nur Männer ab 23 Jahren). Eine solche Auswahl ist sinnvoll, wenn beispielsweise eine Untersuchung nur für eine bestimmte Zielgruppe durchgeführt werden soll.

Operatoren und Funktionen

Die Formel für die Auswahl der Fälle kann recht kompliziert ausfallen. Im folgenden werden zunächst die Operatoren und die wichtigsten Funktionen erklärt und dann einige Beispiele für komplexere Auswahldefinitionen beschrieben.

   + Plus
   < Kleiner als
   > Größer als
   - Minus
   <= Kleiner oder gleich
   >= Größer oder gleich
   * Mal (Multiplizieren)
   = Gleich
   ~= Nicht gleich
   / Durch (Dividieren)
   & Und
   | Oder
   ** Hoch (Potenzierung)
   ~ Nicht-Operator
   ( ) Klammern
   MISSING( ) In Klammern wird die Variable angegeben, die auf fehlende Werte (Missings) untersucht werden soll. 

Beispiele

1. Ausgewählt werden sollen Fälle, bei denen die Befragten Männer unter 26 oder Frauen über 24 waren:

(SEX = 1 & ALTER < 26) | (Sex=2 & ALTER >=25)

2. Wie im vorherigen Beispiel, aber nur, wenn Angaben zur Meinung über die CDU gemacht wurden:

((SEX = 1 & ALTER < 26) | (Sex=2 & ALTER >=25))& ~MISSING(CDUMNG)

3. Wie im vorherigen Beispiel, aber nur, wenn die Angaben zur Meinung über die SPD fehlen:

((SEX = 1 & ALTER < 26) | (Sex=2 & ALTER >=25))& (~MISSING(CDUMNG)& MISSING(SPDMNG))

Es empfiehlt sich bei komplexeren Auswahldefinitionen im Datensatz zu prüfen, ob die Auswahl den gewünschten Erfolg hatte; bei Problemen hilft es oft, die Klammerausdrücke und die logischen Beziehungen von & und | genau zu überprüfen.

Anwendungen

"Fälle auswählen" wird häufig verwendet, um eine Untersuchung auf bestimmte Fälle einzugrenzen, z.B. Befragte eines bestimmten Geschlechts und Alters, ggf. kombiniert mit anderen Merkmalen, wie Beruf oder politischer Präferenz. Bei Inhaltsanalysen können Untersuchungseinheiten mit besonderen Merkmalen für die weitere Analyse ausgewählt werden, z.B. Beiträge, in denen Angela Merkel und Gerhard Schröder gemeinsam vorkommen und die Grünen eine schlechte Bewertung erfahren.

Eine andere Anwendung ist die Datenbereinigung. Wenn es bestimmte Fallkonstellationen nicht geben darf (z.B. Angela Merkel kommt in einem Beitrag gar nicht vor, wird aber als "sympathisch" bewertet) oder geben muß (wenn Gerhard Schröder erwähnt wird, muß auch ein Wert für seine Bewertung als "sympathisch" eingetragen sein), lässt sich das mit "Fälle auswählen..." gut ermitteln. Dazu ist insbesondere die Funktion MISSING( ), auch in Kombination mit ~ (= "nicht") wichtig.

Die Funktion "Zufallsstichprobe" ermöglicht es aus großen Datensätzen kleinere zu machen oder aus einem Datensatz, der eine Grundgesamtheit enthält (z.B. alle Mitarbeiter einer Firma) eine Zufallsstichprobe zu ziehen.