Wenn Sie Fragen stellen möchten,
einfach per Mail, direkt oder per WhatsApp
0178 87 55 145 oder
0157 740 58 477.
Ich beantworte Fragen gerne und gebe gern den einen oder anderen Tipp. Wenn Sie etwas von mir rechnen lassen möchten, bräuchte ich Einblick in Ihre Daten (Excel, SPSS-Daten) und eine Liste Ihrer Fragen (eine Word-Seite).

Mehr Korrelation als Schein.
Beispiele für Scheinkorrelationen


Ist eine Korrelation immer ein Indikator für eine Kausalkette?

Wenn man so fragt, natürlich nicht. Gemeint ist ein Korrelationskoeffizient, der in Wirklichkeit durch Zufall oder eine Dritt-Variable entstanden ist. Kann im Prinzip jeden treffen, der entweder mit einem Statistikprogramm arbeitet oder selber forscht und Daten erhebt. "Wirklichkeit" meint hier spätere Forschungen. Drittvariable meint hier das gleiche, nur dass man in Folge mehr Variablen erhoben hat und die Erklärungsmodelle umbaut.

Beispiele

1.Eisverkauf und Sonnenbrände korrelieren scheinbar. Bekommt man durch Eis-Essen häufiger Sonnenbrand? Natürlich nicht, aber wenn man die Frage präziser stellt ('bekommt man an Tagen, wo man häufig Eis ißt auch häufiger einen Sonnenbrand?'), wird klarer, dass die Drittvariable die aktuelle Außentemperatur ist.
2.Eisverkauf und Ertrinkungsunfälle korrelieren scheinbar ebenso. Drittvariable ist wieder die aktuelle Temperatur.
3.Störche und Geburten, das klassisches Lehrbuchbeispiel schlechthin. Drittvariable ist die Ortsgröße. Größere Häuser hatten mehr Störche auf dem Dach, in größeren Häusern wohnten mehr Leute. Dort, wo mehr Leute wohnen, wurden mehr Kinder geboren.
4.Eiscreme und Haiangriffe, auch hier ist die Drittvariable die Temperatur.
5.Margarinekonsum und Scheidungsrate in den USA, Drittvariable war evtl. der wirtschaftliche Status.
6.Anzahl der Webseiten im Internet und Ausmaß der Windenergie, Drittvariable ist hier der technische Fortschritt.
7.Schuhgröße und Lesekompetenz bei Kindern, Drittvariable (wer hätte das gedacht) ist das Alter. Je älter, desto höher die Kompetenz, je älter, desto größer die Füße.
8.Aktuelles Beispiel aus der Forschung zur Fehlannahme, die Einnahme von Magensäureblockern verursache Alzheimer. Drittvariable ist wieder das Alter. Ältere nehmen diese Medikamente häufiger ein, Ältere bekommen häufiger Alzheimer.
9.Noch ein aktuelles Beispiel aus der Forschung zur Fehlannahme, die Einnahme von Cholesterinsenkern verursache Diabetes, Muskelschwäche und Gedächtnisverlust. Drittvariable ist auch hier wieder das Alter. Ältere Leute nehmen diese Medikamente ein, Ältere bekommen häufiger Diabetes, Muskelschwäche und Gedächtnisverlust.

Gemeinsames Prinzip der obigen Beispiele ist immer eine Drittvariable (eine sog. intervenierende Variable). Sie ist meist versteckt, weil man sie schlicht nicht gemessen oder weil man gar nicht daran gedacht hat (Temperatur). Sie korreliert hoch mit beiden Zielmerkmalen (Eisverkauf, Sonnenbrände).
Natürlich entsehen Korrelationen auch per Zufall: In größeren Datensätzen oder bei hypothesenfreiem Data-Mining ohne Korrektur der Risiken falsch-positiver Befunde findet man zwangsläufig Muster, die stark nach einer sensationellen Korrelation riechen.

Fazit

Eine Korrelation ist kein Beweis für Kausalität, es muss noch nicht einmal ein Hinweis sein. Umgekehrt setzt Kausalität immer eine Korrelation voraus. Wenn man Scheinkorrelationen in seinen Daten hat, ist jeder Interpretationsansatz zum Scheitern verurteilt, da man Muster erklären möchte, die im Grunde genommen keinen Sinn ergeben (auch wenn es scheinbar so aussieht).

Eine Scheinkorrelation wird meist nicht selbst vom Forschenden identifiziert, da er die relevante Drittvariable meist gar nicht erhoben hat, oder keine expliziten Apriori-Hypothesen und ausreichende Deckung über relveante Theorien hatte. Im Nachhinein ist das Auftreten einer Scheinkorrelation (Eisessen und Sonnenbrand) meist ein Hinweis darauf, dass die Frage nicht präzise genug gestellt (siehe oben unter 1.) und nicht aus einer bestehenden Theorie (steigende Wärme verändert den Bedarf nach Abkühlung) abgeleitet wurde.

Denkansatz

Frage: Welche Scheinkorrelationen spielen in Ihrer aktuellen Forschung oder in Ihrem ganz persönlichen Tagesablauf eine Rolle? Gibt es mögliche Drittvariablen, welches sind sie, haben Sie sie abgeprüft und wie kann das ganz konkret abtesten?

Referenz

Bortz, J., & Döring, N. (2015). Forschungsmethoden und Evaluation für Human- und Sozialwissenschaftler. Springer. (Scheinkausalität und Drittvariablen werden dort ausführlich besprochen).

Diekmann, A. (2010). Empirische Sozialforschung: Grundlagen, Methoden, Anwendungen. Rowohlt. (Scheinkorrelationen bei Kausalmodellen).