Der Ausländeranteil am 31.12.2013 korreliert linear mit den Zweitstimmen der NPD zur Bundestagswahl am 22.09.2013. Für die Fans: N=16, Pearsons r=-0,743, p=0,001.
Korrelation heißt nicht Kausalität! Niemals nie nicht!
Was ist "Korrelation"?Wenn Datensätze sich ähnlich verhalten, dann spricht man von Korrelation.
Was ist "Kausalität"?Kausalität ist das Prinzip von Ursache und Wirkung. Beispiel: Haue ich mir mit dem Hammer auf den Finger, habe ich Schmerzen.
Der IrrtumNun ist es ist so, dass Korrelationen leicht zu entdecken sind. Häufig vermutet man dann eine Kausalität wo keine ist.
Denn eine hohe Korrelation zweier Variablen bedeutet nicht, dass die beiden Variablen kausal miteinander verknüpft sind. Korrelationen lediglich einen
ersten Hinweis, dass dies der Fall sein
könnte.
Arten des Zusammenhangs1. Variable x verursacht Variable y. Hammer --> Finger --> AUA!
2. Variable y verursacht Variable x.
3. Die beiden Variablen x und y verursachen sich gegenseitig.
4. Die beiden Variablen x und y werden von einer Drittvariablen z verursacht.
5. Variable x verursacht Variable y und die beiden Variablen werden außerdem von einer Drittvariablen z verursacht.
6. Variable y verursacht Variable x und die beiden Variablen werden außerdem von einer Drittvariablen z verursacht.
7. Die beiden Variablen x und y verursachen sich gegenseitig. Außerdem werden die beiden Variablen von einer Drittvariablen z verursacht.
8. Kein Zusammenhang, es handelt sich um einen Zufallfund.
http://www.methoden-psychologie.de/korrelation_kausalitaet.htmlBeispielSo steht der Pro-Kopf-Verbrauch von Käse in einem ursächlichen Zusammenhang mit der Zahl von Menschen steht, die gestorben sind, weil sie sich in ihrem Bettlaken verheddert haben!
Noch mehr Korrelationen
http://www.tylervigen.com/spurious-correlationsSchlussfolgerungKorrelationen lassen den verführerischen Schluss zu, dass Variable x verursacht Variable y. Allerdings bestehen auch andere Formen des Zusammenhangs. Auch ist zu bedenken, dass eine Korrelation zumindest über einen bestimmten Zeitraum hinweg rein zufällig bestehen kann. Je größere Mengen an Big Data wir auswerten können, desto größer wird die Wahrscheinlichkeit von Scheinkorrelationen. Also Zeitreihen die sich ähneln und doch gar nichts miteinander zu tun haben.
@be-eh nun zu deiner Korrelation:
So ist unter anderem denkbar, dass weniger Ausländer in den entsprechenden Länder sind, weil dort die wirtschaftliche Situation schlechter ist (siehe 4.). Und die schlechter wirtschaftlich Situation lässt die Menschen die NPD wählen... Damit sind die Wähler per se nicht ausländerfeindlich!
Andere Beispiel kann sich jeder selber ausdenken.