Ist es Zufall oder liegt eine Korrelation vor? Oftmals werden wir von vermeintlichen Zusammenhängen zwischen Datenreihen getäuscht. Sei auf der Hut und verwende nur Indikatoren, die relevant sind (z.B. Expected Goals / Big Chance Data).
Folgender Artikel erklärt den Begriff der Scheinkorrelation und die Bedeutung für Sportwetten.
Was ist eine Scheinkorrelation?
Wenn es eine Korrelation zwischen A und B gibt, kann A also Ursache von B sein, oder B kann Ursache von A sein. Es kann aber auch sein, dass keines von beidem Ursache von irgendwas ist. Statt dessen kann es eine dritte Variable geben, die A und B beeinflusst hat. Manchmal kann man diese Variable ermitteln, manchmal nicht. Und manchmal handelt es sich einfach um Zufall – dann spricht man von Koinzidenz.
Solche Korrelationen, denen kein Kausalzusammenhang zu Grunde liegt, nennt man auch Scheinkorrelationen, und für sie gibt es viele wunderbare Beispiele. In manchen Regionen korreliert etwa die Anzahl der Störche mit der Geburtenrate. Erstaunlicherweise ist das eine aber nicht Ursache des anderen, statt dessen gibt es eine dritte Variable, die sich auf Störche und Geburtenrate auswirkt: die Ländlichkeit der Region. Je ländlicher die Region, desto mehr Störche und desto mehr Geburten.
Wie gesagt: Die dritte Variable kann auch verborgen bleiben – oder schlicht nicht existieren. Eine Korrelation kann, zumindest über einen bestimmten Zeitraum hinweg, rein zufällig bestehen, und je größere Mengen an Big Data wir auswerten können, desto größer ist die Wahrscheinlichkeit, dass wir Korrelationen finden, Zeitreihen, die sich ähneln, und doch gar nichts miteinander zu tun haben.[1]
Sinnlose Statistiken
Im Bereich der Sportwetten lassen wir uns gerne von Statistiken blenden. Doch hat eine Mannschaft größere Siegchancen, nur weil sie mehr Ballbesitz hat?
Schauen Sie sich die Statistik über die meisten Ballkontakte an. Hier sollten doch unserem Verständnis nach die 6er, 10er und Spielmacher der Ligen ganz oben stehen. Weit gefehlt - wir finden je nach Spielverlauf oftmals zahlreiche Vertreter an Innen- und Außenverteidigern, die während eines Spiels den Ball durch die Viererkette laufen lassen.
Eine Korrelation zwischen Ballkontakten und Offensivdrang oder Ballbesitz und erhöhten Siegchancen besteht also nicht zwingend.
Welche Daten sind für Sportwetten relevant?
Lasse dich nicht von Statistiken auf die falsche Fährte führen. Dies gilt v.a. auch für die Heim- und Auswärtsstatistik. Nur weil ein Team die letzten drei Heimspiele gewonnen hat, bedeutet dies nicht, dass automatisch der vierte Heimsieg folgt. Natürlich müssen wir die Tendenz der Heimstärke bewerten, allerdings sollte die Sportwetten-Analyse ganzheitlich sein, z.B. über die Betrachtung gegen wen die Siege eingefahren wurden: Abstiegskandidaten oder Champions-League-Aspiranten?
Gepaart mit der Confirmation Bias kann die Scheinkorrelation sehr gefährlich für unseren Analyseprozess sein. So suchen wir uns nur Statistiken aus, die in unser vorgefertigtes Denkschema passen. Statistiken, die gegen unsere getroffene Auswahl sprechen, blenden wir aus.
Sei dir dieses Denkfehlers daher stets bewusst, nimm dir Zeit für eine fundierte Sportwetten-Analyse und verwende Indikatoren, die tatsächlich eine Korrelation zum Torerfolg aufweisen (z.B. Expected Goals / Big Chance Data). Klicke auf den Link für eine Übersicht über die besten Sportwetten Statistik Seiten.
Quellen + Links
- [1] Artikel von C.Buggisch: "Aberglaube: Von der Korrelation zur Kausalität"
- Artikel über den Denkfehler der Sportwetten Confirmation Bias
- Übersicht über die besten Sportwetten Statistik Seiten