Prognose zur Weltmeisterschaft 2018

Kurz vor der Weltmeisterschaft möchte ich eine Prognose zur kommenden WM in Russland abgeben. Ich habe lange überlegt, wie ich denn die einzelnen Wahrscheinlichkeiten berechnen kann und bin beim Elo-Rating gelandet.1 Doch zunächst sollen die einzelnen Gruppen beurteilt werden.

Einordnung der Gruppenstärken

Zuallererst wurde den einzelnen Teams jeweils ihr entsprechendes Elo-Rating zugeordnet. Ich habe hier ganz bewusst den Stichtag vor den abschließenden Testspielen gesetzt, da in diesen ja zumeist nicht die tatsächliche Mannschaft des Turniers spielt, sondern oft auch schwächere Spieler, die noch um ihre Kaderzugehörigkeit kämpfen. Dementsprechend gehen diese Testspiele oft überraschend aus und würden somit das Rating verfälschen. Darüber hinaus werden Verletzungen von eingeplanten Spielern nicht beachtet, die auch zu einer Reduzierung der Mannschaftsstärke führen.
Mit diesem Ratingsystem wurde nun die Durchschnittsstärke einer jeden Gruppe gebildet.

Durchschnittsstärke der Gruppen

Meiner Meinung nach springt sofort Gruppe A ins Auge, die doch bedeutend schwächer ist als die anderen. Das liegt zum einen daran, dass der Gastgeber, also in diesem Fall Russland, immer als Gruppenkopf der Gruppe A gesetzt ist. Und Russland ist nun mal bedeutend schwächer als die anderen Teams aus dem ersten Lostopf. Und zum anderen liegt es daran, dass Russland bei der Auslosung auch ziemliches Glück hatte, da die Gegner Saudi-Arabien, Ägypten und Uruguay auch zu den eher schwächeren Teams des jeweiligen Lostopfes zählen.2

Zu den vier starken Gruppen zählen Gruppe B, mit Spanien und Portugal, Gruppe E, was hauptsächlich an der Stärke Brasiliens liegt, die deutsche Gruppe F, was zeigt, dass Mexiko und Schweden definitiv nicht zur Laufkundschaft gezählt werden dürfen, und Gruppe C, in der neben Frankreich noch Peru und Dänemark vertreten sind.

Ausgewogenheit der Gruppen

Dies sagt allerdings nichts über die erwartbare Spannung in den einzelnen Gruppen aus, denn Spannung entsteht durch Chancengleichheit und der Durchschnittswert der Gruppenstärke ist eben, wie im Falle von Gruppe E, anfällig für Ausreißer. Um nun die relative Chancengleichheit zu berechnen, wurde der Gini-Koeffizient, ein Maß für die Ungleichheit einer Verteilung, verwendet.3 Je größer die Zahl, desto ungleicher die Verteilung.4

GruppeLänderØ-RatingGini-Koeffizient
E 1881,250,2921
B 1881,750,2896
F 1873,250,2896
G
1797,50,2867
A 1700,750,2854
D
18310,2815
C 1861,750,2793
H 1801,50,2781

Es zeigt sich hierbei deutlich, dass kaum ein Zusammenhang zwischen durchschnittlicher Gruppenstärke und Spannung besteht.

Die Gruppe E steht hier an der Spitze. Es kann erwartet werden, dass sich Brasilien souverän als Gruppenerster durchsetzen wird. Ähnliches gilt für Gruppe F mit Deutschland als klarem Favoriten. Hier dürfte aber der Kampf um den zweiten Platz sehr ausgeglichen sein. Für die Gruppen B und G gilt, dass es, mit Spanien und Portugal in der einen und Belgien und England in der anderen Gruppe, zwei klare Favoriten gibt, die den ersten Platz unter sich ausmachen sollten.

In den Gruppen C und D gibt es zwar mit Argentinien und Frankreich zwei Favoriten, die allerdings vom Elo-Rating als weniger überlegen angesehen werden als andere Gruppenköpfe. Dazu kann in jeder dieser Gruppen quasi jede Mannschaft Gruppenzweiter werden. Die mit Abstand spannendste Gruppe ist die Gruppe H mit Polen, Kolumbien, Senegal und Japan. Japan ist hier der Außenseiter, aber auch die japanische Nationalmannschaft hat schon bei vergangenen Turnieren im Rahmen ihrer Möglichkeiten überzeugt.

Berechnung der Prognose

Als nächstes soll mithilfe der Elo-Zahlen der Mannschaften bestimmt werden, wie hoch die Wahrscheinlichkeit eines jeden Teams ist, Weltmeister zu werden. Hierzu musste nun zunächst über die Elo-Formel die Wahrscheinlichkeit für Sieg, Unentschieden und Niederlage ausgerechnet werden.5 Grundlegend bei dieser Formel ist die Differenz der Ratings zweier Mannschaften.

Die folgende Grafik zeigt die Wahrscheinlichkeiten in Abhängigkeit der Elo-Differenz. Die orangene Linie zeigt die Siegwahrscheinlichkeit des besser bewerteten Teams und die gelbe Linie die des schlechter bewerteten Teams. Wichtig ist hierbei zu erwähnen, dass in dieser Simulation der Heimvorteil ignoriert wurde, da alle Teams abgesehen vom Gastgeber ja quasi auswärts spielen.

Wahrscheinlichkeiten in Abhängigkeit des ELO-Ratings

Auf Basis dieser Wahrscheinlichkeiten wurde nun ein Algorithmus geschrieben, der einmal ein WM-Turnier komplett simuliert. Mithilfe dieses Algorithmus wurde dann eine Monte-Carlo-Simulation mit 1000 Iterationen durchgeführt.6 Es ist wichtig zu erwähnen, dass die Ergebnisse noch nicht stabil sind und um etwa +/- 1,5% des jetzigen Wertes variieren. Es müssten also noch mehr Iterationen durchgeführt werden, um ein stabileres Ergebnis zu erhalten. Dazu reicht aber die Rechenleistung meines Computers nicht.

Hierbei kam folgendes Ergebnis zustande:

Weltmeisterwahrscheinlichkeit

Die großen WM-Favoriten haben auch große Wahrscheinlichkeiten. Brasilien, mit beinahe einem ¼ der Simulationen, hat die größte. Danach folgen Deutschland und Spanien. Auch Teams, die schon einmal Weltmeister wurden, wie Frankreich, Argentinien, England und Uruguay haben große Chancen. Portugal wurde noch nie Weltmeister, hat aber immerhin eine Wahrscheinlichkeit von 5,5 %. Mit Belgien ist außerdem der ewige Überraschungskandidat der letzten Turniere vertreten. Überraschend ist die Chance Perus auf den Pokal mit immerhin 3,5%. Peru könnte also durchaus das Überraschungsteam dieser Weltmeisterschaft werden.

Hier, zur Übersicht, alle Wahrscheinlichkeiten in einer Tabelle:

LandWahrscheinlichkeit
Brasilien0,240
Deutschland0,178
Spanien0,142
Frankreich0,061
Portugal0,055
Argentinien 0,040
England0,036
Peru0,035
Kolumbien0,034
Belgien0,030
Uruguay0,022
Schweiz0,015
Dänemark0,012
Costa Rica 0,012
Mexico0,012
Schweden0,012
Iran0,010
Kroatien0,010
Polen0,010
Marokko0,007
Serbien0,007
Tunesien0,005
Nigeria0,004
Südkorea0,004
Island0,002
Japan0,002
Australien0,001
Panama0,001
Senegal0,001
Russland0,000
Saudi-Arabien0,000
Ägypten0,000

Vergleich mit dem Wettmarkt

Zum Schluss sollen nun noch die Ergebnisse des Modells mit den Quoten der Buchmacher verglichen werden. Hierzu habe ich mir die Wettquoten fünf gängiger Wettanbieter angesehen und deren Durchschnittswert gebildet.6

LandWahrscheinlichkeit nach meinem ModellWahrscheinlichkeit nach den Buchmachern
Brasilien0,2400,195
Deutschland0,1780,180
Spanien0,1420,145
Frankreich0,0610,137
Portugal0,0550,041
Argentinien 0,0400,100
England0,0360,056
Peru0,0350,005
Kolumbien0,0340,027
Belgien0,0300,082
Uruguay0,0220,031
Schweiz0,0150,010
Dänemark0,0120,010
Costa Rica 0,0120,002
Mexico0,0120,010
Schweden0,0120,007
Iran0,0100,002
Kroatien0,0100,029
Polen0,0100,019
Marokko0,0070,003
Serbien0,0070,007
Tunesien0,0050,002
Nigeria0,0040,005
Südkorea0,0040,002
Island0,0020,005
Japan0,0020,004
Australien0,0010,003
Panama0,0010,001
Senegal0,0010,006
Russland0,0000,024
Saudi-Arabien0,0000,001
Ägypten0,0000,006
Summe11,154

Die Ergebnisse des Modells sind dabei sehr ähnlich zu den Quoten der Buchmacher. So beträgt der Korrelationskoeffizient 0,91, was auf einen ziemlich starken Zusammenhang schließen lässt.
Dass die Summe der Wettquoten 1,154 beträgt, liegt an dem Buchmachervorteil. Würden die Quoten 1 zu 1 der Realität bzw. dem Ergebnis des Modells der Buchmacher entsprechen, würde der Buchmacher im Mittel mit seinem Wettangebot keinen Gewinn erzielen.7 Wenn man nun den Buchmachervorteil nivelliert, dann beträgt die mittlere absolute Abweichung gerade einmal 0,88 Prozentpunkte. Würden nun noch mehrere Iterationen durchgeführt werden, ließe sich dieser Wert sicherlich verringern, da dadurch das Modell genauer werden würde.

Fazit

Ein Großteil der Mannschaften mit hoher Wahrscheinlichkeit auf den Weltmeistertitel in meinem Modell werden auch öffentlich bzw. gemessen an Wettquoten als Favoriten angesehen. So beträgt die Wahrscheinlichkeit, dass ein Team gewinnt, welches noch nie Weltmeister war, gerade einmal 28%. Die Niveauunterschiede der einzelnen Nationalmannschaften sind, besonders in der Gruppenphase, zu groß, um regelmäßig für Überraschungen zu sorgen.
Alles in allem spiegelt das Modell die öffentlichen Erwartungen an diese Weltmeisterschaft gut wider.

1. http://www.eloratings.net/
(abgerufen am 03.06.18)

2. http://de.fifa.com/worldcup/final-draw/
(abgerufen am 03.06.18)

3. https://de.wikipedia.org/wiki/Gini-Koeffizient
(abgerufen am 03.06.18)

4. Alle Flaggen von https://www.countries-ofthe-world.com/flags-of-the-world.html
(abgerufen am 03.06.18)

5. http://clubelo.com/System
(abgerufen am 03.06.18)

5. https://de.wikipedia.org/wiki/Monte-Carlo-Simulation
(abgerufen am 03.06.18)

6. https://www.wettfreunde.net/wm-2018-quoten/
(abgerufen am 03.06.18)

7. Vergleich hierzu: Sumpter, David: Soccermatics – Mathematical adventures in the beautiful game, Bloomsbury, London, 2017