Die Krux mit expected Goals

Bei meiner Recherche zur Leistung der deutschen Nationalmannschaft bei der Weltmeisterschaft 2018 fiel mir etwas auf. Eigentlich wollte ich den expected Goals-Wert der Nationalmannschaft mit dem anderer Nationen vergleichen. Expected Goals sind nichts anderes als der Erwartungswert aller Schüsse multipliziert mit der Wahrscheinlichkeit eines Treffers. Es wäre logisch anzunehmen, dass auf Basis der xG-Werte von Infogol die deutsche Nationalmannschaft, trotz schlechter Staffelung im Ballbesitz und schlechtem Umschaltverhalten, durchaus überlegen war und aufgrund schlechter Abschlussquote diese Überlegenheit nicht in Tore ummünzen konnte.1 Aufgrund dieser Werte wurde eine durchschnittliche Tordifferenz von einem Tor pro Spiel erwartet. Dies würde den viertbesten Wert nach Brasilien, Spanien und Uruguay darstellen.2 Also quasi ein souveränes Weiterkommen in der Gruppe, bei durchschnittlicher Abschlussquote.

Da wurde ich stutzig. Die deutsche Mannschaft das viertbeste Team?! Das passte dann doch nicht mit meinem persönlichen Eindruck des Turnieres überein. Also habe ich mir von den anderen Anbietern für xG, die ich kenne, Caley_graphics,3 11tegen114 und statsbomb,5 die Werte für die einzelnen Spiele zusammengesucht. Hierbei entstand folgende Tabelle:

xGFxGAxGDiffPG
infogol6.53.70.93
statsbomb5.513.50.67
11tegen115.174.180.33
caley_graphics4.54.50

Es zeigt sich die enorme Diskrepanz zwischen den einzelnen Modellen. Dies lässt sich auch bei den einzelnen Gruppenspielen feststellen. Gegen Mexiko…

xGFxGAxGDiffPG
infogol1.731.220.51
statsbomb1.870.681.19
11tegen111.231.190.04
caley_graphics1.21.5-0.3

… gegen Schweden …

xGFxGAxGDiffPG
infogol1.710.910.8
statsbomb1.071.1-0.03
11tegen111.391.230.16
caley_graphics1.51.40.1

… und gegen Südkorea.

xGFxGAxGDiffPG
infogol1.543.1-1.56
statsbomb2.571.720.85
11tegen112.551.760.79
caley_graphics1.81.60.2

Unterschiedliche Modelle zur Berrechnung der expected Goals

Und genau das ist das Problem. Jede einzelne Statistikwebsite hat ihr eigenes Modell um die Rohdaten zum xG-Wert zu modellieren. Und selbstverständlich werden diese Modelle geheim gehalten, um mit den Modellen, im optimalen Fall, Geld zu verdienen. Daher ist es nicht möglich einzuschätzen, inwiefern diese Modelle der Realität bzw. dem Geschehen auf dem Platz entsprechen. Es ist möglich, dass Infogol den jeweiligen Erwartungswert der Tore mit der Abschlussqualität der einzelnen Mannschaften berechnet und so zu dem Ergebnis kommt, dass schlechtere Gegner in der Gruppe bei ähnlichen Chancen einen niedrigeren Wert erzielen und die deutsche Mannschaft dementsprechend einen höheren Wert erzielt. Und Caley_graphics könnte dasselbe auf Basis einer durchschnittlichen Chancenverwertung aller Teams bei vergangenen Turnieren berechnen.

Oder, um nochmal das Beispiel der deutschen Nationalmannschaft aufzugreifen: Es macht einen Riesenunterschied, ob die deutsche Mannschaft „unverdient“ rausgeflogen ist, da sie im Schnitt eine durchschnittliche Tordifferenz von 1 erzielt hatte, oder ob sie, bei einer durchschnittlichen Tordifferenz von 0, gleichwertig mit den anderen Gruppengegnern war und somit auch „verdient“ rausflog. Allerdings soll erwähnt werden, dass Deutschland eine sehr hohe Anzahl Schüsse in diesem Turnier hatte, also quasi xG gesammelt hatte, und somit der einzelne Schuss nicht besonders werthaltig war. Es kann angenommen werden, dass bei vielen Schüssen mit geringem Einzelerwartungswert die Varianz größer ist.

Es ist aber auch möglich, dass dies gar keine Rolle spielt und alle Anbieter die gleiche Chancenverwertung als Basis verwendet haben, aber unterschiedliche Parameter genutzt wurden. Zum Beispiel wird bei einem Anbieter die Anzahl der Gegenspieler in der Nähe des Torschusses berücksichtigt und bei einem anderen Anbieter spielt lediglich die Position des Schusses eine Rolle. Daher kann nicht nachvollzogen werden wie dieser xG-Wert zustande gekommen ist. Ausgenommen davon ist 11tegen11, das genau diese Berechnungsgweise veröffentlicht hat.6

Fazit

Es bleibt festzuhalten, dass es wenig Sinn macht expected Goals zu verwenden, wenn man die zugrundeliegenden Algorithmen nicht kennt. Und dies ist auch der Grund, warum ich, zumindest vorerst, expected Goals nicht verwende. Es sei denn, ich entwickle irgendwann ein eigenes Modell.

1. https://www.infogol.net/an-introduction-to-expected-goals-11112016/blog/world-cup-2018/group-stage-review-germany-unlucky-to-be-going-home
(abgerufen am 02.09.18)

2. https://www.timeform.com/racing/content/libraryimages/Football/ArticleContent/final_team_xg_stats.jpg
(abgerufen am 02.09.18)

3. https://twitter.com/Caley_graphics
(abgerufen am 02.09.18)

4. https://twitter.com/11tegen11?lang=de
(abgerufen am 02.09.18)

5. https://statsbomb.com/2018/06/the-demise-of-germany/
(abgerufen am 02.09.18)

6. http://11tegen11.net/2015/08/14/a-close-look-at-my-new-expected-goals-model/
(abgerufen am 02.09.18)