Die Wissenschaft der Vorhersage von Fußballergebnissen

Die Vorhersage von Fußballergebnissen ist ein schnell wachsendes Gebiet von akademischem Interesse. Ökonomen verwenden Modelle, um die Effizienz von Wettmärkten zu bewerten, Betriebsforscher verwenden Modelle, um mit den verschiedenen Auswirkungen des Turnierdesigns zu experimentieren, und Statistiker zeigen ihre Kenntnisse mit fortschrittlichen statistischen Techniken, indem sie die Feinheiten von Fußballdaten modellieren.

Es sind natürlich nicht nur Akademiker, die die Archive der Fußballergebnisse durchsuchen. Buchmacher leben und atmen Fußballvorhersagemodelle – ebenso wie die engagierteren Flutterer. Fehler kosten Geld und Arbeitsplätze, während das Finden eines kleinen Vorteils große Belohnungen mit sich bringen kann.

Wettmärkte

In der Wissenschaft besteht die häufigste Anwendung von Fußballprognosemodellen darin, die Effizienz des Wettmarktes zu testen. Die Efficient Markets Hypothesis (EMH) ist ein Eckpfeiler der Finanztheorie und besagt in ihrer einfachsten Form, dass ein Anleger nicht in der Lage sein sollte, konstant überdurchschnittliche Renditen zu erzielen. Die Suche nach einem Prognosemodell des Fußballs, das überdurchschnittliche oder sogar positive Renditen erzielen kann, führt normalerweise zu einer Veröffentlichung für den Akademiker als Beispiel für eine Verletzung des EMH, aber die proprietäre Natur der Modelle bedeutet, dass die veröffentlichten Modelle selten (wenn überhaupt) die besten Modelle darstellen und noch seltener konsistent positive Renditen erzielen.

Die leistungsstärksten Modelle sind die Reserve der Glücksspielbranche. Für einen Buchmacher ist es von größter Bedeutung, Quoten auf einen Wert festzulegen, der realistisch die Wahrscheinlichkeiten eines gewonnenen, unentschiedenen oder verlorenen Spiels darstellt. Wenn der Buchmacher dies nicht tut, riskiert er enorme Verluste.

Zum Beispiel würden asiatische Buchmacher nichts davon halten, eine Einzelwette von 200.000 US-Dollar zu machen – und regelmäßig Wetten von 400.000 US-Dollar zu erhalten – und ein typisches Wochenende in der englischen Premier League zieht in der Regel einen Umsatz von 500 Millionen US-Dollar in Asien an. Bei solchen Geldfluten ist es nicht verwunderlich, dass Buchmacher jedes ihnen zur Verfügung stehende Werkzeug nutzen – eines davon sind mathematische Modelle.

Ein mathematisches Modell wird normalerweise nicht allein verwendet, um Quoten festzulegen. Ein erfahrener Odds-Setter wird eingesetzt, um die vom Modell generierten Quoten bei zusätzlichen Informationen anzupassen. Beispielsweise kann ein typisches Modell nur die jüngsten Ergebnisse eines Teams und die Position jedes Teams in der Liga berücksichtigen. Der Odds-Setter passt dann diese vorhergesagten Quoten an, um beispielsweise eine Verletzung eines Starspielers zu berücksichtigen.

Auf der anderen Seite des Marktes, sind die Wettern. Spezialisierte Unternehmen bieten Dienstleistungen an, um Kunden zu beraten, welche Wetten sie abschließen sollen. Maciej Jarowek ist Wettberater für AsianConnect88.com , ein Wettbroker. Ich fragte ihn nach seinen Gedanken über den Einsatz von Mathematik in der Industrie. Wie ein Buchmacher verwendet er ein Modell, um ihm einen Ausgangspunkt zu geben, und passt dann die Quoten an, wie er es für richtig hält.

Jarowek ist ein Experte für polnischen Fußball, und wenn er eine Diskrepanz zwischen seinen Quoten und denen der Buchmacher feststellt, kann er wählen, ob die Diskrepanz ausreicht, um eine Wette zu platzieren. Er sagt, der größte Vorteil, den professionelle Spieler gegenüber dem Buchmacher haben, ist, dass sie nicht auf jedes Spiel wetten müssen – sie können wählen und wählen. Angesichts der Tatsache, dass Jarowek einer von vielen professionellen Spielern ist, die für AsianConnect88.com , und dass es zahlreiche solche Agenturen im Betrieb gibt, scheint es, dass es beträchtlichen Spielraum gibt, den Markt zu schlagen.

Im Vergleich zu anderen Sportarten ist das Ergebnis eines Fußballspiels relativ schwer vorherzusagen. Einige Akademiker glauben, dass dies eine der Quellen für die Beliebtheit des Fußballs ist – Fans wissen nie wirklich, wie ein Spiel ausgeht, bevor es passiert ist, was das Anschauen des Spiels zu einem aufregenden Angebot macht.

Experten machen Karriere auf der Grundlage dieser Unsicherheit des Ergebnisses und verbringen endlose Stunden damit, über jedes mögliche Ereignis in einem Spiel nachzudenken. Es gibt unzählige Verstimmungen im heimischen Fußball jedes Wochenende, und die WM wirft seinen fairen Anteil an Riesen-Tötungen. Wie können wir angesichts dieser inhärenten Unvorhersehbarkeit Vorhersagen treffen?

Es gibt zwei große Ansätze zur Modellierung von Fußballspielergebnissen. Erstens kann man das Ergebnis direkt vorhersagen – ob das Ergebnis ein Sieg, ein Unentschieden oder eine Niederlage sein wird. In diesem Fall ist das Ergebnis (Gewinn, Verlust, Unentschieden) eine ordinale Variable (ein Gewinn ist besser als ein Unentschieden, das besser ist als ein Verlust). Das Modell der Wahl ist hier ein ordinales Regressionsmodell wie ordered Probit . Die Ausgabe eines solchen Modells ist die Wahrscheinlichkeit jedes Ergebnisses, so dass man für ein bevorstehendes Spiel das Modell verwenden kann, um die Wahrscheinlichkeit eines Gewinns, Unentschiedens oder Verlusts zu berechnen.

Der zweite Ansatz zur Modellierung eines Spielergebnisses ist eine indirekte Methode, bei der der Analyst die genaue Punktzahl des Spiels modelliert. In diesem Fall schätzt der Analyst die Wahrscheinlichkeit jeder möglichen Anzahl von Toren, die von jedem Team erzielt werden. Man kann dann die Wahrscheinlichkeit eines Teams ableiten, das Spiel zu gewinnen, zu ziehen oder zu verlieren, indem man die relevanten exakten Punktewahrscheinlichkeiten summiert.

Ein geordnetes Probit

Die Evidenz deutet auf einen sehr geringen Unterschied in der Leistung jedes Ansatzes bei der Modellierung des Match-Ergebnisses hin. Hier baue ich ein Modell des ersten Typs, nämlich ein ‘geordnetes Probit’ -Modell.

Das geordnete Probit-Modell kann verwendet werden, um die Wahrscheinlichkeit der drei Ergebnisse eines Spiels abzuschätzen. Dazu werden Informationen zu jedem Team verwendet. Zum Beispiel scheint es vernünftig, dass ein Team, das seine letzten drei Spiele gewonnen hat, eine höhere Wahrscheinlichkeit hat, sein nächstes Spiel zu gewinnen, als ein Team, das seine letzten drei Spiele verloren hat. In ähnlicher Weise hat ein Team, das höher eingestuft ist als der Gegner, eine höhere Wahrscheinlichkeit, das Spiel zu gewinnen, als das Team mit dem niedrigeren Rang. Die Höhe der Gewinnwahrscheinlichkeit ändert sich, da diese Informationsnuggets von den Modellparametern bestimmt werden. In einem statistischen Modell werden die Parameter geschätzt, um am besten zu erklären, was in der Vergangenheit passiert ist.

Mein Modell hier basiert auf fast 9.000 Länderspielergebnissen über einen Zeitraum von acht Jahren. Die Informationen und die Auswirkungen auf die Wahrscheinlichkeit, dass ein Team ein Spiel gewinnt, sind:

  • Veranstaltungsort – Zuhause / auswärts oder neutral. Ein Team gewinnt eher zu Hause;
  • Entfernung von der Hauptstadt zum Spielort. Ein Team gewinnt mit größerer Wahrscheinlichkeit, je kürzer die zurückgelegte Strecke ist (von Fans und dem Team selbst);
  • Unterschied in der Weltrangliste zwischen den Teams. Ein höherrangiges Team gewinnt eher;
  • Änderung der Weltrangliste für jedes Team in den letzten 12 Monaten. Eine sich verbessernde Mannschaft gewinnt eher;
  • Art des Spiels, nämlich: großes Turnier (Weltmeisterschaft oder Konföderationsmeisterschaft), kleines Turnier (anderes von der FIFA sanktioniertes), Qualifikationsturnier oder Freundschaftsspiel. Bessere Teams nehmen große Turniere ernster;
  • Vergangene Spielergebnisse. Für jedes Spiel verwende ich die vorherigen acht Ergebnisse für jedes Team (im Durchschnitt spielt eine Nationalmannschaft acht Spiele in einem Zeitraum von 12 Monaten). Zusätzlich zu den Ergebnissen kenne ich die Weltrangliste für jedes der acht gegnerischen Teams zum Zeitpunkt des Spiels.

Die Verwendung der Informationen vergangener Ergebnisse erfordert einige zusätzliche Überlegungen. Ein 1: 0-Sieg für ein Team mit Platz 200 gegen ein Team mit Platz 4 bedeutet eindeutig eine bessere Leistung als bei den Teams mit Platz 200 bzw. 198. Folglich sollten die bisherigen Ergebnisse relativ zum Ergebnis und relativ zur Stärke der Opposition gewichtet werden. Eine Kennzahl für die vergangene Wertentwicklung (ppm), die diese Beziehung erfasst, wird durch die Formel oben (links) auf dieser Seite angegeben.

Dieses Ergebnis geht von ‘-1’ zu ‘1’, wobei ‘-1’ das schlechteste mögliche Ergebnis darstellt – das bestplatzierte Team verliert gegen das unterste Team – und ‘1’ repräsentiert das schlechteste Team, das das bestplatzierte Team schlägt. Beachten Sie, dass 204 der Maximalwert des Rankings eines Teams im betrachteten Zeitraum ist. Die vergangene Performance-Metrik ist oben (rechts) auf dieser Seite dargestellt.

(Sshhh – Ich sage den Weltmeister voraus)

Das oben beschriebene geordnete Probit-Modell kann verwendet werden, um die Wahrscheinlichkeit jedes Ergebnisses (Sieg / Unentschieden / Niederlage) in einem Spiel abzuschätzen. Ein Buchmacher könnte diese Wahrscheinlichkeiten verwenden, um Quotensteller zu informieren, während ein Wetter sie verwenden könnte, um zu beurteilen, ob eine Wette platziert werden sollte.

Um den Gewinner der Weltmeisterschaft 2010 vorherzusagen, muss man den Gewinner einer Reihe von Spielen vorhersagen. Dazu verwende ich Simulation und habe Code geschrieben, der das angepasste Modell des Match-Ergebnisses verwendet, um das gesamte Turnier zu simulieren. Die Weltmeisterschaft beginnt mit acht Mini-Ligen (Gruppen) von vier Teams, die einmal gegeneinander spielen. Die Erst- und zweitplatzierten Teams jeder Gruppe erreichen dann die KO-Phase. Diese Turnierstruktur beeinflusst die Wahrscheinlichkeit, dass ein Team gewinnt.

In der kommenden WELTMEISTERSCHAFT sind beispielsweise Brasilien und Portugal die wahrscheinlichsten Teams, die aus der Gruppe G aufsteigen. Das wahrscheinlichste Team, das Gruppe H gewinnt, ist Spanien. Die Sieger (Zweitplatzierten) der Gruppe H treffen dann in der ersten K.O.-Runde auf die Zweitplatzierten (Sieger) der Gruppe G. Somit ist Spanien in der ersten KO-Runde fast ein schwieriges Spiel garantiert. Da die Favoriten der Gruppe B, Argentinien, viel stärker sind als die anderen Teams in der Gruppe, haben Frankreich (und Argentinien) wahrscheinlich weniger schwierige Spiele in der ersten KO-Phase als Spanien, Brasilien und Portugal.

Es ist also klar, dass die Vorhersage der Gesamtsieger des Turniers nicht nur die Auswahl des besten Teams ist. Man muss die Auswirkungen der Turnierstruktur berücksichtigen. Die Ergebnisse von 100.000 simulierten Turnieren werden in der Tabelle links angezeigt.

Trotz ihrer scheinbar schwierigen Unentschieden liegen Spanien und Brasilien in Bezug auf die Anzahl der Siege immer noch an erster und zweiter Stelle. Die Anzahl der Siege kann leicht in eine vorhergesagte Gewinnwahrscheinlichkeit für jedes Team umgewandelt werden, die in der dritten Spalte der Tabelle (links) angezeigt wird.

Es ist interessant, die vorhergesagten Gewinnwahrscheinlichkeiten mit der FIFA-Weltrangliste zu vergleichen. Frankreich ist ein großer Aufsteiger – möglicherweise wegen des leichteren Unentschiedens, während Portugal auf den neunten Platz fällt, obwohl es das drittplatzierte Team der Welt ist.

Da ein solches Modell am häufigsten verwendet wird, um die Wahrscheinlichkeiten mit denen von Buchmachern zu vergleichen, geben die fünfte und sechste Spalte der Tabelle die Quoten und impliziten Wahrscheinlichkeiten von Bet365 zum Zeitpunkt meiner Vorhersage (14. Mai 2010) an. Ich muss zugeben, als ich die Ähnlichkeiten sah, war ich zufrieden – es bestätigt, dass das Modell und die Simulation vernünftige Ergebnisse liefern. Bei näherer Betrachtung ergeben sich jedoch einige Diskrepanzen. Haftungsausschluss Zeit: Bitte beachten Sie, dass ich Ihnen nicht vorschlage, diese Quoten zu verwenden, um eine Wette zu platzieren. Die Buchmacher wissen wirklich, was sie tun, und integrieren weit mehr Informationen, die ich verwendet habe, um ihre Chancen zu informieren – sie werden auch viel mehr bezahlt als ich, um so etwas zu tun!

Es scheint, dass die Buchmacher glauben, dass Spanien und Brasilien eher gewinnen werden als ich, was darauf hindeutet, dass dies eigentlich keine guten Teams sind (bei diesen Quoten). Dies könnte daran liegen, dass sie sich gegen den Markt schützen, der daran interessiert ist, in diesen Teams zu sein – eine ähnliche Geschichte gilt für England.

Frankreich hingegen bietet einen guten Wert – das Modell legt nahe, dass die Wahrscheinlichkeit eines Sieges fast doppelt so hoch ist wie die vom Buchmacher angenommene Wahrscheinlichkeit. Es wird für jeden Fan der Republik Irland schwer zu ertragen sein, wenn Frankreich die WELTMEISTERSCHAFT gewinnen würde, da sie von Frankreichs Stürmer Thierry Henry aus dem 21.

Also hier ist es – ich habe meinen Hals auf die Linie gelegt (zumindest das Modell), um Ihnen einige Tipps zu geben, die rein auf Statistiken basieren (nicht meine Meinung):

Spanien ist der Turnierfavorit, bietet aber möglicherweise kein gutes Preis-Leistungs-Verhältnis. (Der klügere Leser wird dies als eine Art Antwort eines Politikers erkennen: Wenn Spanien gewinnt, kann ich sagen: ‘Ich habe dir gesagt, dass sie Favoriten sind’, während ich, wenn sie verlieren, sagen kann: ‘Ich habe dir gesagt, dass sie keine gute Wette waren – es gab eine 88,4-prozentige Wahrscheinlichkeit, dass sie nicht gewinnen’!)

Frankreich zu gewinnen ist eine gute Wette.

Ich habe Jarowek auch überredet, mir ein Trinkgeld zu geben:

Brasilien gewinnt nicht. (Normalerweise zurückhaltend und vorsichtig).

Die Vorhersagen des Modells für die letzten Phasen des Turniers lauten:

QF1: Holland gegen Brasilien

QF2: Frankreich gegen England

QF3: Deutschland gegen Argentinien

QF4: Italien gegen Spanien

Halbfinalaufstellung:

SF1: Brasilien gegen Frankreich

SF2: Argentinien gegen Spanien

Finale:

Brasilien gegen Spanien

Ziemlich offensichtlich wirklich! Ich sollte das sagen, obwohl mein Ruf als Statistiker darauf beruht, dass diese Tipps einigermaßen gut sind, Ich werde meine Heimat England anfeuern, egal wen die Opposition. Ich warte gespannt auf den Kick-off am 11.Juni…

Leave a Reply