nauka przewidywania wyników piłkarskich

przewidywanie wyników piłkarskich jest szybko rozwijającym się obszarem zainteresowań akademickich. Ekonomiści wykorzystują modele do oceny efektywności rynków zakładów, badacze operacyjni wykorzystują modele do eksperymentowania z różnymi efektami projektowania turniejów, a statystycy pokazują swoją biegłość w zaawansowanych technikach statystycznych, modelując zawiłości danych piłkarskich.

to oczywiście nie tylko naukowcy wydobywają archiwa wyników piłkarskich. Bukmacherzy żyją i oddychają modelami przewidywania piłki nożnej – podobnie jak bardziej zaangażowani flutterers. Błędy kosztują pieniądze i pracę, a znalezienie niewielkiej przewagi może przynieść wspaniałe nagrody.

rynki zakładów

w środowisku akademickim najczęstszym zastosowaniem modeli prognozowania piłki nożnej jest testowanie efektywności rynku zakładów. Hipoteza wydajnych rynków (efficient Markets Hypothesis, EMH) jest podstawą teorii finansowej i w najprostszej formie stwierdza, że inwestor nie powinien być w stanie konsekwentnie uzyskiwać zysków powyżej średniej. Znalezienie modelu prognozowania piłki nożnej, który może generować lepsze niż średnia – a nawet pozytywne – zwroty, zwykle skutkuje publikacją dla naukowców jako przykład naruszenia EMH, ale zastrzeżony charakter modeli oznacza, że publikowane rzadko (jeśli w ogóle) reprezentują najlepsze modele, a nawet rzadziej konsekwentnie generują pozytywne zwroty.

najlepsze modele są rezerwą branży hazardowej. Bardzo ważne jest, aby bukmacher ustalał kursy na taką wartość, która realistycznie odzwierciedla prawdopodobieństwo wygranej, remisu lub porażki meczu. Jeśli bukmacher tego nie zrobi, ryzykuje ogromne straty.

na przykład Azjatyccy bukmacherzy nie pomyślaliby o przyjęciu indywidualnego zakładu w wysokości 200 000 USD – i regularnym przyjmowaniu zakładów w wysokości 400 000 USD – a typowy weekend w angielskiej Premier League zwykle przyciąga obroty w Azji w wysokości 500 mln USD. Przy takich przypływach gotówki obstawianych nie dziwi fakt, że bukmacherzy wykorzystują wszelkie dostępne im narzędzia – jednym z nich są modele matematyczne.

model matematyczny nie jest zwykle używany samodzielnie do ustalania kursów. Ekspert ds. ustawiania kursów jest zatrudniony w celu dostosowania kursów generowanych przez model, pod warunkiem uzyskania dodatkowych informacji. Na przykład typowy model może uwzględniać ostatnie wyniki drużyny i pozycję każdej z drużyn tylko w lidze. Ustawiacz kursów dostosuje te przewidywane kursy, aby uwzględnić, powiedzmy, kontuzję Gwiazdy.

po drugiej stronie rynku są obstawiający. Wyspecjalizowane firmy oferują usługi, które doradzają klientom, które zakłady zrobić. Maciej Jarowek jest konsultantem zakładów dla AsianConnect88.com, broker bukmacherski. Poprosiłem go o przemyślenia na temat wykorzystania matematyki w przemyśle. Podobnie jak bukmacher, używa modelu, aby dać mu punkt wyjścia, a następnie dostosowuje kursy według własnego uznania.

Jarowek jest ekspertem od polskiej piłki nożnej, a gdy znajdzie rozbieżność między swoimi kursami a kursami bukmacherów, może wybrać, czy rozbieżność jest wystarczająca, aby zalecić postawienie zakładu. Mówi, że największą przewagą profesjonalnych graczy nad bukmacherem jest to, że nie muszą obstawiać każdego meczu – mogą wybierać i wybierać. Biorąc pod uwagę, że Jarowek jest jednym z wielu profesjonalnych hazardzistów pracujących dla AsianConnect88.com, i że działa wiele takich agencji, wydaje się, że istnieje spora szansa na pokonanie rynku.

w porównaniu z innymi sportami wynik meczu piłki nożnej jest stosunkowo trudny do przewidzenia. Niektórzy naukowcy uważają, że jest to jedno ze źródeł popularności piłki nożnej – fani nigdy tak naprawdę nie znają wyniku meczu, zanim się to stało, co sprawia, że oglądanie meczu jest ekscytującą propozycją.

gracze tworzą kariery w oparciu o tę niepewność wyników i spędzają niekończące się godziny rozważając każde możliwe wydarzenie w meczu. W każdy weekend w rodzimym futbolu zdarzają się niezliczone wstrząsy, a Mistrzostwa Świata rzucają się w dziesiątkę. Biorąc pod uwagę tę nieodłączną nieprzewidywalność, jak możemy przewidywać?

istnieją dwa szerokie podejścia do modelowania wyników meczów piłki nożnej. Po pierwsze, można bezpośrednio przewidzieć wynik – czy wynik będzie wygraną, remisem czy przegraną. W tym przypadku wynik (Wygrana, przegrana, remis) jest zmienną porządkową (wygrana jest lepsza niż remis, która jest lepsza niż przegrana). Modelem wyboru jest regresja porządkowa, np. Probit uporządkowany. Wynik z takiego modelu jest prawdopodobieństwem każdego wyniku, dzięki czemu w nadchodzącym meczu można użyć modelu do obliczenia prawdopodobieństwa wygranej, remisu lub porażki.

drugie podejście do modelowania wyniku meczu jest metodą pośrednią, w której analityk modeluje dokładny wynik meczu. W tym przypadku analityk ocenia prawdopodobieństwo każdej możliwej liczby bramek zdobytych przez każdą drużynę. Następnie można wnioskować o prawdopodobieństwie wygranej, remisu lub przegranej drużyny, sumując odpowiednie dokładne prawdopodobieństwo wyniku.

uporządkowany probit

dowody sugerują bardzo niewielką różnicę w wydajności każdego podejścia w modelowaniu wyników meczu. Tutaj buduję model pierwszego typu, a mianowicie model “ordered probit”.

uporządkowany model probit może być użyty do oszacowania prawdopodobieństwa trzech wyników meczu. Aby to zrobić, wykorzystuje informacje o każdej drużynie. Na przykład rozsądne wydaje się, że drużyna, która wygrała trzy ostatnie mecze, ma większe prawdopodobieństwo wygrania następnego meczu niż drużyna, która przegrała trzy ostatnie mecze. Podobnie, drużyna, która zajmuje wyższe miejsce w rankingu niż przeciwnik, ma większe prawdopodobieństwo wygrania meczu niż drużyna niżej sklasyfikowana. Wysokość prawdopodobieństwa wygranej zmienia się, biorąc pod uwagę, że te bryłki informacji są regulowane przez parametry modelu. W modelu statystycznym parametry są szacowane, aby najlepiej wyjaśnić, co wydarzyło się w przeszłości.

mój model oparty jest na prawie 9000 międzynarodowych wynikach meczów w ciągu ośmiu lat. Informacje i wpływ na prawdopodobieństwo wygrania meczu przez drużynę:

  • miejsce-Dom / wyjazd lub neutralny. Zespół jest bardziej prawdopodobne, aby wygrać, jeśli u siebie;
  • odległość od stolicy do lokalizacji gry.
  • różnica w światowym rankingu między drużynami. Wyższa drużyna ma większe szanse na wygraną;
  • zmiana w rankingu światowym każdej drużyny w ciągu ostatnich 12 miesięcy. Lepszy zespół jest bardziej prawdopodobne, aby wygrać;
  • Typ meczu, a mianowicie: Turniej Główny (Mistrzostwa Świata lub Mistrzostwa Konfederacji), turniej mniejszy (inny zatwierdzony przez FIFA), kwalifikacyjny lub towarzyski. Lepsze zespoły traktują ważniejsze turnieje bardziej poważnie;
  • wyniki poprzednich meczów. Dla każdego meczu korzystam z poprzednich ośmiu wyników dla każdej drużyny (średnio drużyna narodowa rozgrywa osiem meczów w okresie 12 miesięcy). Oprócz wyników, znam światowe rankingi dla każdej z ośmiu drużyn opozycyjnych w czasie gry.

Korzystanie z informacji o przeszłych wynikach wymaga trochę dodatkowej refleksji. Zwycięstwo 1: 0 dla drużyny z 200.miejsca w porównaniu z drużyną z 4. miejsca wyraźnie oznacza lepsze wyniki niż w przypadku drużyn z odpowiednio 200. i 198. miejsca w rankingu. W konsekwencji przeszłe wyniki powinny być ważone w stosunku do wyniku i w stosunku do siły sprzeciwu. Metryka wydajności przeszłej (ppm), która rejestruje tę zależność, jest podana przez wzór na górze (po lewej) tej strony.

wartość ppm zmienia się z ” -1 ” na “1”, gdzie ” -1 “oznacza najgorszy możliwy wynik – najwyżej sklasyfikowana drużyna przegrywa z najsłabszą drużyną-a” 1 ” oznacza najsłabszą drużynę pokonując najlepiej sklasyfikowaną drużynę. Należy pamiętać, że 204 to maksymalna wartość rankingu każdej drużyny w rozpatrywanym okresie. W prawym górnym rogu tej strony znajduje się wykres wyników z przeszłości.

(sshhh – i predict the World Cup winner)

uporządkowany model probit opisany powyżej może być użyty do oszacowania prawdopodobieństwa każdego wyniku (wygranej/remisu/porażki) w jednym meczu. Bukmacher może wykorzystać te prawdopodobieństwa, aby pomóc w informowaniu o kursach, podczas gdy obstawiający może wykorzystać je do oceny, czy zakład powinien zostać postawiony.

aby przewidzieć zwycięzcę Mistrzostw Świata 2010, należy przewidzieć zwycięzcę serii meczów. Aby to zrobić, używam symulacji i mam napisany kod, który wykorzystuje dopasowany model wyniku meczu do symulacji całego turnieju. Puchar Świata rozpoczyna się od ośmiu mini-lig (grup) po cztery zespoły, grając ze sobą jeden raz. Drużyny z pierwszego i drugiego miejsca w każdej grupie przechodzą do fazy pucharowej. Taka struktura turnieju wpływa na prawdopodobieństwo wygranej drużyny.

na przykład w nadchodzących Mistrzostwach Świata najbardziej prawdopodobnymi drużynami, które awansują z grupy G, są Brazylia i Portugalia. Najbardziej prawdopodobną drużyną, która wygra grupę H jest Hiszpania. Zwycięzcy (wicemistrzowie) grupy H spotykają się następnie z wicemistrzem (zwycięzcami) grupy G w pierwszej rundzie eliminacyjnej. Tym samym Hiszpania ma niemal zagwarantowany trudny mecz w pierwszej rundzie nokautu. Porównajmy to z faworytami grupy A, Francją, która najprawdopodobniej zmierzy się z wicemistrzem grupy B. biorąc pod uwagę, że faworyci grupy B, Argentyna, są znacznie silniejsi od pozostałych drużyn w grupie, Francja (i Argentyna) prawdopodobnie będą miały mniej trudne mecze w pierwszej fazie pucharowej niż Hiszpania, Brazylia i Portugalia.

jasne jest zatem, że przewidywanie zwycięzców turnieju nie jest tylko wyborem najlepszej drużyny. Należy wziąć pod uwagę wpływ struktury turnieju. Wyniki 100 000 symulowanych turniejów pokazano w tabeli po lewej stronie.

pomimo pozornie trudnych remisów, Hiszpania i Brazylia nadal są pierwsze i drugie pod względem liczby zwycięstw. Liczbę zwycięstw można łatwo przeliczyć na przewidywane prawdopodobieństwo wygrania turnieju dla każdej drużyny, które jest pokazane w trzeciej kolumnie tabeli (po lewej).

ciekawe jest porównanie przewidywanego prawdopodobieństwa wygranej z rankingami FIFA World. Francja ma duże szanse na awans-prawdopodobnie ze względu na łatwiejszy remis, podczas gdy Portugalia spada do dziewiątego faworyta, mimo że jest trzecią drużyną na świecie.

biorąc pod uwagę, że najczęstszym zastosowaniem takiego modelu jest porównanie prawdopodobieństwa z prawdopodobieństwem bukmacherów, w piątej i szóstej kolumnie tabeli podano kursy i domniemane Prawdopodobieństwo z Bet365, według stanu na dzień, w którym dokonałem moich prognoz (14 maja 2010). Muszę przyznać, że kiedy zobaczyłem podobieństwa, byłem zadowolony-potwierdza to model i ćwiczenie Symulacyjne dają sensowne rezultaty. Jednak bliższa inspekcja ujawnia pewne rozbieżności. Uwaga: nie sugeruję korzystania z tych kursów do obstawiania zakładów. Bukmacherzy naprawdę wiedzą, co robią i zawierają znacznie więcej informacji, których użyłem, aby poinformować ich o kursach – płacą im również znacznie więcej niż ja za robienie tego rodzaju rzeczy!

wydaje się, że bukmacherzy uważają, że Hiszpania i Brazylia mają większe szanse na wygraną niż ja, co sugeruje, że nie są to dobre drużyny, które mogłyby się wycofać (przy tych kursach). Być może dlatego, że chronią się przed rynkiem, który chce być w tych drużynach-podobna historia dotyczy Anglii.

z drugiej strony Francja oferuje dobrą wartość – model sugeruje, że prawdopodobieństwo zwycięstwa jest prawie dwukrotnie większe niż prawdopodobieństwo zakładane przez bukmachera. Trudno będzie przyjąć dla każdego kibica z Irlandii, Jeśli Francja wygra Mistrzostwa Świata, biorąc pod uwagę, że zostali wyeliminowani z Pucharu Świata przez Francję, która w XXI wieku rzuciła Thierry ‘ego Henry’ ego na bramkę “hand of God”.

więc oto jest – Nadstawiam karku (przynajmniej model tak robi), aby dać ci kilka wskazówek, opartych wyłącznie na statystykach (nie na mojej opinii):

Hiszpania jest faworytem turnieju, ale może nie oferować wartości do ceny. (Bardziej wnikliwy czytelnik uzna to za odpowiedź Polityka: jeśli Hiszpania wygra, mogę powiedzieć: “mówiłem ci, że są faworytami”, podczas gdy jeśli przegrają, mogę powiedzieć: “mówiłem ci, że nie są dobrym zakładem – prawdopodobieństwo, że nie wygrają, wynosi 88,4%”!)

Francja wygrać to dobry zakład.

ja też przekonałem Jarowka, żeby dał mi cynk:

Brazylia nie wygra. (Zazwyczaj zastrzeżone i ostrożne).

prognozy modelu dla ostatnich etapów turnieju to:

QF1: Holandia vs Brazylia

QF2: Francja vs Anglia

QF3: Niemcy vs Argentyna

QF4: Włochy vs Hiszpania

skład półfinałowy:

SF1: Brazylia vs Francja

SF2: Argentyna vs Hiszpania

finał:

Brazylia vs Hiszpania

całkiem oczywiste naprawdę! Powinienem powiedzieć, że chociaż moja reputacja jako statystyka opiera się na tych wskazówkach, które są w miarę dobre, będę kibicował mojej rodzimej Anglii, bez względu na to, kogo opozycja. Czekam w oczekiwaniu na start 11 czerwca…

Leave a Reply