a labdarúgás eredményeinek előrejelzésének tudománya

a labdarúgás eredményeinek előrejelzése gyorsan növekvő tudományos érdeklődési terület. A közgazdászok modelleket használnak a fogadási piacok hatékonyságának felmérésére, az operatív kutatók modelleket használnak a versenyek tervezésének különféle hatásainak kísérletezésére, a statisztikusok pedig fejlett statisztikai technikákkal mutatják be jártasságukat a futballadatok bonyolultságának modellezésével.

természetesen nem csak akadémikusok bányásszák a labdarúgó-eredmények archívumát. A bukmékerek élnek és lélegzik a futball-előrejelzési modelleket – csakúgy, mint az elkötelezettebb csapkodók. A hibák pénzbe és munkahelyekbe kerülnek, míg egy kis előny megtalálása nagy haszonnal járhat.

fogadási piacok

az egyetemeken a futball-előrejelzési modellek leggyakoribb alkalmazása a fogadási piac hatékonyságának tesztelése. A hatékony piacok hipotézise (EMH) a pénzügyi elmélet sarokköve, és legegyszerűbb formájában kimondja, hogy a befektetőnek nem szabad képesnek lennie arra, hogy következetesen átlag feletti hozamot érjen el. A labdarúgás előrejelzési modelljének megtalálása, amely az átlagnál jobb-vagy akár pozitív-hozamot eredményezhet, általában az akadémiai publikációt eredményezi az EMH megsértésének példájaként, de a modellek szabadalmaztatott jellege azt jelenti, hogy a közzétett modellek ritkán (ha valaha is) képviselik a legjobb modelleket, és még ritkábban generálnak pozitív hozamot következetesen.

a legjobban teljesítő modellek a tartalék a szerencsejáték-ipar. A bukméker számára rendkívül fontos, hogy az esélyeket olyan értékre állítsa be, amely reálisan képviseli a megnyert mérkőzés valószínűségét, húzott vagy elveszett. Ha a bukméker ezt nem teszi meg, hatalmas veszteségeket kockáztat.

például az ázsiai bukmékerek nem gondolnának arra, hogy 200 000 dolláros egyéni fogadást tegyenek – és rendszeresen fogadnak 400 000 dolláros fogadásokat -, és egy tipikus hétvége az angol Premier League-ben általában 500 millió dolláros forgalmat vonz Ázsiában. A készpénz ilyen árapályával nem meglepő, hogy a bukmékerek minden rendelkezésre álló eszközt használnak – ezek közül az egyik matematikai modell.

egy matematikai modellt általában nem használnak önmagában az esélyek beállításához. Egy szakértő odds-szetter alkalmazunk, hogy állítsa be a modell által generált odds adott extra információt. Például egy tipikus modell figyelembe veheti a csapat legutóbbi eredményeit és az egyes csapatok pozícióját a bajnokságban. Az esély-beállító ezután módosítja ezeket az előre jelzett esélyeket, hogy figyelembe vegye, mond, egy sztárjátékos sérülése.

a másik oldalon a piac, a fogadók. A szakosodott cégek szolgáltatásokat kínálnak, hogy tanácsot adjanak az ügyfeleknek, hogy mely fogadásokat tegyék meg. Maciej Jarowek egy fogadási tanácsadó AsianConnect88.com, fogadási bróker. Megkérdeztem tőle, hogy mit gondol a matematika használatáról az iparban. Ahogy egy bukméker teszi, egy modellt használ, hogy kiindulási pontot adjon neki, majd beállítja az esélyeket, ahogy jónak látja.

Jarowek a lengyel labdarúgás szakértője, és amikor eltérést talál a fogadóirodák és a fogadóirodák esélyei között, eldöntheti, hogy az eltérés elegendő-e a fogadás megtételéhez. Azt mondja, hogy a profi szerencsejátékosok legnagyobb előnye a bukmékerrel szemben az, hogy nem kell minden mérkőzésen fogadniuk – válogathatnak. Tekintettel arra, hogy Jarowek egyike a sok profi szerencsejátékosnak AsianConnect88.com és mivel számos ilyen ügynökség működik, úgy tűnik, hogy jelentős lehetőség van a piac legyőzésére.

más sportokhoz képest a labdarúgó-mérkőzés eredményét viszonylag nehéz megjósolni. Egyes akadémikusok úgy vélik, hogy ez a futball népszerűségének egyik forrása – a rajongók soha nem tudják igazán a mérkőzés eredményét, mielőtt az megtörtént volna, így a játék nézése izgalmas javaslat.

a szakemberek az eredmény bizonytalanságára alapozzák karrierjüket, és végtelen órákat töltenek a mérkőzés minden lehetséges eseményének elmélkedésével. Számtalan felfordulás van a hazai futballban minden hétvégén, és a világbajnokság az óriásgyilkosságok méltányos részét dobja fel. Mivel ez a benne rejlő kiszámíthatatlanság, hogyan tehetünk előrejelzéseket?

a labdarúgó-mérkőzések eredményeinek modellezésére két széles megközelítés létezik. Először is meg lehet jósolni az eredményt közvetlenül – függetlenül attól, hogy az eredmény győzelem, döntetlen vagy veszteség lesz-e. Ebben az esetben az eredmény (győzelem, veszteség, döntetlen) egy sorszámváltozó (a győzelem jobb, mint a döntetlen, ami jobb, mint a veszteség). A választott modell itt egy ordinális regresszió, például rendezett probit. Az ilyen modell kimenete az egyes eredmények valószínűsége, így egy közelgő mérkőzéshez a modell segítségével kiszámíthatja a győzelem, a döntetlen vagy a veszteség valószínűségét.

a második megközelítés a mérkőzés kimenetelének modellezésére egy közvetett módszer, ahol az elemző modellezi a játék pontos pontszámát. Ebben az esetben az elemző becsüli az egyes csapatok által elért lehetséges gólok valószínűségét. Ezután következtetni lehet a csapat nyerésének valószínűségére, rajz vagy elveszíti a mérkőzést a vonatkozó pontos pontszám valószínűségek összegzésével.

egy rendezett probit

a bizonyítékok arra utalnak, hogy nagyon kevés különbség van az egyes megközelítések teljesítményében az egyezés eredményének modellezésében. Itt az első típusú modellt építem, nevezetesen egy ‘rendezett probit’ modellt.

a rendezett probit modell felhasználható az egyezés három kimenetelének valószínűségének becslésére. Ehhez az egyes csapatokra vonatkozó információkat használja. Például ésszerűnek tűnik, hogy egy olyan csapat, amely megnyerte az utolsó három mérkőzését, nagyobb valószínűséggel nyeri meg a következő mérkőzését, mint egy olyan csapat, amely elvesztette az utolsó három mérkőzését. Hasonlóképpen, az ellenzéknél magasabb rangú csapat nagyobb valószínűséggel nyeri meg a mérkőzést, mint az alacsonyabb rangú csapat. A győzelem valószínűségének összege megváltozik, mivel ezeket az információcsomókat a modell paraméterei szabályozzák. Statisztikai modellben a paraméterek becslése szerint a legjobban magyarázzák a múltban történteket.

a modellem itt közel 9000 nemzetközi mérkőzés eredményen alapul nyolc év alatt. Az információ és a hatások a valószínűsége, hogy egy csapat megnyerte a mérkőzést:

  • helyszín-otthon/idegenben vagy semleges. Egy csapat nagyobb valószínűséggel nyer, ha otthon van;
  • távolság a fővárostól a játék helyszínéig. Egy csapat annál nagyobb valószínűséggel nyer, minél rövidebb a megtett távolság (a szurkolók és maga a csapat által);
  • különbség a világranglistán a csapatok között. Egy magasabb rangú csapat nagyobb valószínűséggel nyer;
  • változás a világranglistán minden csapat az elmúlt 12 hónapban. Egy javuló csapat nagyobb valószínűséggel nyer;
  • a mérkőzés típusa, nevezetesen: major tournament (világbajnokság vagy Konföderációs bajnokság), minor tournament (más FIFA által szankcionált), selejtező vagy barátságos. A jobb csapatok komolyabban veszik a nagyobb versenyeket;
  • korábbi mérkőzések eredményei. Minden játékhoz az előző nyolc eredményt használom minden csapathoz (átlagosan egy válogatott nyolc mérkőzést játszik 12 hónapos időszak alatt). Az eredmények mellett ismerem a nyolc ellenzéki csapat világranglistáját a játék idején.

a múltbeli eredmények információinak felhasználása egy kis extra gondolkodást igényel. Az 1-0-s győzelem a 200. helyen álló csapat számára, szemben a 4.helyen álló csapattal, egyértelműen jobb teljesítményt jelent, mintha a csapatok 200, illetve 198. helyezést érnének el. Következésképpen a múltbeli eredményeket az eredményhez és az ellenzék erejéhez viszonyítva kell súlyozni. A múltbeli teljesítménymutatót (ppm), amely rögzíti ezt a kapcsolatot, az oldal tetején (bal oldalon) található képlet adja meg.

ez a ppm ‘-1’ – ről ‘1’-re megy, ahol a ‘-1’ a lehető legrosszabb eredményt jelenti-a legmagasabb rangú csapat veszít az alsó rangú csapattól -, az ‘1’ pedig a legrosszabb rangú csapatot jelenti, amely legyőzi a legjobban rangsorolt csapatot. Vegye figyelembe, hogy a 204 a csapatok rangsorának maximális értéke a vizsgált időszakban. A múltbeli teljesítménymutató az oldal tetején (jobb oldalon) látható.

(Sshhh – megjósolom a világbajnokság győztesét)

a fent leírt rendezett probit modell felhasználható az egyes eredmények (győzelem/döntetlen/veszteség) valószínűségének becslésére egy mérkőzésen. A bukméker ezeket a valószínűségeket felhasználhatja az esély-meghatározók tájékoztatására, míg a licitáló felhasználhatja őket annak felmérésére, hogy fogadást kell-e tenni.

a 2010-es világbajnokság győztesének megjóslásához meg kell jósolni a mérkőzések sorozatának győztesét. Ehhez szimulációt használok, és olyan kódot írok, amely a mérkőzés eredményének illesztett modelljét használja a teljes verseny szimulálására. A világbajnokság nyolc, négy csapatból álló mini ligával (csoporttal) kezdődik, egyszer játszanak egymással. Az egyes csoportok első és második helyezett csapatai továbbjutnak a kieséses szakaszba. Ez a versenyszerkezet befolyásolja a csapat nyerésének valószínűségét.

például a közelgő világbajnokságon a G csoportból a legvalószínűbb csapatok Brazília és Portugália. A H Csoport megnyerésének legvalószínűbb csapata Spanyolország. A H Csoport győztesei (második helyezettjei) az első kieséses fordulóban találkoznak a G csoport második helyezettjeivel (győzteseivel). Így Spanyolország szinte garantáltan nehéz mérkőzés az első kieséses fordulóban. A B csoport favoritjai, Argentína sokkal erősebbek, mint a csoport többi csapata, Franciaország (és Argentína) valószínűleg kevésbé nehéz mérkőzésekkel rendelkezik az első kieséses szakaszban, mint Spanyolország, Brazília és Portugália.

akkor egyértelmű, hogy a bajnokság győzteseinek előrejelzése nem csak a legjobb csapat kiválasztása. Figyelembe kell venni a versenystruktúra hatását. A 100 000 szimulált verseny eredményeit a bal oldali táblázat mutatja.

a látszólag nehéz sorsolások ellenére Spanyolország és Brazília továbbra is első és második a győzelmek számát tekintve. A győzelmek száma könnyen átalakítható az egyes csapatok versenyének megnyerésének előrejelzett valószínűségévé, amely a táblázat harmadik oszlopában (balra) látható.

érdekes összehasonlítani a várható győzelem valószínűségét a FIFA Világranglistájával. Franciaország Nagy mozgató felfelé-valószínűleg azért, mert a könnyebb döntetlen, míg Portugália esik kilencedik kedvencek, annak ellenére, hogy a harmadik helyen csapat a világon.

tekintettel arra, hogy egy ilyen modell leggyakoribb használata a valószínűségek összehasonlítása a bukmékerek valószínűségeivel, a táblázat ötödik és hatodik oszlopa adja meg az esélyeket és az implikált valószínűségeket a Bet365-től, mint az előrejelzéseim napján (14 Május 2010). Be kell vallanom, amikor megláttam a hasonlóságokat, elégedett voltam – ez megerősíti, hogy a modell és a szimulációs gyakorlat ésszerű eredményeket ad. A közelebbi vizsgálat azonban néhány eltérést tár fel. Jogi nyilatkozat ideje: kérjük, vegye figyelembe, hogy nem javaslom, hogy használja ezeket az esélyeket A tét elhelyezésére. A fogadóirodák valóban tudják, mit csinálnak, és sokkal több információt tartalmaznak, amelyeket az esélyeik tájékoztatására használtam – ők is sokkal többet fizetnek, mint én, hogy ilyen dolgokat csináljak!

úgy tűnik, hogy a bukmékerek szerint Spanyolország és Brazília nagyobb valószínűséggel nyer, mint én, ami azt sugallja, hogy ezek valójában nem jó csapatok (ilyen esélyekkel). Ennek oka lehet, hogy megvédik magukat a piactól, amely szívesen szerepel ezekben a csapatokban – hasonló történet igaz Angliára is.

Franciaország viszont jó értéket kínál – a modell szerint a győzelem valószínűsége közel kétszerese a bukméker által feltételezett valószínűségnek. Nehéz lesz bármilyen Ír Köztársaság rajongó számára, Ha Franciaország folytatja a világbajnokságot, tekintettel arra, hogy a francia csatár, Thierry Henry 21.századi pörgetése az Isten keze céljával kiütötte őket a világbajnokságból.

tehát itt van – a nyakamat a vonalra tettem (legalábbis a modell), hogy néhány tippet adjak, pusztán statisztikák alapján (nem az én véleményem):

Spanyolország a versenyek kedvencei, de nem biztos, hogy ár-érték arányt kínálnak. (Az okosabb olvasó ezt egy politikus válaszának fogja fel: Ha Spanyolország nyer, azt mondhatom ,hogy ‘mondtam, hogy favoritok’, míg ha veszítenek, azt mondhatom, hogy’mondtam, hogy nem voltak jó fogadások – 88,4% – os valószínűséggel nem nyertek’!)

Franciaország nyerni egy jó fogadás.

meggyőztem Jaroweket is, hogy adjon nekem egy tippet:

Brazília nem nyer. (Általában óvatos és óvatos).

a modell jóslatai a verseny utolsó szakaszaira a következők:

QF1: Hollandia vs Brazília

QF2: Franciaország vs Anglia

QF3: Németország vs Argentína

QF4: Olaszország vs Spanyolország

elődöntő felállás:

SF1: Brazília vs Franciaország

SF2: Argentína vs Spanyolország

döntő:

Brazília vs. Spanyolország

elég nyilvánvaló tényleg! Azt kell mondanom, hogy bár statisztikus hírnevem ezeken a tippeken nyugszik, ésszerűen jó, felvidítom szülőhazámat, Angliát, függetlenül attól, hogy ki az ellenzék. Várom a június 11-i indulást…

Leave a Reply