věda předpovídání fotbalových výsledků

předpovídání fotbalových výsledků je rychle rostoucí oblastí akademického zájmu. Ekonomové používají modely k hodnocení efektivity sázkových trhů, operační výzkumníci používají modely k experimentování s různými efekty designu turnajů a statistici předvádějí své znalosti pomocí pokročilých statistických technik modelováním složitosti fotbalových dat.

nejsou to samozřejmě jen akademici, kteří těží archivy fotbalových výsledků. Sázkové kanceláře žijí a dýchají fotbalové Predikční modely-stejně jako odhodlanější flutterers. Chyby stojí peníze a práci, zatímco nalezení malé výhody může přinést velké odměny.

sázkové trhy

v akademickém prostředí je nejběžnější aplikací modelů předpovědi fotbalu testování efektivity sázkového trhu. Hypotéza efektivních trhů (EMH) je základním kamenem finanční teorie a ve své nejjednodušší formě uvádí, že investor by neměl být schopen trvale získat výnosy nad průměrem. Nalezení prognostického modelu fotbalu, který může generovat lepší než průměrné nebo dokonce pozitivní výnosy, obvykle vede k publikaci pro akademika jako příklad porušení EMH, ale proprietární povaha modelů znamená, že publikované modely zřídka (pokud vůbec) představují ty nejlepší modely a ještě méně často vytvářejí pozitivní výnosy důsledně.

nejvýkonnější modely jsou rezervou hazardního průmyslu. Pro bookmakera je zásadní stanovit kurz na hodnotu, která realisticky reprezentuje pravděpodobnost vyhraného, vylosovaného nebo prohraného zápasu. Pokud to bookmaker neudělá, riskuje obrovské ztráty.

například asijské bookmakery by nenapadlo vzít individuální sázku 200 000 USD – a pravidelně dostávat sázky 400 000 USD – a typický víkend v anglické Premier League obvykle přitahuje obrat 500 milionů USD v Asii. S takovým přílivem peněz, které jsou vsazeny, není divu, že bookmakeři využívají všechny možné nástroje, které mají k dispozici – jedním z nich jsou matematické modely.

matematický model se obvykle nepoužívá sám o sobě k nastavení kursů. K úpravě kursů generovaných podle modelu se používá odborník, který určuje kursy, a to s ohledem na jakékoli další informace. Například typický model může brát v úvahu nedávné výsledky týmu a postavení každého týmu pouze v lize. Sázkař pak upraví tyto předpokládané kurzy tak, aby odpovídaly, říci, zranění hvězdného hráče.

na druhé straně trhu jsou sázkaři. Specializované společnosti nabízejí služby, které klientům radí, které sázky mají učinit. Maciej Jarowek je sázkový poradce pro AsianConnect88.com, sázkový makléř. Požádal jsem ho o jeho myšlenky na využití matematiky v průmyslu. Jako bookmaker používá model, který mu dává výchozí bod, a poté upravuje kurzy, jak uzná za vhodné.

Jarowek je odborníkem na Polský fotbal, a když zjistí rozpor mezi jeho kurzy a kurzy bookmakerů, může si vybrat, zda tento rozpor stačí k doporučení vsadit. Největší výhodou profesionálních hráčů oproti bookmakerovi je podle něj to, že nemusí sázet na každý zápas – mohou si vybírat a vybírat. Vzhledem k tomu, že Jarowek je jedním z mnoha profesionálních hráčů, kteří pracují pro AsianConnect88.com, a že existuje mnoho takových agentur v provozu, zdá se, že existuje značný prostor pro porážku na trhu.

ve srovnání s jinými sporty je výsledek fotbalového zápasu relativně obtížné předvídat. Někteří akademici se domnívají, že se jedná o jeden ze zdrojů popularity fotbalu-fanoušci nikdy neznají výsledek zápasu, než k němu dojde, takže sledování hry je vzrušující.

vědci dělají kariéru na základě této nejistoty výsledku a tráví nekonečné hodiny uvažováním o každé možné události v zápase. Každý víkend je v tuzemském fotbale nespočet rozruchů a mistrovství světa v hokeji má svůj spravedlivý podíl na obrovských vraždách. Vzhledem k této inherentní nepředvídatelnosti, jak můžeme předpovídat?

existují dva široké přístupy k modelování výsledků fotbalových zápasů. Za prvé, lze předpovědět výsledek přímo-ať už bude výsledkem výhra, remíza nebo ztráta. V tomto případě je výsledek (výhra, prohra, remíza) pořadovou proměnnou (výhra je lepší než remíza, která je lepší než prohra). Model volby je zde ordinální regrese, jako je objednaný probit. Výstupem z takového modelu je pravděpodobnost každého výsledku, takže pro nadcházející zápas lze pomocí modelu vypočítat pravděpodobnost výhry, remízy nebo prohry.

druhý přístup pro modelování výsledku zápasu je nepřímou metodou, kdy analytik modeluje přesné skóre hry. V tomto případě analytik odhaduje pravděpodobnost každého možného počtu gólů vstřelených každým týmem. Pak lze odvodit pravděpodobnost, že tým vyhraje, remíza nebo prohra zápas sečtením příslušné přesné pravděpodobnosti skóre.

objednaný probit

důkazy naznačují velmi malý rozdíl ve výkonu každého přístupu ve výsledku modelování shody. Zde stavím model prvního typu, konkrétně model “objednaný probit”.

objednaný probitový model lze použít k odhadu pravděpodobnosti tří výsledků zápasu. K tomu využívá informace o každém týmu. Například, zdá se rozumné, že tým, který vyhrál poslední tři zápasy, má vyšší pravděpodobnost výhry v příštím zápase než tým, který prohrál poslední tři zápasy. Podobně, tým, který je hodnocen výše než opozice, má vyšší pravděpodobnost výhry zápasu než tým s nižším hodnocením. Velikost pravděpodobnosti výhry se mění, vzhledem k tomu, že tyto nugety informací se řídí parametry modelu. Ve statistickém modelu se odhadují parametry, které nejlépe vysvětlují, co se stalo v minulosti.

můj model je zde založen na téměř 9 000 mezinárodních zápasech za osmileté období. Informace a účinky na pravděpodobnost, že tým vyhraje zápas, jsou:

  • místo-domů / pryč nebo neutrální. Tým s větší pravděpodobností vyhraje, pokud bude doma;
  • vzdálenost od hlavního města k místu hry. Tým s větší pravděpodobností vyhraje, čím kratší je ujetá vzdálenost (fanoušky a samotným týmem);
  • rozdíl ve světovém žebříčku mezi týmy. Vyšší tým s větší pravděpodobností vyhraje;
  • Změna světového žebříčku pro každý tým během předchozích 12 měsíců. S větší pravděpodobností vyhraje zlepšující se tým;
  • typ zápasu, jmenovitě: hlavní turnaj (mistrovství světa nebo konfederace), menší turnaj (jiný schválený FIFA), kvalifikační nebo přátelský. Lepší týmy berou velké turnaje vážněji;
  • výsledky minulých zápasů. Pro každý zápas používám předchozích osm výsledků pro každý tým (v průměru národní tým hraje osm zápasů v období 12 měsíců). Kromě výsledků znám i Světový žebříček pro každý z osmi soupeřových týmů v době zápasu.

použití informací o minulých výsledcích vyžaduje trochu extra myšlení. Výhra 1-0 pro tým s hodnocením 200 versus tým se hodnocením 4 jasně představuje lepší výkon, než kdyby týmy byly hodnoceny 200 a 198. V důsledku toho by minulé výsledky měly být váženy vzhledem k výsledku a vzhledem k síle opozice. Minulá metrika výkonu (ppm), která zachycuje tento vztah, je dána vzorcem v horní části (vlevo) této stránky.

tento ppm se pohybuje od ” -1 ” do “1”, Kde “-1” představuje nejhorší možný výsledek-nejlépe hodnocený tým prohrává s týmem se spodním hodnocením-a “1” představuje nejhorší tým, který porazil nejlépe hodnocený tým. Všimněte si, že 204 je maximální hodnota hodnocení jakéhokoli týmu během posuzovaného období. Minulá metrika výkonu je vynesena v horní části (vpravo) této stránky.

(sshhh-i predict the World Cup winner)

výše popsaný objednaný probit model lze použít k odhadu pravděpodobnosti každého výsledku (výhra/remíza/prohra) v jednom zápase. Bookmaker může tyto pravděpodobnosti použít k informování sázkařů, zatímco sázkař je může použít k posouzení, zda má být sázka podána.

aby bylo možné předpovědět vítěze Světového poháru 2010, je třeba předpovědět vítěze série zápasů. K tomu používám simulaci a mám napsaný kód, který používá přizpůsobený model výsledku zápasu k simulaci celého turnaje. Mistrovství světa začíná osmi mini-ligami (skupinami) čtyř týmů, které se hrají jednou. První a druhé týmy v každé skupině pak postupují do vyřazovacích fází. Tato struktura turnaje ovlivňuje pravděpodobnost výhry týmu.

například v nadcházejícím Mistrovství světa jsou nejpravděpodobnějšími týmy, které postoupí ze skupiny G, Brazílie a Portugalsko. Nejpravděpodobnějším týmem, který vyhraje skupinu H, je Španělsko. Vítězové (finalisté) skupiny H se pak v prvním vyřazovacím kole setkávají s finalisty (vítězi) skupiny G. Španělsko je tak téměř zaručeno obtížným zápasem v prvním vyřazovacím kole. Porovnejte to s favority skupiny a, Francie, která bude s největší pravděpodobností čelit finalistovi skupiny B. vzhledem k tomu, že favorité skupiny B jsou Argentina mnohem silnější než ostatní týmy ve skupině, Francie (a Argentina) pravděpodobně budou mít v první vyřazovací fázi méně obtížné zápasy než Španělsko, Brazílie a Portugalsko.

je tedy jasné, že předpovídat vítěze turnaje celkově není jen případ výběru nejlepšího týmu. Je třeba vzít v úvahu vliv struktury turnaje. Výsledky 100 000 simulovaných turnajů jsou uvedeny v tabulce vlevo.

navzdory zdánlivě obtížným remízám jsou Španělsko a Brazílie stále první a druhé z hlediska počtu výher. Počet výher lze snadno převést na předpokládanou pravděpodobnost výhry v turnaji pro každý tým, která je uvedena ve třetím sloupci tabulky (vlevo).

je zajímavé porovnat předpokládané pravděpodobnosti výhry se světovým žebříčkem FIFA. Francie je velkým tahounem vzhůru-možná kvůli jejich snadnějšímu losování, zatímco Portugalsko kleslo na deváté favority, přestože je třetím týmem na světě.

vzhledem k tomu, že nejčastějším používáním tohoto modelu je porovnávání pravděpodobností s pravděpodobnostmi sázkových kanceláří, pátý a šestý sloupec tabulky udávají kurzy a implikované pravděpodobnosti Bet365, jako ke dni, kdy jsem předpověděl (14. května 2010). Musím přiznat, že když jsem viděl podobnosti, byl jsem potěšen-potvrzuje to model a simulační cvičení dávají rozumné výsledky. Bližší prohlídka však odhaluje některé nesrovnalosti. Zřeknutí se odpovědnosti: Vezměte prosím na vědomí, že nedoporučuji používat tyto kurzy k podání sázky. Bookmakeři opravdu vědí, co dělají, a začleňují mnohem více informací, které jsem použil k informování svých šancí-za takové věci jsou také placeni mnohem více než já!

zdá se, že bookmakeři si myslí, že Španělsko a Brazílie s větší pravděpodobností vyhrají než já, což naznačuje, že to ve skutečnosti nejsou dobré týmy, které by podpořily (při těchto kurzech). Může to být proto, že se chrání před trhem , který chce být v těchto týmech – podobný příběh platí pro Anglii.

Francie naproti tomu nabízí dobrou hodnotu – model naznačuje, že pravděpodobnost vítězství je téměř dvojnásobná než pravděpodobnost předpokládaná bookmakerem. Bude těžké vzít pro všechny fanoušky Irské republiky, pokud by Francie měla vyhrát Světový pohár, vzhledem k tomu, že byli vyřazeni z mistrovství světa francouzským útočníkem Thierry Henrym 21. století na cíli “Boží ruky”.

tak tady to je – dal jsem krk na linii (alespoň model dělá), abych vám dal několik tipů, založených čistě na statistikách (ne můj názor):

Španělsko je favoritem turnaje, ale nemusí nabízet hodnotu za peníze. (Bystrý čtenář to pozná jako trochu politikovu odpověď: pokud Španělsko vyhraje, mohu říci “řekl jsem vám, že jsou favority”, zatímco pokud prohrají, mohu říci “řekl jsem vám, že to nebyla dobrá sázka – byla 88,4% pravděpodobnost, že nevyhrají”!)

Francie vyhrát je dobrá sázka.

přesvědčil jsem i Jarolíma, aby mi dal tip:

Brazílie nevyhraje. (Obvykle rezervovaný a opatrný).

předpovědi modelu pro poslední fáze turnaje jsou:

QF1: Holandsko vs Brazílie

QF2: Francie vs Anglie

QF3: Německo vs Argentina

QF4: Itálie vs Španělsko

semifinálová sestava:

SF1: Brazílie vs Francie

SF2: Argentina vs Španělsko

>

finále:

Brazílie vs. Španělsko

docela zřejmé opravdu! Měl bych říci, že i když moje pověst statistika spočívá na tom, že tyto tipy jsou přiměřeně dobré, budu fandit své rodné Anglii bez ohledu na to, koho opozice. Čekám v očekávání na výkop 11. Června…

Leave a Reply