the science of predicting football results

Predicting football results on nopeasti kasvava akateemisen kiinnostuksen kohde. Taloustieteilijät käyttävät malleja arvioidakseen vedonlyöntimarkkinoiden tehokkuutta, operatiiviset tutkijat käyttävät malleja kokeillakseen turnausten suunnittelun erilaisia vaikutuksia, ja tilastotieteilijät esittelevät taitojaan kehittyneillä tilastollisilla tekniikoilla mallintamalla jalkapallodatan koukeroita.

jalkapallotulosten arkistoja kaivavat tietysti muutkin kuin akateemikot. Vedonvälittäjät elävät ja hengittävät jalkapallon ennustusmalleja-samoin vannoutuneemmat huilaajat. Virheet maksavat rahaa ja työpaikkoja, kun taas pienen edun löytäminen voi tuottaa suuria palkintoja.

vedonlyöntimarkkinat

akateemisessa maailmassa jalkapallon ennustemallien yleisin sovellus on testata vedonlyöntimarkkinoiden tehokkuutta. EMH (Efficient Markets Hypothesis) on finanssiteorian kulmakivi, ja sen yksinkertaisimmassa muodossa todetaan, että sijoittajan ei pitäisi pystyä jatkuvasti saamaan keskimääräistä suurempaa tuottoa. Löytää ennusteen malli jalkapallo, joka voi tuottaa keskimääräistä parempi – tai jopa positiivinen-tuotto yleensä johtaa julkaisu akateemisen esimerkkinä rikkomisesta EMH, mutta oma luonne malleja tarkoittaa, että julkaistut harvoin (jos koskaan) edustavat parhaita malleja, ja vielä harvemmin tuottaa positiivisia tuottoja johdonmukaisesti.

parhaiten menestyviä malleja ovat pelialan reservit. Vedonvälittäjän on ensiarvoisen tärkeää asettaa kertoimet arvolle, joka vastaa realistisesti voitetun, arvotun tai hävityn ottelun todennäköisyyksiä. Jos vedonvälittäjä ei tee tätä, se uhkaa valtavia tappioita.

esimerkiksi Aasialaiset vedonvälittäjät eivät ajattelisi mitään ottaessaan 200 000 dollarin yksittäisen vedon – ja saavat säännöllisesti 400 000 dollarin vetoja – ja tyypillinen viikonloppu Englannin Valioliigassa houkuttelee tyypillisesti 500 miljoonan dollarin liikevaihtoa Aasiassa. Kun näin paljon rahaa lyödään vetoa, ei ole yllättävää, että vedonvälittäjät käyttävät kaikkia käytettävissään olevia välineitä – yksi niistä on matemaattinen malli.

matemaattista mallia ei tyypillisesti käytetä yksin kertoimien asettamiseen. Asiantuntija kertoimet-setter käytetään säätää mallin tuottamia kertoimia annetaan ylimääräistä tietoa. Tyypillinen malli voisi esimerkiksi ottaa huomioon vain joukkueen viimeaikaiset tulokset ja kunkin joukkueen aseman liigassa. Kertoimenlaskija säätää sitten nämä ennustetut kertoimet tilittämään vaikkapa tähtipelaajan loukkaantumisen.

toisella puolella ovat vedonlyöjät. Erikoistuneet yritykset tarjoavat palveluja neuvomaan asiakkaita, mitkä vedot tehdä. Maciej Jarowek on vedonlyöntikonsultti AsianConnect88.com, vedonlyöntivälittäjä. Kysyin häneltä hänen ajatuksiaan matematiikan käytöstä alalla. Vedonvälittäjänä hän käyttää mallia, joka antaa hänelle lähtöpaikan ja sitten säätää kertoimia parhaaksi katsomallaan tavalla.

Jarowek on puolalaisen jalkapallon asiantuntija, ja kun hän löytää ristiriidan hänen ja Vedonvälittäjien todennäköisyyksien välillä, hän voi valita, riittääkö ero neuvomaan vedonlyönnissä. Hän sanoo suurin etu ammattilaispelaajien on yli vedonvälittäjä on, että heidän ei tarvitse panostaa jokaisen ottelun-he voivat valita ja valita. Koska Jarowek on yksi monista ammattilaispelaajista, jotka työskentelevät AsianConnect88.com ja koska tällaisia virastoja on toiminnassa lukuisia, näyttää siltä, että markkinoilla on paljon mahdollisuuksia voittaa.

muihin lajeihin verrattuna jalkapallo-ottelun tulosta on suhteellisen vaikea ennustaa. Jotkut tutkijat uskovat, että tämä on yksi jalkapallon suosion lähteistä-fanit eivät koskaan todella tiedä ottelun lopputulosta ennen kuin se on tapahtunut, mikä tekee pelin katsomisesta jännittävän ehdotuksen.

asiantuntijat tekevät uraa perustuen tähän lopputuloksen epävarmuuteen ja viettävät loputtomasti tunteja miettien jokaista mahdollista tapahtumaa ottelussa. Kotimaisessa jalkapallossa tapahtuu lukematon määrä kohuja joka viikonloppu, ja MM-turnaus heittää osansa jättisurmista. Kun otetaan huomioon tämä luontainen arvaamattomuus,miten voimme ennustaa?

jalkapallo-otteluiden tulosten mallintamiseen on kaksi laajaa lähestymistapaa. Ensinnäkin tuloksen voi ennustaa suoraan-tuleeko tuloksena voitto, tasapeli vai tappio. Tällöin tulos (voitto, tappio, tasapeli) on ordinaalinen muuttuja (voitto on parempi kuin tasapeli, joka on parempi kuin tappio). Valintamalli on tässä ordinaalinen regressio, kuten ordinaalinen probit. Tällaisen mallin tuotos on kunkin tuloksen todennäköisyys, jotta tulevaa ottelua varten voidaan käyttää mallia voiton, tasapelin tai tappion todennäköisyyden laskemiseen.

toinen lähestymistapa ottelutuloksen mallintamiseen on epäsuora menetelmä, jossa analyytikko mallintaa pelin tarkan pistemäärän. Tässä tapauksessa analyytikko arvioi jokaisen joukkueen mahdollisen maalimäärän todennäköisyyden. Tämän jälkeen voidaan päätellä todennäköisyys, että joukkue voittaa, arvotaan tai häviää ottelun summaamalla asiaan liittyvät tarkat pistetodennäköisyydet.

tilattu probit

todisteet viittaavat siihen, että kunkin lähestymistavan suorituskyvyssä on hyvin vähän eroa vastaavuustulosten mallintamisessa. Täällä rakennan ensimmäisen tyypin mallin, nimittäin “ordered probit” – mallin.

tilatulla probit-mallilla voidaan arvioida ottelun kolmen lopputuloksen todennäköisyys. Tätä varten se käyttää tietoja jokaisesta joukkueesta. Tuntuu esimerkiksi järkevältä, että kolme viimeistä otteluaan voittaneella joukkueella on suurempi todennäköisyys voittaa seuraava ottelunsa kuin joukkueella, joka on hävinnyt kolme viimeistä otteluaan. Vastaavasti vastustajaa korkeammalle sijoittuneella joukkueella on suurempi todennäköisyys voittaa ottelu kuin huonommin sijoittuneella joukkueella. Määrä voittaa todennäköisyys muuttuu, koska nämä nuggets tietoa säännellään mallin parametrit. Tilastollisessa mallissa parametrien arvioidaan parhaiten selittävän, mitä aiemmin on tapahtunut.

mallini tässä perustuu lähes 9 000 kansainväliseen ottelutulokseen kahdeksan vuoden ajalta. Tiedot ja vaikutukset joukkueen voitontodennäköisyyteen ovat:

  • paikka-koti / poissa tai neutraali. Joukkue voittaa todennäköisemmin, jos kotonaan;
  • Etäisyys pääkaupungista pelipaikkaan. Joukkue voittaa todennäköisemmin mitä lyhyemmän matkan (fanien ja joukkueen itsensä ajama);
  • ero maailman rankingissa joukkueiden välillä. Korkeammalla sijoittunut joukkue voittaa todennäköisemmin;
  • maailmanrankingin muutos kunkin joukkueen osalta edellisen 12 kuukauden aikana. Parempi joukkue voittaa todennäköisemmin;
  • Ottelutyyppi, nimittäin: major-turnaus (World Cup tai confederation championship), minor – turnaus (muu Fifan hyväksymä), karsinta tai friendly. Paremmat joukkueet ottavat major-turnaukset vakavammin;
  • menneet ottelutulokset. Käytän jokaisessa ottelussa kunkin joukkueen kahdeksan edellistä tulosta (keskimäärin A-maajoukkue pelaa kahdeksan ottelua 12 kuukauden aikana). Tulosten lisäksi tiedän kunkin kahdeksan vastustajajoukkueen maailmanrankingin pelihetkellä.

aikaisempien tulosten hyödyntäminen vaatii hieman ylimääräistä pohdintaa. 1-0-voitto 200: n ja 4: nneksi sijoittuneesta joukkueesta on selvästi parempi suoritus kuin jos joukkueet olisivat sijoilla 200 ja 198. Tämän vuoksi aiemmat tulokset olisi painotettava suhteessa tulokseen ja suhteessa opposition vahvuuteen. Aiempi suoritusmittari (ppm), joka kaappaa tämän suhteen, annetaan tämän sivun yläosassa (vasemmalla) olevalla kaavalla.

tämä ppm menee arvosta ” -1 “arvoon ” 1″, jossa ” -1 “tarkoittaa huonointa mahdollista tulosta – kärkijoukkue häviää huonoiten sijoittuneelle joukkueelle-ja” 1 ” edustaa huonoiten sijoittunutta joukkuetta, joka voittaa parhaiten sijoittuneen joukkueen. Huomaa, että 204 on maksimiarvo minkä tahansa joukkueen sijoitukselle tarkasteltavana olevalla kaudella. Aiempi suoritusmittari on piirretty tämän sivun yläreunaan (oikealle).

(Sshhh – I ennustaa mm-voittajan)

yllä kuvatulla tilatulla probit-mallilla voidaan arvioida jokaisen lopputuloksen (voitto/tasapeli/tappio) todennäköisyys yhdessä ottelussa. Vedonvälittäjä voi käyttää näitä todennäköisyyksiä ilmoittaakseen kertoimen asettajille, kun taas vedonlyöjä voi käyttää niitä arvioidakseen, pitäisikö panos asettaa.

vuoden 2010 MM-kisojen voittajan ennustaminen edellyttää Ottelusarjan voittajan ennustamista. Voit tehdä tämän, käytän simulointi, ja on kirjallinen koodi, joka käyttää sovitettua mallia ottelun tulos simuloida koko turnauksen. MM-turnaus alkaa kahdeksalla neljän joukkueen miniliigalla (lohkolla), jotka pelaavat toisensa kerran. Jokaisen lohkon ensimmäiseksi ja toiseksi sijoittuneet joukkueet etenevät tämän jälkeen tyrmäysvaiheeseen. Tämä turnausrakenne vaikuttaa joukkueen voiton todennäköisyyteen.

esimerkiksi tulevissa MM-kisoissa todennäköisimmät g-lohkosta etenevät joukkueet ovat Brasilia Ja Portugali. Todennäköisin joukkue H-lohkon voittajaksi on Espanja. Tämän jälkeen H-ryhmän voittajat (juoksijat) kohtaavat G-ryhmän voittajat (voittajat) ensimmäisessä tyrmäyserässä. Näin Espanjalle on lähes taattu vaikea ottelu ensimmäisessä tyrmäyserässä. Vertaa tätä A-lohkon suosikkeihin, Ranskaan, joka kohtaa todennäköisimmin B-lohkon kakkossijan.B-lohkon ennakkosuosikit Argentiina on huomattavasti lohkon muita joukkueita vahvempi, Ranska (Ja Argentiina) saavat todennäköisesti vähemmän vaikeita otteluita ensimmäisessä tyrmäysvaiheessa kuin Espanja, Brasilia Ja Portugali.

on siis selvää, että koko turnauksen voittajien ennustaminen ei ole pelkkää parhaan joukkueen valitsemista. Täytyy ottaa huomioon turnauksen rakenteen vaikutus. Tulokset 100,000 simuloitu turnauksia on esitetty taulukossa, vasemmalla.

vaikeilta vaikuttavista tasapeleistään huolimatta Espanja ja Brasilia ovat voittojen määrässä edelleen ykkönen ja Kakkonen. Voittojen määrä voidaan helposti muuntaa kullekin joukkueelle ennustetuksi todennäköisyydeksi voittaa turnaus, joka näkyy taulukon kolmannessa sarakkeessa (vasemmalla).

on mielenkiintoista verrata ennustettuja voittotodennäköisyyksiä Fifan Maailmanrankingiin. Ranska on suuri nostaja ylöspäin-mahdollisesti helpomman tasapelinsä takia, kun taas Portugali putoaa yhdeksänneksi suosikiksi, vaikka on kolmanneksi sijoittunut joukkue maailmassa.

koska tällaista mallia käytetään useimmiten vedonlyöjien todennäköisyyksien vertailuun, taulukon viides ja kuudes sarake antavat Bet365: n todennäköisyydet ja implisiittiset todennäköisyydet, kuten ennustukseni tekopäivänä (14.5.2010). Täytyy myöntää, että kun näin yhtäläisyydet, olin tyytyväinen – se vahvistaa mallin ja simulaatioharjoitus antaa järkeviä tuloksia. Lähempi tarkastelu paljastaa kuitenkin joitakin ristiriitaisuuksia. Vastuuvapauslausekkeen aika: huomaa, että en suosittele käyttämään näitä kertoimia vedon asettamiseen. Vedonvälittäjät todella tietävät, mitä he tekevät, ja sisältävät paljon enemmän tietoa, jota olen käyttänyt heidän kertoimiinsa – heille myös maksetaan paljon enemmän kuin minulle tällaisen tekemisestä!

näyttää siltä, että vedonvälittäjät pitävät Espanjaa ja Brasiliaa todennäköisempinä voittajina kuin minä, mikä viittaa siihen, että nämä eivät oikeastaan ole hyviä joukkueita takaisin (näillä kertoimilla). Tämä voi johtua siitä, että he suojautuvat markkinoilta, jotka haluavat olla näissä joukkueissa – samanlainen tarina on totta Englannille.

Ranska Sen sijaan tarjoaa hyvää vastinetta – mallin mukaan voiton todennäköisyys on lähes kaksinkertainen vedonvälittäjän olettamaan nähden. Se on vaikea ottaa mitään Irlannin tasavallan fani, Jos Ranska olisi mennä voittaa World Cup, koska ne tippui ulos World Cup Ranska eteenpäin Thierry Henry 21. vuosisadan spin ‘Jumalan käsi’ tavoite.

joten tässä se on – laitan niskani likoon (ainakin malli tekee) antaakseni vinkkejä puhtaasti tilastojen perusteella (ei minun mielipiteeni):

Espanja on turnauksen suosikki, mutta ei välttämättä tarjoa vastinetta rahalle. (Neuvokkaampi lukija tunnistaa tämän hieman poliitikon vastaukseksi: jos Espanja voittaa, voin sanoa “sanoin, että he ovat suosikkeja”, kun taas jos he häviävät, voin sanoa “sanoin, etteivät he olleet hyvä veto – oli 88,4 prosentin todennäköisyys, että he eivät voittaneet”!)

Ranskan voitto on hyvä veto.

taivuttelin myös Jarowekin antamaan vinkin:

Brasilia Ei voita. (Tyypillisesti varautunut ja varovainen).

mallin ennusteet turnauksen loppuvaiheista ovat:

QF1: Hollanti vs. Brasilia

QF2: Ranska vs. Englanti

QF3: Saksa vs. Argentiina

QF4: Italia vs. Espanja

Välierävastus:

SF1: Brasilia vs. Ranska

SF2: Argentiina vs. Espanja

finaali:

Brasilia vs. Espanja

melko selvää oikeasti! Minun pitäisi sanoa, että vaikka maineeni tilastotieteilijänä nojaa siihen, että nämä vinkit ovat kohtuullisen hyviä, Aion hurrata kotimaalleni Englannille riippumatta siitä, kuka oppositiosta on. Odotan innolla aloitusta 11. kesäkuuta…

Leave a Reply