știința prezicerii rezultatelor fotbalului

prezicerea rezultatelor fotbalului este o zonă în creștere rapidă de interes academic. Economiștii folosesc modele pentru a evalua eficiența piețelor de pariuri, cercetătorii operaționali folosesc modele pentru a experimenta diferitele efecte ale designului turneului, iar statisticienii își prezintă competența cu tehnici statistice avansate prin modelarea complexității datelor de fotbal.

nu este, desigur, doar academicieni care sunt miniere arhivele de scoruri de fotbal. Casele de pariuri trăiesc și respiră modele de predicție a fotbalului-la fel ca și fluttererii mai dedicați. Greșelile costă bani și locuri de muncă, în timp ce găsirea unui mic avantaj poate aduce recompense mari.

piețe de pariuri

în mediul academic, cea mai comună aplicație a modelelor de prognoză a fotbalului este testarea eficienței pieței de pariuri. Ipoteza piețelor eficiente (EMH) este o piatră de temelie a teoriei financiare și, în forma sa cea mai simplă, afirmă că un investitor nu ar trebui să poată obține în mod constant randamente peste medie. Găsirea unui model de prognoză a fotbalului care poate genera randamente mai bune decât media-sau chiar pozitive-are ca rezultat, de obicei, o publicație pentru academic ca exemplu de încălcare a EMH, dar natura proprietară a modelelor înseamnă că cele publicate rareori (dacă vreodată) reprezintă cele mai bune modele și chiar mai rar generează randamente pozitive în mod consecvent.

cele mai performante modele sunt rezerva industriei de gambling. Este extrem de important pentru o casă de pariuri să stabilească cote la o valoare care reprezintă în mod realist probabilitățile unui meci câștigat, extras sau pierdut. Dacă casa de pariuri nu reușește să facă acest lucru, va risca pierderi uriașe.

de exemplu, casele de pariuri Asiatice nu s – ar gândi la un pariu individual de 200.000 USD – și primesc în mod regulat pariuri de 400.000 USD-iar un weekend tipic în Premier League englez atrage de obicei o cifră de afaceri de 500 milioane USD în Asia. Cu astfel de valuri de bani fiind pariate, nu este surprinzător faptul că casele de Pariuri face uz de orice instrument posibil la dispoziția lor – unul dintre ele fiind modele matematice.

un model matematic nu este de obicei folosit singur pentru a seta cote. Un expert cote-setter este angajat pentru a ajusta cotele generate de model, având în vedere orice informații suplimentare. De exemplu, un model tipic ar putea lua în considerare doar rezultatele recente ale unei echipe și poziția fiecărei echipe în ligă. Cote-setter va ajusta apoi aceste cote prezise pentru a ține cont de, să zicem, un prejudiciu la un jucător stea.

de cealaltă parte a pieței, sunt pariorii. Companiile specializate oferă servicii pentru a sfătui clienții ce pariuri să facă. Maciej Jarowek este consultant de pariuri pentru AsianConnect88.com, un broker de pariuri. I-am cerut gândurile sale cu privire la utilizarea matematicii în industrie. Așa cum face o casă de pariuri, el folosește un model pentru a-i oferi un punct de plecare și apoi ajustează cotele după cum consideră potrivit.

Jarowek este un expert în fotbalul polonez și, atunci când găsește o discrepanță între cotele sale și cele ale caselor de pariuri, poate alege dacă discrepanța este suficientă pentru a sfătui plasarea unui pariu. El spune că cel mai mare avantaj pe care jucătorii profesioniști îl au față de casa de pariuri este că nu trebuie să parieze pe fiecare meci – pot alege și alege. Având în vedere că Jarowek este unul dintre mulți jucători profesioniști care lucrează pentru AsianConnect88.com, și că există numeroase astfel de agenții în funcțiune, se pare că există posibilități considerabile pentru a bate piața.

comparativ cu alte sporturi, rezultatul unui meci de fotbal este relativ dificil de prezis. Unii academicieni cred că aceasta este una dintre sursele popularității fotbalului – fanii nu știu niciodată cu adevărat rezultatul unui meci înainte de a se întâmpla, făcând din vizionarea jocului o propunere interesantă.

experții fac cariere bazate pe această incertitudine a rezultatului și petrec ore nesfârșite contemplând fiecare eveniment posibil într-un meci. Există nenumărate supărări în fotbalul intern în fiecare weekend, iar Cupa Mondială își aruncă partea echitabilă de ucideri uriașe. Având în vedere această imprevizibilitate inerentă, cum putem face predicții?

există două abordări generale pentru modelarea rezultatelor meciurilor de fotbal. În primul rând, se poate prezice rezultatul direct – dacă rezultatul va fi o victorie, o remiză sau o pierdere. În acest caz, rezultatul (victorie, pierdere, remiză) este o variabilă ordinală (o victorie este mai bună decât o remiză care este mai bună decât o pierdere). Modelul de alegere aici este unul de regresie ordinală, cum ar fi probit ordonat. Rezultatul unui astfel de model este probabilitatea fiecărui rezultat, astfel încât pentru un meci viitoare se poate utiliza modelul pentru a calcula probabilitatea unei victorii, remiză sau pierdere.

a doua abordare pentru modelarea rezultatului unui meci este o metodă indirectă în care analistul modelează scorul exact al jocului. În acest caz, analistul estimează probabilitatea fiecărui număr posibil de goluri marcate de fiecare echipă. Se poate deduce apoi probabilitatea ca o echipă să câștige, să deseneze sau să piardă meciul prin însumarea probabilităților de scor exacte relevante.

o probă ordonată

sugerează o diferență foarte mică în performanța fiecărei abordări în modelarea rezultatului meciului. Aici, construiesc un model de primul tip, și anume un model’ probit comandat’.

modelul probit comandat poate fi folosit pentru a estima probabilitatea celor trei rezultate ale unui meci. Pentru a face acest lucru, utilizează informații despre fiecare echipă. De exemplu, pare rezonabil ca o echipă care a câștigat ultimele trei meciuri să aibă o probabilitate mai mare de a câștiga următorul meci decât o echipă care și-a pierdut ultimele trei meciuri. În mod similar, o echipă clasată mai sus decât opoziția are o probabilitate mai mare de a câștiga meciul decât echipa clasată mai jos. Valoarea modificărilor probabilității de câștig, având în vedere aceste pepite de informații sunt guvernate de parametrii modelului. Într-un model statistic, se estimează că parametrii explică cel mai bine ce s-a întâmplat în trecut.

modelul meu de aici se bazează pe aproape 9.000 de rezultate internaționale de meci pe o perioadă de opt ani. Informațiile și efectele asupra probabilității ca o echipă să câștige un meci sunt:

  • Locul de desfășurare – acasă / departe sau neutru. O echipă are mai multe șanse să câștige dacă este acasă;
  • Distanța de la capitală până la locația jocului. O echipă are mai multe șanse să câștige cu cât distanța parcursă este mai scurtă (de fani și de echipa în sine);
  • diferență în clasamentul mondial între echipe. O echipă clasată mai sus are mai multe șanse să câștige;
  • schimbarea clasamentului mondial pentru fiecare echipă în ultimele 12 luni. O echipă care se îmbunătățește este mai probabil să câștige;
  • tipul de meci, și anume: turneu major (Cupa Mondială sau Campionatul Confederației), turneu minor (altul sancționat de FIFA), calificare sau Amical. Echipele mai bune iau mai în serios turneele majore;
  • rezultatele meciurilor anterioare. Pentru fiecare joc, folosesc cele opt rezultate anterioare pentru fiecare echipă (în medie, o echipă națională joacă opt meciuri într-o perioadă de 12 luni). În plus față de rezultate, știu clasamentul mondial pentru fiecare dintre cele opt echipe de opoziție la momentul jocului.

folosirea informațiilor din rezultatele trecute necesită un pic de gândire suplimentară. O victorie cu 1-0 pentru o echipă clasată pe locul 200 față de o echipă clasată pe locul 4 reprezintă în mod clar o performanță mai bună decât dacă echipele ar fi clasate pe locul 200 și respectiv 198. În consecință, rezultatele anterioare ar trebui să fie ponderate în raport cu rezultatul și în raport cu puterea opoziției. O valoare a performanței anterioare (ppm), care surprinde această relație, este dată de formula din partea de sus (stânga) a acestei pagini.

acest ppm merge de la ‘-1’ la ‘1’, unde ‘-1’ reprezintă cel mai prost rezultat posibil – echipa clasată de sus pierzând în fața echipei clasate de jos-și ‘1’ reprezintă echipa cea mai slab clasată învingând echipa cea mai bine clasată. Rețineți că 204 este valoarea maximă a clasamentului oricărei echipe în perioada luată în considerare. Valoarea performanței anterioare este reprezentată grafic în partea de sus (dreapta) a acestei pagini.

(sshhh – prezic câștigătorul Cupei Mondiale)

modelul probit ordonat descris mai sus poate fi utilizat pentru a estima probabilitatea fiecărui rezultat (victorie/remiză/pierdere) într-un singur meci. O casă de pariuri ar putea folosi aceste probabilități pentru a ajuta la informarea cote-setteri, în timp ce un parior le-ar putea folosi pentru a evalua dacă un pariu ar trebui să fie plasat.

pentru a prezice câștigătorul Cupei Mondiale 2010, trebuie să preziceți câștigătorul unei serii de meciuri. Pentru a face acest lucru, eu folosesc simulare, și au scris cod care utilizează modelul montat de rezultatul meciului pentru a simula întregul turneu. Cupa Mondială începe cu opt mini-ligi (grupuri) de patru echipe, jucându-se reciproc o dată. Echipele clasate pe primul și al doilea loc din fiecare grupă trec apoi la etapele eliminatorii. Această structură a turneului afectează probabilitatea câștigării unei echipe.

de exemplu, în viitoarea Cupă Mondială, cele mai probabile Echipe care vor evolua din grupa G sunt Brazilia și Portugalia. Cea mai probabilă echipă care va câștiga grupa H este Spania. Câștigătorii (subcampionii) din grupa H se întâlnesc apoi cu subcampionii (câștigătorii) din grupa G în prima rundă eliminatorie. Astfel, Spania este aproape garantată un meci dificil în prima rundă eliminatorie. Comparați acest lucru cu favoritele grupei A, Franța, care se va confrunta cel mai probabil cu subcampionul grupei B. având în vedere favoritele Grupei B, Argentina, sunt mult mai puternice decât celelalte echipe din grupă, Franța (și Argentina) sunt susceptibile de a avea meciuri mai puțin dificile în prima etapă eliminatorie decât Spania, Brazilia și Portugalia.

este clar atunci că prezicerea câștigătorilor turneului în ansamblu nu este doar un caz de alegere a celei mai bune echipe. Trebuie să țineți cont de efectul structurii turneului. Rezultatele a 100.000 de turnee simulate sunt prezentate în tabelul din stânga.

în ciuda remizelor aparent dificile, Spania și Brazilia sunt încă pe primul loc și pe locul doi în ceea ce privește numărul de victorii. Numărul de victorii poate fi ușor convertit într-o probabilitate prezisă de a câștiga turneul pentru fiecare echipă, care este afișată în a treia coloană a tabelului (stânga).

este interesant să comparăm probabilitățile de câștig prezise cu clasamentul mondial FIFA. Franța este mare mișcare în sus – posibil din cauza remizei lor mai ușoare, în timp ce Portugalia se încadrează la a noua favorită, în ciuda faptului că este echipa clasată pe locul trei în lume.

având în vedere că cea mai frecventă utilizare a unui astfel de model este de a compara probabilitățile cu cele ale caselor de pariuri, coloanele A cincea și a șasea ale tabelului dau cotele și probabilitățile implicite de la Bet365, ca la data la care mi-am făcut predicțiile (14 Mai 2010). Trebuie să recunosc, când am văzut asemănările, am fost mulțumit-confirmă modelul și exercițiul de simulare dau rezultate sensibile. Cu toate acestea, o inspecție mai atentă relevă unele discrepanțe. Disclaimer time: Vă rugăm să rețineți că nu vă sugerez să utilizați aceste cote pentru a plasa un pariu. Casele de pariuri într – adevăr știu ce fac și să includă mult mai multe informații am folosit pentru a informa cotele lor-ele sunt, de asemenea, plătite mult mai mult decât mine pentru a face acest tip de lucru!

se pare că casele de pariuri cred că Spania și Brazilia au mai multe șanse să câștige decât mine, sugerând că acestea nu sunt de fapt Echipe bune de susținut (la aceste cote). Acest lucru s – ar putea datora faptului că se protejează împotriva pieței care dorește să fie în aceste Echipe-o poveste similară este adevărată pentru Anglia.

Franța, pe de altă parte, oferă o valoare bună – modelul sugerează că probabilitatea Victoriei este aproape de două ori probabilitatea asumată de casa de pariuri. Va fi greu de luat pentru orice fan al Republicii Irlanda, Dacă Franța ar continua să câștige Cupa Mondială, având în vedere că au fost eliminați din Cupa Mondială de către atacantul Franței Thierry Henry ‘s 21st-century spin on the’ hand of God ‘ goal.

deci, aici este – am pus gâtul meu pe Linie (cel puțin modelul nu) pentru a vă oferi câteva sfaturi, bazate exclusiv pe statistici (nu opinia mea):

Spania sunt favoritele turneului, dar nu poate oferi valoare pentru bani. (Cititorul mai perspicace va recunoaște acest lucru ca un pic de răspuns al unui politician: Dacă Spania câștigă, pot spune ‘ți – am spus că sunt favoriți’, în timp ce dacă pierd, pot spune ‘ți-am spus că nu sunt un pariu bun-există o probabilitate de 88,4% ca ei să nu câștige’!)

Franța pentru a câștiga este un pariu bun.

l-am convins și pe Jarowek să-mi dea un sfat:

Brazilia nu va câștiga. (De obicei rezervat și precaut).

previziunile modelului pentru ultimele etape ale turneului sunt:

QF1: Olanda vs Brazilia

QF2: Franța vs Anglia

QF3: Germania vs Argentina

QF4: Italia vs Spania

linia semifinalei:

SF1: Brazilia vs Franța

SF2: Argentina Vs Spania

final:

Brazilia Vs Spania

destul de evident într-adevăr! Ar trebui să spun că, deși reputația mea ca un statistician se bazează pe aceste sfaturi fiind destul de bun, voi fi aplauze pe Anglia mea natală, indiferent de cine opoziția. Aștept în așteptarea începerii pe 11 iunie…

Leave a Reply