サッカーの結果を予測する科学

サッカーの結果を予測することは、学術的関心の急速に成長している分野である。 経済学者は賭け市場の効率を評価するためにモデルを使用し、運用研究者はトーナメントデザインの様々な効果を実験するためにモデルを使用し、統計学者はサッカーデータの複雑さをモデル化することにより、高度な統計技術に精通していることを披露します。

もちろん、サッカーのスコアのアーカイブを採掘しているのは学者だけではありません。 ブックメーカーは、サッカーの予測モデルを生き、呼吸します-より献身的なflutterersがそうであるように。 小さな利点を見つけることは大きな報酬を運ぶことができますしながら、ミスは、お金と仕事がかかります。

ベッティング市場

学界では、サッカー予測モデルの最も一般的なアプリケーションは、ベッティング市場の効率性をテストすることです。 効率的な市場仮説(EMH)は、金融理論の礎石であり、その最も単純な形で、投資家は一貫して平均以上のリターンを得ることができないはずであると述べてい 平均よりも良い、あるいは肯定的なリターンを生成することができますサッカーの予測モデルを見つけることは、通常、EMHの違反の例として、学術のための出版物になりますが、モデルの独自の性質は、出版されたものはめったに(これまでにもかかわらず)非常に最高のモデルを表し、さらにはあまり頻繁に一貫して肯定的なリターンを生成しないことを意味します。

最高のパフォーマンスモデルは、ギャンブル業界の予備です。 ブックメーカーにとっては、勝利、引き分け、または失われた試合の確率を現実的に表す値でオッズを設定することが最も重要です。 ブックメーカーがこれを行うことができない場合、それは巨額の損失を危険にさらします。

例えば、アジアのブックメーカーは、US2 200,000の個々の賭けを取ることは何も考えず、定期的にbets400,000の賭けを受け、イングランドプレミアリーグの典型的な週末は、通常、アジ このような現金の潮流が賭けられているため、ブックメーカーが可能なすべてのツールを自由に使用することは驚くべきことではありません。

数学モデルは通常、オッズを設定するために単独では使用されません。 余分な情報を与えられたモデル生成オッズを調整するために、専門家のオッズ設定器を使用します。 たとえば、典型的なモデルでは、チームの最近の結果とリーグ内の各チームの位置のみを考慮に入れることができます。 オッズセッターは、これらの予測オッズを調整して、たとえばスタープレイヤーの怪我を説明します。

市場の反対側には、ベッターがいます。 専門企業は、どのような賭けをするかを顧客に助言するサービスを提供しています。 Maciej Jarowekはのための賭けのコンサルタントであるAsianConnect88.com、ベッティングブローカー。 私は、業界での数学の使用についての彼の考えを彼に尋ねました。 ブックメーカーがそうであるように、彼は彼に出発点を与えるためにモデルを使用し、彼が合うようにオッズを調整します。

Jarowekはポーランドのサッカーの専門家であり、彼は彼のオッズとブックメーカーのオッズとの間に矛盾を見つけたとき、彼は不一致が賭けをすることを助言す 彼は、プロのギャンブラーがブックメーカーに比べて持っている最大の利点は、彼らがすべての試合に賭ける必要がないということです-彼らは選んで選 Jarowekはのために働く多くのプロのギャンブラーの一つであることを考えるとAsianConnect88.comそのような機関が多数運営されていることから、市場を打ち負かすためのかなりの範囲があるようです。

他のスポーツと比較して、サッカーの試合の結果を予測することは比較的困難です。 一部の学者は、これはサッカーの人気の源の一つであると信じています-それはゲームを見てエキサイティングな命題を作って起こった前に、ファンは本当に試合の結果を知っていることはありません。

専門家は、この結果の不確実性に基づいてキャリアを作り、試合で可能なすべてのイベントを熟考する無限の時間を費やします。 国内のサッカーには毎週末に無数の混乱があり、ワールドカップは巨大な殺害の公正なシェアを投げます。 この固有の予測不可能性を考えると、どのように予測を行うことができますか?

サッカーの試合結果をモデル化するには、二つの広いアプローチがあります。 まず、結果を直接予測することができます-結果が勝利、引き分け、または損失になるかどうか。 この場合、結果(勝利、損失、引き分け)は序数変数です(勝利は損失よりも優れた引き分けよりも優れています)。 ここで選択するモデルは、順序付けられたプロビットのような順序回帰モデルです。 このようなモデルからの出力は、各結果の確率であるため、次の試合では、このモデルを使用して勝利、引き分け、または損失の確率を計算できます。

試合結果をモデル化するための第二のアプローチは、アナリストがゲームの正確なスコアをモデル化する間接的な方法です。 この場合、アナリストは、各チームによって得点された可能なゴール数の確率を推定します。 次に、関連する正確なスコア確率を合計することによって、チームが試合に勝つ、引き分けまたは負けた確率を推測することができます。

順序付けされたプロビット

の証拠は、一致結果のモデリングにおける各アプローチのパフォーマンスにほとんど差がないことを示唆しています。 ここでは、最初のタイプのモデル、つまり’ordered probit’モデルを構築します。

順序付けされたプロビットモデルは、一致の3つの結果の確率を推定するために使用できます。 これを行うには、各チームの情報を使用します。 たとえば、最後の3試合に勝ったチームは、最後の3試合に負けたチームよりも次の試合に勝つ確率が高いことは合理的です。 同様に、対戦相手よりも上位にランクされているチームは、下位にランクされているチームよりも試合に勝つ確率が高くなります。 これらの情報のナゲットがモデルパラメータによって支配されると、勝利確率の変化の量が決まります。 統計モデルでは、パラメータは、過去に何が起こったのかを最もよく説明するために推定されます。

ここでの私のモデルは、八年間の約9,000の国際試合結果に基づいています。 チームが試合に勝利する確率に与える情報と影響は次のとおりです:

  • 会場-ホーム/アウェイまたはニュートラル。
  • 首都からゲームの場所までの距離。
  • チーム間の世界ランキングの差。 より高いランクのチームが勝つ可能性が高くなります;
  • 過去12ヶ月間の各チームの世界ランキングの変化。
  • 試合の種類、すなわち、メジャートーナメント(ワールドカップまたは連盟選手権)、マイナートーナメント(他のFIFA公認トーナメント)、予選または親善試合。
  • 過去の試合結果。 各試合について、私は各チームの前の八つの結果を使用します(平均して代表チームは12ヶ月の期間に八つの試合を果たしています)。 結果に加えて、私は試合の時に八つの反対チームのそれぞれの世界ランキングを知っています。

過去の結果の情報を使用するには、少し余分な考えが必要です。 1-0で200位のチームと4位のチームの勝利は、それぞれ200位と198位のチームよりも優れたパフォーマンスを示しています。 結果として、過去の結果は、結果と反対の強さに対して相対的に重み付けされるべきである。 この関係をキャプチャする過去のパフォーマンス指標(ppm)は、このページの上部(左)の式で与えられます。

このppmは’-1’から’1’になり、’-1’は最悪の結果を表し、トップランクのチームが最下位のチームに負け、’1’は最悪のチームが最高ランクのチームを破ったことを表します。 204は、検討中の期間中の任意のチームのランキングの最大値であることに注意してください。 過去のパフォーマンス指標は、このページの上部(右)にプロットされています。

(Sshhh-ワールドカップの勝者を予測します)

上記の順序付けされたプロビットモデルを使用して、1試合の各結果(勝利/引き分け/損失)の確率を推定できます。 ブックメーカーはこれらの確率を使用してオッズセッターに知らせることができますが、ベッターはそれらを使用して賭けを行うべきかどうかを評価することができます。

2010年のワールドカップの勝者を予測するためには、一連の試合の勝者を予測する必要があります。 これを行うために、私はシミュレーションを使用し、試合結果の適合モデルを使用してトーナメント全体をシミュレートするコードを記述しました。 ワールドカップは、四つのチームの八つのミニリーグ(グループ)で始まり、一度にお互いを再生します。 各グループの第一位と第二位のチームは、ノックアウトステージに進みます。 このトーナメントの構造は、チームの勝利の確率に影響します。

例えば、次のワールドカップでは、グループGから進む可能性が最も高いチームはブラジルとポルトガルです。 グループHで優勝する可能性が最も高いチームはスペインです。 グループHの勝者(準優勝)は、最初のノックアウトラウンドでグループGの準優勝(優勝)を満たします。 したがって、スペインはほとんど最初のノックアウトラウンドで困難な試合を保証されています。 これをグループAのお気に入りと比較すると、フランスはグループBの次点に直面する可能性が最も高いグループBのお気に入りであるアルゼンチンは、グループ内の他のチームよりもはるかに強いため、フランス(およびアルゼンチン)はスペイン、ブラジル、ポルトガルよりも最初のノックアウトステージでは難しい試合が少ない可能性が高い。

トーナメント全体の勝者を予測することは、最高のチームを選ぶだけのケースではないことは明らかです。 一つは、アカウントにトーナメント構造の効果を取る必要があります。 100,000シミュレートされたトーナメントの結果は、左の表に示されています。

彼らの一見困難な引き分けにもかかわらず、スペインとブラジルはまだ勝利数の面で第一と第二です。 勝利の数は、テーブルの第三の列(左)に示されている各チームのトーナメントに勝つ予測確率に簡単に変換することができます。

予測された勝利確率をFIFA世界ランキングと比較するのは興味深いことです。 フランスは上向きの大きな動きです-おそらく彼らの簡単なドローのために、ポルトガルは世界で三位のチームであるにもかかわらず、第九のお気に入りに

このようなモデルの最も頻繁な使用は、ブックメーカーのものと確率を比較することであることを考えると、テーブルの第五と第六の列は、私が私の予測を行った日(14May2010)のように、Bet365からのオッズと暗黙の確率を与える。 私は類似点を見たとき、私は喜んでいた、認めざるを得ない-それはモデルとシミュレーションの練習が賢明な結果を与えることを確認します。 しかし、精密検査は、いくつかの矛盾を明らかにする。 免責事項時間:私はあなたが賭けをするためにこれらのオッズを使用することをお勧めしませんのでご注意ください。 ブックメーカーは本当に彼らが何をしているかを知っているし、私は彼らのオッズを通知するために使用しているはるかに多くの情報を組み込む-彼らはまた、私はこの種のことを行うために午前よりもはるかに多くを支払われています!

ブックメーカーは、スペインとブラジルが私よりも勝つ可能性が高いと考えているようで、これらは実際には(これらのオッズで)戻ってくる良いチームではないことを示唆している。 これは、彼らがこれらのチームに熱心である市場に対して自分自身を保護しているためかもしれません-同様の話はイングランドにも当てはまります。

一方、フランスは良い価値を提供しています-このモデルは、勝利の確率がブックメーカーが想定している確率のほぼ倍であることを示唆しています。 フランスがワールドカップに勝つために行くならば、彼らはフランスのfwティエリー-ヘンリーの21世紀のスピンによって”神の手”のゴールでワールドカップからノックアウトされたことを考えると、アイルランドのファンのために取るのは難しいでしょう。

だからここにある-私は純粋に統計(私の意見ではない)に基づいて、あなたにいくつかのヒントを与えるために(少なくともモデルは)ラインに私の首を置く:

スペインはトーナメントのお気に入りですが、お金の価値を提供していないかもしれません。 (より鋭い読者は政治家の答えのビットとしてこれを認識します:スペインが勝った場合、私は”私は彼らがお気に入りだったあなたに言った”と言うこ)

フランスが勝つのは良い賭けです。

私はまた、私にヒントを与えるためにJarowekを説得しました:

ブラジルは勝てない。 (通常は予約され、慎重です)。

qf1:オランダvsブラジル

Qf2:フランスvsイングランド

Qf3:ドイツvsアルゼンチン

Qf4:イタリアvsスペイン

準決勝進出:

SF1:ブラジルvsフランス

sf2:アルゼンチンvsスペイン

決勝:

ブラジルvsスペイン

かなり明白! 私は、統計学者としての私の評判は、これらのヒントが合理的に良いことにかかっていますが、私は反対に関係なく、私の母国イギリスを応援します。 11月のキックオフを期待して待っています。..

Leave a Reply