サッカーの試合で得点付けられたゴールの分布の「最先端」のモデルは、ディクソンとロビンソン(1998)の 2つの主要な現象を説明する「アソシエーションサッカーの試合の誕生プロセスモデル」のモデルです。
1)試合開始時よりも試合終了時に得点が増える(両チームの疲労によるものと推測される)
2)スコアリングレートは、無数のリードを持つチームや、勝利のために敗北するリスクを負うのではなくドローをプレーすることを好むチームなど、無数の理由により現在のスコアラインに依存します。
モデルは、試合でホームチームとアウェーチームが獲得したゴールが、不均一なポアソンプロセスに従うことを前提としています。ましょう示す正規化一致に経過時間の間に収まるようにと、 -lengthベクトルホームチームがゴールを得点する時間と表す -lengthベクトル示しますアウェイチームがゴールを決めた時間。一致の可能性は
ここで、は、時間でのホームチームのスコアリングレートであり、時間均一因子(ホームチームの攻撃能力とアウェイチーム防御能力、ホームアドバンテージなど)と時間不均一因子(たとえば、時間のスコアライン)の組み合わせに依存します。)。同様に。
チームがスコアラインを変更するとスコアリングレート自体がスコアラインに依存するため、2つのプロセスは依存しています。
尤度は指数による積分を数値的に行うことで簡単に評価できます。したがって、モデルのパラメーター(チーム能力、ホームアドバンテージ、時間効果、スコアラインパラメーターなど)を最尤法で計算するのは簡単です。
予測に関して、関心のある明らかな量は次のとおりです。
- :ホームチームの勝利
- :アウェイチームの勝利
- :描画
- 特定のスコアラインの確率、たとえば
- 試合の合計ゴールの確率、例えば
一連のモデルパラメーターを指定してこれらの量を(おおよそ)計算するには、モンテカルロ法を使用してこれらのプロセスに従って一致を生成し、各最終スコアの頻度を計算します。プロセスからのシミュレーションは、比較的単純です。単一のエンベロープする均一なポアソンプロセスからゴールを生成し、拒否サンプリングと組み合わせて、ホームまたはアウェイチームに配信します。
このアプローチの欠点は、明らかに、モンテカルロシミュレーションの計算負荷です。試合が行われているときにリアルタイムで予測を行うことを検討してください。同時に多くのことが発生する可能性があり、すぐに懸念の原因になります。
したがって、私の質問は、(計算を容易にするために精度を犠牲にする近似に依存している場合でも)高い計算コストなど、発生しないと考えられる代替アプローチがあるかどうかです。
明確にするために、私はすでにマルチスレッドCで記述したモンテカルロシミュレーションを効率的に実装する方法に関する(基本的な)提案を探していません。非常に高い受け入れ率を達成します。劇的なパフォーマンス向上の余地がまだあると思われる場合は、もちろん私はすべて耳を傾けていますが、根本的に異なるアプローチを探しています!