以下は、いくつかの非常に単純なモデルです。どちらも少なくとも1つの点で不十分ですが、おそらく構築するものを提供するでしょう。2番目のモデルは、実際にはOPのシナリオに対応していません(下記の備考を参照)が、何らかの形で役立つ場合に備えて、そのままにしておきます。
モデル1:Bradley–Terryモデルのバリアント
主に、各チームのプレーヤーに基づいて、あるチームが別のチームを倒すかどうかを予測することに関心があるとします。最終スコアを無視して、各ゲームでチーム1がプレイヤーチーム2をプレイヤーを使用してチーム2を破ったかどうかを記録するだけです。確かに、これはいくつかの情報を捨てていますが、多くの場合、これはまだ多くの情報を提供します。(k 、ℓ )(i 、j )(k 、ℓ )
モデルは
l o g i t( P(チーム1がチーム2を破る))= α私+ αj- αk- αℓ。
つまり、各プレーヤーの「親和性」パラメーターは、そのプレーヤーがチームの勝利のチャンスをどれだけ改善するかに影響します。プレイヤーの「強さ」を定義します。次に、このモデルは
P(チーム2チーム1拍)= sのI S jはs私= eα私
P(チーム1がチーム2を破った)= s私sjs私sj+ sksℓ。
予測子と一致している限り、応答がどのようにコーディングされていても問題ないという点で、非常に優れた対称性があります。つまり、
l o g i t( P(チーム2がチーム1を破る))= αk+ αℓ- α私- αj。
これはロジスティック回帰として簡単に当てはまる可能性があります。予測子は指標(各プレイヤーに1つ)であり、プレイヤーが問題のゲームのチーム1にいる場合は、チーム2にいる場合は、そうでない場合はそのゲームに参加します。i − 1 0+ 1私− 10
これにより、プレイヤーの自然なランキングも得られます。大きな(または)、大きなプレーヤーは勝利の彼女のチームのチャンスを向上させます。そのため、推定係数に従ってプレーヤーを単純にランク付けできます。(アフィニティパラメータは、共通のオフセットまでしか識別できないことに注意してください。したがって、モデルを識別可能にするためにを修正するのが一般的です。)S α 1 = 0αsα1= 0
モデル2:独立したスコアリング
NB:OPの質問を読み直したところ、以下のモデルが彼のセットアップには不十分であることが明らかです。具体的には、OPは、あるチームまたは他のチームが一定数のポイントを獲得した後に終了するゲームに興味を持っています。以下のモデルは、期間が固定されているゲームにより適しています。OPのフレームワークによりよく適合するように変更を加えることができますが、開発するには別の回答が必要になります。
次に、スコアを追跡します。各チームが互いに独立してポイントを獲得するのが合理的な近似であり、任意の間隔で独立した任意の間隔で獲得したポイントの数であると仮定します。次に、各チームのスコアのポイント数をポアソン確率変数としてモデル化できます。
したがって、特定のゲームのプレイヤーとで構成されるチームのスコアが
なるようにポアソンGLMを設定できますJのログ(μ )= γ I + γ jを私j
ログ(μ )= γ私+ γj
このモデルはチーム間の実際の対戦を無視し、純粋にスコアリングに焦点を合わせていることに注意してください。
それはありません修正ブラッドリー・テリーモデルに興味深いの接続を持っています。を定義し、得点した最初のチームが勝つ「突然死」ゲームがプレイされると仮定します。チーム1にプレイヤーあり、チーム2にプレイヤー場合、
したがって、プレーヤーの平均得点率は、モデル1の「強度」パラメーター定式化と同等です。σ私= eγ私(i 、j )(k 、ℓ )
P(チーム1はチーム2を突然死させた)= σ私σjσ私σj+ σkσℓ。
チームごとにがでチーム2をプレイする場合、各プレーヤーに「攻撃」アフィニティおよび「防衛」アフィニティを持たせることで、このモデルをより複雑にすることを検討できます。次に
と
δ I(I 、J )(K 、ℓ )ログ(μ 1)= ρ I + ρ J - δ K - δ ℓのログ(μ 2)= ρ K + ρ ℓ - δ I - δ Jρ私δ私(i 、j )(k 、ℓ )
ログ(μ1)=ρ私+ ρj−δk- δℓ
ログ(μ2) = ρk+ ρℓ−δ私−δj
このモデルではスコアリングは依然として独立していますが、各チームのプレーヤー間に相互作用があり、スコアに影響します。プレイヤーは、親和係数の推定値に従ってランク付けすることもできます。
モデル2(およびそのバリアント)では、最終スコアの予測も可能です。
拡張:両方のモデルを拡張する便利な方法の1つは、ポジティブインジケーターが「ホーム」チームに対応し、ネガティブインジケーターが「アウェイ」チームに対応する順序を組み込むことです。モデルにインターセプト用語を追加すると、「ホームフィールドの利点」として解釈できます。他の拡張機能には、モデル1に同点の可能性を組み込むことが含まれる場合があります(実際にはモデル2で既に可能性があります)。
サイドノート:アメリカンカレッジフットボールのボウルチャンピオンシップシリーズに使用されるコンピューター化されたアンケート(ピーターウルフの)の少なくとも1つは、(標準)ブラッドリーテリーモデルを使用してランキングを作成します。