Eloレーティングシステムが間違った更新ルールを使用するのはなぜですか?


10

Eloレーティングシステムは、ペアの比較での結果の予想される確率と観測される確率の間のクロスエントロピー損失関数の勾配降下最小化アルゴリズムを使用します。一般的な損失関数は次のように書くことができます

E=n,ipiLog(qi)

ここで、合計はすべての結果およびすべての対戦相手nに対して実行されます。 p iはイベントiの観測された頻度であり、q iは予想される頻度です。inpiiqi

可能性のある結果が2つ(勝ちまたは負け)で、対戦相手が1人の場合

E=pLog(q)(1p)Log(1q)

場合はプレイヤーのランキングされたIおよびπ jはプレイヤーのランキングであるJ我々として期待確率に構築することができ 、Q I = E π 私をπiiπjjのq、J=E π J

qi=eπieπi+eπj
後、勾配降下更新ルールのtell使用
qj=eπjeπi+eπj

πi=πiη(qipi)

πj=πjη(qjpj)

qipiijtwo outcomes

抽選が存在する場合、上記のモデルを含め、確率で3番目の結果を一般化できます。

q(d)=νeπi+πj2eπi+eπj+νeπi+πj2
qi(w)=eπieπi+eπj+νeπi+πj2
qj(w)=eπjeπi+eπj+νeπi+πj2

そして、損失関数を次のように構築できます。

E=p(w)Log(q(w))(1p(w)p(d))Log(q(l))p(d)Log(q(d))

p(w),p(l),p(d)winloosedrawq(w),q(l),q(d)winloosedraw

πi=πiη(qi(w)+qi(d)2pi(w)pi(d)2)

πj=πjη(qj(w)+qj(d)2pj(w)pj(d)2)

qj(w)qj(d)ijpi(w)pi(d)ijthree outcome

問題は、two outcomesドローが存在する場合でもEloレーティングシステムが更新ルールを使用するのはなぜですか?

回答:


3

Eloシステムでは、決定的な結果を持つのではなく、抽選の確率は指定されていません。代わりに、引き分けが考慮されます-期待されるパフォーマンスと試合結果の両方-勝ち半分と負け半分。

WikipediaのEloページの例:「プレーヤーの予想スコアは、勝つ確率と引き分けの確率の半分です。したがって、予想スコア0.75は、75%の勝率、25%の負け率、0%の確率を表すことができます。もう一方の極端では、勝つ確率は50%、負ける確率は0%、描く確率は50%です。」

two outcomeRA=RA+K(SAEA)SA=1(nw+0.5nd)+0(0.5nd+nl)SA=1SA=0.5SA=0

Eloのように、Glickoシステムはドローをモデル化しませんが、勝ちと負けの平均(プレーヤーごと)として更新を行います。代わりに、TrueSkillランキングシステムでは、「ドローは特定のゲームのパフォーマンスの差が小さいと想定してモデル化されています。したがって、ドローの可能性は2人のプレーヤーのプレイ力の差にのみ依存します。ただし、ゲームの経験的調査結果チェスでは、初心者よりもプロプレーヤーの間でドローが発生する可能性が高いことを示しています。したがって、ドローのチャンスもスキルレベルに依存するようです。」

このアプローチでは、ゲームごとに異なる特定のモデリングが必要であり(TrueSkillはいくつかのMicrosoft Xboxゲームに適用されます)、EloおよびGlicko(チェス専用に設計されています)に適しています。多目的ランキングシステムであるrankadeには適していません。


「プレーヤーの予想スコアは、彼の勝つ確率に加えて、引き分けの確率の半分です。」まさに私が上の式で見つけたものです。とにかく、あなたが指摘しているように、エロ更新式ではドローの確率の半分は指定されていません。疑問は残ります、なぜEloランキングシステムではドローは気にしませんか?
emanuele 2016

1
予想スコアは常に、勝つ可能性と負ける可能性(および抽選のゼロチャンス-ウィキペディアの最初の例を参照)として表すことができます。この場合、「プレーヤーの予想スコアは、彼の勝利の確率」です(そして、ドローの確率の半分はゼロであるため、それ以上です)。単一の試合の後、結果は勝利、または敗北、または半分の勝利です。ドローが許可されているゲームがある場合でも、ドローのチャンスがないかのように、勝敗の組み合わせだけを使用してEloスコアを更新できます。
Tomaso Neri 2016
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.