プレーヤーのセットがあります。彼らはお互いに対戦します(ペアワイズ)。プレイヤーのペアはランダムに選択されます。どのゲームでも、あるプレイヤーが勝ち、別のプレイヤーが負けます。プレイヤーは互いに限られた数のゲームをプレイします(一部のプレイヤーはより多くのゲームをプレイし、一部はより少ないゲームをプレイします)。そのため、データがあります(誰が誰に対して何回勝ちますか)。今、私はすべてのプレイヤーが勝利の確率を決定するランキングを持っていると仮定します。
この仮定が実際に真実かどうかを確認したい。もちろん、EloレーティングシステムまたはPageRankアルゴリズムを使用して、すべてのプレーヤーのレーティングを計算できます。しかし、評価を計算することによって、それら(評価)が実際に存在すること、またはそれらが何を意味するかを証明しません。
言い換えれば、私はプレイヤーが異なる強さを持っていることを証明する(またはチェックする)方法を持ちたいです。どうすればできますか?
追加されました
具体的には、8人のプレイヤーと18のゲームしかありません。そのため、互いに対戦しなかったプレイヤーのペアがたくさんあり、お互いに一度だけプレイしたペアがたくさんあります。結果として、私は与えられたプレーヤーのペアの勝利の確率を推定できません。たとえば、6ゲームで6回勝ったプレーヤーがいることもわかります。しかし、それは単なる偶然かもしれません。