FIDEがまだEloを使用しているのはなぜですか?


11

Glickoの評価システムの仕組みには感心しました。特に:

  • 最近プレイしたゲームが増えると、評価が安定します
  • 最近プレイしたゲームの数が少ないと、最近のゲームをいくつか手に入れるまで、レーティングが変動します

USCFはシステムを数年前に同様に変更し(特定の試合のレーティング変更を増幅または抑制するスライドスケールがあり)、Glickman(Glickoの発明者)がUSCFのレーティングボードに参加しました。最終的には彼のシステムのように、さらに柔軟なシステムを採用すると思います。

FIDEがより正確な評価システムを採用しない理由はありますか(変更に抵抗している、または彼らがまだそれに慣れていないだけです)?

回答:


9

Glickoがより正確であることは証明されていません。Glickoは、別の方法で、別の方法で問題を解決します。これらすべてのシステムが人間の心を4桁の数字に抽象化することを考慮してください。

レーティングには多くの政治があります。それは微妙な問題です。FIDEがそれを採用した場合、彼らは新しいトップ100リストを作成し、多くのGMはおそらく動揺するでしょう。

ELOシステムは非常に理解しやすいです。透明性が重要です。より複雑なシステムには差し迫った欠点があります。


6
+1、私は最初の段落に同意しませんが、残りの部分は十分に真実です。1)Glickoは平均してより正確であることが証明されています(特定の試合で誰が勝つかを予測できる頻度で測定されます)。2)人間の心を数に抽象化することについては、これは実際には当てはまりません。これはスキルの尺度であり、スキルレベルを比較するときに確率(勝ち/引き/負け)を計算できます。それはすべて数学と統計に支えられています。Glicko-2では、不安定なプレーをする(評価がさらに変動する)ために、ボラティリティの新しい要素さえあります。
イブフリーマン

1
面白い。ただし、「平均してより良い」が必ずしも「より良い」とは限らないと私は断言します。より正確ではない時代が実際に害を及ぼす場合はどうなりますか?しかし、私はそれについて読んでいきます。
トニー・エニス



7

私が理解している限り、Glickoレーティングシステムは、レーティング番号に信頼性スコアを追加します。これにより、レーティングスコアの調整計算に関してより高い公平性が提供される場合があります。明らかにこれは、評価されたゲームのプレイと結果としてのプレイの強さとの間に相関関係があるという誤った仮定につながる可能性があります(プレイしないと信頼性スコアが低下し、その結果、何らかの方法で評価数の評価が下がるからです)。信頼性スコアに関連する問題がたくさんありますが、私はシステムの微妙さについての専門家ではないことを認めざるを得ません。3つ選ぶだけです。

  • まれに評価されたゲームのみをプレイしているプレイヤーは、もう招待を受けられない可能性があります。あなたが魅力的なプレーヤーを招待するトーナメントディレクターであると想像してください。次に、10人のプレーヤーを選択する必要があります。これらのプレーヤーはすべて同じ評価番号ですが、信頼性の数値が異なります。おそらく、最初に信頼性の数値が最も高いものを選択します。時間が経つにつれて、評価されたゲームの数が少ないプレーヤーと少ないプレーヤーの間の信頼性のギャップが広がる可能性があります。
  • 評価番号の操作が簡単になる場合があります。一部の人々は、不正なトーナメントでプレーすることによって評価やIM / GMの規範を得たので、ELOシステムでさえチートセーフではありません。信頼性スコアが高いと、信頼性スコアのないプレーヤーを非常に安くすることができます。優れたプレーヤーは、自分自身を失うことなく評価ポイントを与えます。お金が関わるとすぐに、チートセーフであることは重要な問題です。Glickoの評価システムは操作しやすいと感じています。
  • 大衆にとって、プレーの強さについてのコミュニケーションと理解はさらに難しくなるかもしれません。ランキングリストを伝達すると、問題が発生します。格付けが2000-50のプレーヤーは、1900から2100の間の「本当のプレーの強さ」を持っています。別のプレーヤーは1950-2000を持っています。これは、1750から2150の範囲の数値に変換されます。したがって、1950-2000のプレーヤー実際にはより優れたプレイヤーかもしれませんが、おそらく他のプレイヤーよりもランクが低くなるでしょう。公平性を実際に保証することなく、ランキングシステムの説明をより困難にします。再生を停止したGMは、「潜在的な強さ」を獲得し、彼の世界チャンピオンの潜在能力を誇る可能性があります。これは、彼の信頼性の数値により、逸脱の余地が増えるためです(注意:

要約すると、パッケージ全体が改善されているだけではないので、あなたが交渉した以上のものを得るかもしれません。また、ランキングリストの上端を見ると金銭的な問題が多いため、既存のシステムを変更するメリットはわかりません。


ほとんどのランキングリストでは、信頼性スコア(RD)を使用してプレーヤーをランク付けしようとするのではなく、カットオフがあります。したがって、2000(50)は常に1950(100)よりも高いランクになります。彼らの現在の評価によれば、信頼性に関係なく、それらはより高い評価です。1950年(100)のプレイヤーが2000年(50)に勝った場合、その格付けは1950年(50)の場合よりも大幅に増加します。Glickoを使用してシステムをだます方法を詳しく説明できますか?RDが高い場合に評価をサンドバギングすることについて話しているのですか?
イブフリーマン

@West Freeman:これは評価システムの相対的なチート傾向を証明するのに最適な場所ではないかと思います。私は推測しているだけです。私にとっては、システムを操作する方が安く見えるからです。評価されていないプレーヤーに対して故意に負けたときの自分。私の回答のより重要な点は、システムを計算の公平性だけでなく、動作中のシステムを破棄する前に、チート傾向やコミュニケーション可能性などについてチェックする必要があるということです。
レイ

しかし、人工的に誰かの評価を上げることは彼らをどのように助けますか?通常、システムをゲームしようとする人々は、低いセクションでプレイして1等賞を獲得できるように、レーティングを下げようとしています。これは、Glickoを使用すると、長期間プレイするのを避け、勝ったはずのゲームをいくつか失うと、より簡単になる場合があります。しかし、評価フロアと組み合わせると、RDが戻るのに時間がかかるため、これはたまにしか実行できないという事実です。
イブフリーマン

1
タイトルを獲得したり、招待を受けたり、クラブでプレーしたり、トレーナーとして働いたりするためにクラブから支払いを受けるには、高い評価が必要になる場合があります。私はここでプロのチェスと本当のお金がどこにあるかについて話しています。あなたはFIDEの行動に疑問を投げかけたからです。
Ray
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.