ゲームでのプレーヤーのパフォーマンスを自動的に評価する方法は？

8

完成したゲームがあるとします。プレイヤーのEloレーティングはありません。私の目的は、プレーヤーの動きのみに基づいて、ゲームでのプレーヤーのパフォーマンスを評価することです。これはチェスプログラムを使用して自動的に行うことができますか？

結果は、彼のおおよそのEloレーティング、または彼の強さやエラー率を示す単なる値になります。

それが役立つ場合、プレーヤーのゲームのデータベースを与えることができます。繰り返しますが、Eloレーティングはありません。

私の動機は簡単です。私はインターネットでチェスをプレイし、サイトの評価ではなく、ゲーム自体に基づいて自分の進行状況を自動的に追跡したいと考えています。私は（上）初級レベルです。

簡単な解決策は、任意のコンピューターエンジンとトラック番号？！、？を使用してゲームに注釈を付けることです。そして?? マーク。しかし、それはあまり正確ではないので、もっとアイデアを得たいです:)

単一のゲームに基づく評価には、非常に大きな誤差が伴います。あなたの「進行状況」は絶えず上下しているので、この方法で非常に長期間の「進行状況」（基本的にはゲームの平均に帰着する）以外の何かを追跡できるとは思えません。チェスの評価（または他のほぼすべてのスポーツでの評価）はこの問題を回避し、オンラインの評価をあなたの強さの指標として使用することに問題はないと思います。

— user1583209 2018

16

十分な数のゲームをプレイしている場合、レーティングはあなたの本当のプレーの強さを非常に正確に反映するので、遅い時間のコントロール でのサイトレーティングは、強いプレーヤーが集まるサーバー（ICC、FICSなど）で非常に信頼できる可能性があります。USCFやFIDE / ELOなどの非常に標準化された評価システムの場合、さまざまな評価クラスが、プレーヤーがまだ犯しているミスのタイプを指し示す傾向があることに気付くでしょう。NMダンハイスマンの改良チェスシンカーは、格付けクラス全体でプレーヤーが発生するエラーの種類について議論する優れた仕事をします。

たくさんのセルフテストの本を試しましたか？Igor Khmelnitskyのチェス評価試験とDanny Kopecのテスト、評価、改善チェスは、段階的なテストポジションに対するパフォーマンスを確認することで、進捗状況を追跡できる優れた書籍です。

あなたのcompare-my-moves-with-an-engineアプローチはこれを行う別の方法ですが、もう一度?? /？動きは実際には戦術的なエラーを示しているだけであり、戦略的または位置的、さらには行動または時間管理のミスを示している可能性もあります。

だからこそ、時間制御が遅いOTB /オンラインゲームを同等以上に強い反対に対抗してプレイし、より強力なプレイヤーによるレビューと批評を得ることが、改善するための効率的な方法です。すべてのカテゴリ（戦術、知識、思考プロセス、時間管理など）での間違いが強調表示され、自分がやめた間違いに関する進捗状況を簡単に測定できます。

自宅でエンジンを使って試すことができる1つの楽しいバリエーションですが、評価グラフを介してプレーヤーの品質/パフォーマンスを視覚的に観察するようにエンジン評価方法を拡張してみませんか？言い換えれば、移動ごとのエンジン評価スコアを取得し、移動にわたってそれらをプロットします（SCIDなどの一部のフリーソフトウェアがこれを行います）。

例：2ランクの初心者は、次のようなゲームになります。

ここに画像の説明を入力してください

これらがギザギザになっていることに注目してください。双方は多くのひどい間違い（スパイクの斜面！）をし、また他の人のひどい間違いを悪用する失敗の頻度も。

スパイクは常に見て楽しいです：ここに画像の説明を入力してください

2人の中間（USCF 1400-1600）プレーヤーは、次のようなゲームを持っている可能性があります。ここに画像の説明を入力してください

ギザギザに見えますが、y軸（エンジン評価）の方がはるかに小さいことに注意してください...これらのプレーヤーは初心者よりも熟練しており、高品質のチェスをプレイしていることを示しています。

最後の比較として、1911年のグランドマスターゲームは次のようになります。

ここに画像の説明を入力してください

ここにコメントは必要ありません:)これらの人たちは本当に多くの間違いをしませんよね？

評価グラフのスロープ+スケールをプレーヤーのスキル/パフォーマンスにマッピングするための独自のヒューリスティックを考案できる場合、おそらくこれは1つの方法ですか？:)

— Shivsky
ソース

2

エンジンの評価スコアは微妙な位置ではそれほど信頼できず、材料を多く必要とするフレーバーは、Gambitのタイプオープンを人間とはまったく異なるものと見なすことに注意してください。ゲームを進めている間、エンジンをハーフムーブの位置に設定する時間も、状況に少し影響します。警告してください！:)

— shivsky 2013年

これらのグラフを生成するためにどのプログラムを使用していますか？scid + stockfishを使用しましたが、このオプションはありますか？

— Uri

6

プレーヤーの品質を非常に正確にランク付けするには、www.chess-db.comが提供する優れたツールを使用できます。それはあなたがあなたのゲームをアップロードすることを可能にし、そして数分後にそれは強力なエンジンの最高の動きと比較してパーセンテージで両方のプレーヤーの品質を出力します。

これは、PGNファイルをアップロードするページです。http： //chess-db.com/public/game_upload.jsp

そして、これは結果の例です：http : //chess-db.com/public/game.jsp?id=Pablo%20Bento.Shredder%20Android.107755008

— user1657
ソース

2

あなたが求めていることは私の知識では存在しません。しかし、これは私の考えです：

次の機能を備えたサンプルが必要です。（1）チェスの位置、（2）その位置で行われた移動、（3）移動を行ったプレーヤーの評価。

10億個のサンプルがあるとします。これらのサンプルでコンピューターアルゴリズムをトレーニングできます。これらのサンプルは、評価における移動の質のある位置での各移動を予測できます。すべての動きのすべての評価を平均化して、プレーヤーのおおよその評価を取得し、実際にゲームの品質を得ることができます。

これは、さらに洗練された大まかなアイデアです。

— ラフィエク
ソース

これは実際には機能しません。ほとんどのゲームでは、データベースにない位置に比較的すばやくアクセスします。そうです、何十億ものゲームデータベースにアクセスできたとしてもです。また、対戦相手のプレーが弱い場合は罰せられます。1.e4e5 2.Qh5の後で、ブラックのプレーに関係なく、平均レーティングは低くなります。なぜなら、そのオープニングは、高いレベルよりも低いレベルでより多くプレーされるためです。（一体、1 ... e5自体の平均評価はおそらくかなり低くなっています。）既知のオープニングの後に何が起こるかは、プレイヤーが理論に従っている時間よりも、プレイヤーの強さを示しています。

— DM

AlphaZeroの5年前に私はこの答えを出しました。これで、AlphaZeroにゲームに注釈を付けて、どれだけうまくやっているかを教えてもらうことができます。私たちはおそらく、その動きがなぜ良いか悪いかについてさえ尋ねることができる時点に近いでしょう。それはあなたが本当に改善する必要があるものです。現在の人間の評価は過大評価されています。

— Rafiek、2018年

2

chess.com CAPS。chess.com（サブスクリプションが必要）のCAPSスコアを、このグラフィックにある表と比較してください：https ://www.chess.com/article/view/better-than-ratings-chess-com-s-new-caps -システム。また興味深い：https : //www.chess.com/article/view/who-was-the-best-world-chess-champion-in-history

注意事項：特定のゲームのキャップスコアは変動します。ゲームのバッチ全体でCAPSスコアの平均を作成するのが最適です。今のところ、私の知る限り、CAPSは拡張により、一連の動きからEloレーティングを予測できます。もう1つの注意：CAPSスコアは、時間制御に関係なく、孤立して存在します。私は1分間の弾丸ゲームよりも遅いタイムコントロールでより良いチェスをプレイします。CAPSはこのプレイの強さの違いを確認し、弾丸ゲームに低い評価を割り当てます。これは、私が遅い時間制御ゲームをプレイしたのと同じ人物ではないという意味ではありません！

— JWILD
ソース

0

測定するパラメータに関するいくつかのアイデアを次に示します。ゲームごとの失敗の数。10移動、15移動、20移動した後、どれくらいの頻度で同等またはより良い位置にいるか。対戦相手の失敗をうまく使う頻度。客観的に描かれたエンドゲームをどれくらいの頻度で描くか勝つか。強制嵌合の組み合わせを見つけることができる頻度。客観的に失われたエンドゲームをどれだけ頻繁に防御できたか。時間どおりに失う頻度。

— ラウアンサギット
ソース