進行中のTCECトーナメントに照らして、私は彼らがこれらのコンピューターの評価をどのように考え出すのかと考えていました。おそらく、2000の評価されたチェスエンジンは、人間の評価された2000に対して約0.5のスコアを期待する必要があります。これにより、チェスエンジンが実際に彼らが言っている評価とほぼ同じかどうかを簡単に確認できます。しかし、これはおそらく3250前後であると思われるkomodoのようなより高い定格のプログラムには問題があります。明らかに、このレベルでは人間はプレイしません。さらに、2800の評価されたコンピューターでさえ人間と対戦しません(magnusがコンピューターと対戦して開発者の評価を定義するのを助けることは疑わしいです)。エンジンがグランドマスターと対戦してその強さを判断するのは疑わしいことです。したがって、これらのエンジンレーティングは、はるか昔に同じような強さの対戦相手をプレイするエンジンによって決定されているのではないかと思います。最近のほとんどの評価は、エンジン対エンジンゲームによるものです。しかし、これが真実なら、エンジンの評価が人間のeloスケールと比較して正確であるとは期待できません。エンジンの定格が正確であることを確認する方法はありますか?