3
テストサンプルのAUCが高すぎるモデルは、オーバーフィットしないモデルよりも優れています
私は、列車セットで70%の AUC、ホールドアウトテストセットで70%の AUC を実行するモデルを作成したチャレンジに参加しています。 他の参加者は、トレーニングセットでAUC を96%、ホールドアウトテストセットでAUC を76%実行するモデルを作成しました。 私の意見では、ホールドアウトセットと同じレベルで機能するため、私のモデルの方が優れています。Q:テストセットでの彼の76%は単なる偶然であり、別のホールドアウトテストセットでは彼のモデルのパフォーマンスが低下する可能性があると主張することは有効ですか?