統計とビッグデータ overfitting

テストサンプルのAUCが高すぎるモデルは、オーバーフィットしないモデルよりも優れています

私は、列車セットで70％の AUC、ホールドアウトテストセットで70％の AUC を実行するモデルを作成したチャレンジに参加しています。他の参加者は、トレーニングセットでAUC を96％、ホールドアウトテストセットでAUC を76％実行するモデルを作成しました。私の意見では、ホールドアウトセットと同じレベルで機能するため、私のモデルの方が優れています。Q：テストセットでの彼の76％は単なる偶然であり、別のホールドアウトテストセットでは彼のモデルのパフォーマンスが低下する可能性があると主張することは有効ですか？

7 validation overfitting model-comparison auc train

タグ付けされた質問 「overfitting」

タグ付けされた質問「overfitting」