以前に次の表現を聞いたことがあります。
「最適化は統計上のすべての悪の根源です」。
たとえば、このスレッドの一番の答えは、モデルの選択中に過度に最適化する危険性について言及しています。
私の最初の質問は次のとおりです。この引用は特定の人に起因するものですか?(例えば、統計文献など)
私が理解していることから、声明は過剰適合のリスクに言及しています。従来の知恵では、適切な相互検証はすでにこの問題と戦っていると言われていましたが、この問題にはそれ以上のものがあるようです。
統計学者とMLプラクティショナーは、厳密な相互検証プロトコル(例:100個のネストされた10倍CV)を順守している場合でも、モデルの過剰最適化に注意する必要がありますか?もしそうなら、「最高の」モデルの検索をいつ停止するかをどのようにして知るのでしょうか?