単純な回帰モデルがあります(y = param1 * x1 + param2 * x2)。モデルをデータに適合させると、2つの優れたソリューションが見つかります。
ソリューションA、params =(2,7)は、RMSE = 2.5のトレーニングセットで最適です
だが!ソリューションB params =(24,20)は、交差検証を行うと、検証セットで大きな成果を上げます。
ソリューションAは悪いソリューションに囲まれています。したがって、ソリューションAを使用する場合、モデルはデータの変動に対してより敏感になります。
ソリューションBはOKソリューションで囲まれているため、データの変更に対する感度が低くなります。
これは私が考案したばかりの新しい理論ですか、良い隣人とのソリューションはあまり適合していませんか?:))
ソリューションAよりもソリューションBを優先するのに役立つ一般的な最適化方法はありますか?
助けて!