いくつかのデータがあり、このデータからモデル(線形回帰モデルなど)を作成します。次のステップでは、Leave-One-Out Cross-Validation(LOOCV)をモデルに適用して、モデルのパフォーマンスを確認します。
LOOCVを正しく理解したら、このサンプル(トレーニングセット)を除くすべてのサンプルを使用して、各サンプル(テストセット)の新しいモデルを構築します。次に、モデルを使用してテストセットを予測し、エラーを計算し。
次のステップでは、選択した関数を使用して生成されたすべてのエラー(平均二乗誤差など)を集計します。これらの値を使用して、モデルの品質(または適合度)を判断できます。
質問:これらの品質値が適用されるモデルはどのモデルですか。LOOCVから生成されたメトリックが自分のケースに適している場合、どのモデルを選択する必要がありますか?LOOCVは異なるモデルを調べました(はサンプルサイズです)。どのモデルを選択する必要がありますか?
- すべてのサンプルを使用するモデルですか?このモデルは、LOOCVプロセスでは計算されませんでした!
- エラーが最も少ないモデルですか?