最近、特定のデータセットでk-NN分類器を使用することを提案する論文に出会いました。著者は、利用可能なすべてのデータサンプルを使用して、さまざまなk値のk分割交差検証を実行し、最適なハイパーパラメーター構成の交差検証結果を報告しました。
私の知る限り、この結果には偏りがあり、ハイパーパラメーター最適化の実行に使用されないサンプルの精度推定値を取得するために、別のテストセットを保持する必要がありました。
私は正しいですか?この相互検証の誤用について説明した参考文献(できれば研究論文)を提供してください。
3
個別のテストセットの代わりに、いわゆるネストされたクロス検証を使用できることに注意してください。このサイトでこの用語を検索すると、多くの議論が見つかります。特に、受け入れられた回答で引用された2番目の論文の著者の1人である@DikranMarsupialによる回答を探してください。
—
アメーバは、モニカを復活させる