2
相互検証によるKNNパラメーター調整:スコア描画
バイナリ分類にKNNメソッドを使用しようとしています。最良の 'k'パラメーター(アルゴリズムが調べる近傍の量)を見つけようとするとき、トレーニングセットでモデルをトレーニングし、データで取得した別の検証セットでその精度を調べます。この検証セットには12個のサンプルしかないため、3 k(1,3,5)の精度が引き込まれます。 今、私はこれらの3 kの1つを決定的なモデルに選択する方法を探しています。私は次のアプローチを念頭に置いていました。3kの場合、トレーニングセットの特定のKに対してK分割交差検証を行い、ここで平均精度が最も高いものを探します。これはまともなアプローチですか、それとももっと良い選択肢がありますか?また、ランダムなk(1、3、または5)を選択することも考えました。これは、「検証手順」で3のいずれかを選択できることが示されているためです。