回答:
k-NNの場合、データをと間で正規化することをお勧めします。
k-NNは、例を比較する手段としてユークリッド距離を使用します。2点間の距離を計算するにはおよび 、ここでは番目の機能の値です。
距離を計算するときにすべてのフィーチャが等しく重要であるためには、フィーチャの値の範囲が同じである必要があります。これは、正規化によってのみ達成できます。
それらが正規化されておらず、たとえば機能の値の範囲が)であるのに対し、の値の範囲は。距離を計算するとき、2番目の項は最初の項よりも倍重要であり、k-NNは最初のものよりも2番目の特徴に多く依存するようになります。正規化により、すべてのフィーチャが同じ範囲の値にマップされることが保証されます。
一方、標準化には多くの有用な特性がありますが、機能が同じ範囲にマッピングされていることを保証することはできません。標準化は他の分類器に最適ですが、これはk-NNまたは他の距離ベースの分類器には当てはまりません。