学習セットの観測値よりも多くの変数/機能がある場合、バイナリ分類に適した変数/機能の選択は何ですか?ここでの目的は、分類エラーを最適に削減する機能選択手順を説明することです。
一貫性の表記法を修正できます:場合、をグループからの観測値の学習セットとします。したがって、は学習セットのサイズです。私たちは、セット多くの特徴(特徴空間の次元をIE)であることを。ましょ表すの座標番目の。
詳細を提供できない場合は、完全な参考文献を提供してください。
編集(継続的に更新):以下の回答で提案されている手順
- 貪欲な前方選択 バイナリ分類のための変数選択手順
- バイナリ消去のための後方消去変数選択手順
- メトロポリススキャン/ MCMC バイナリ分類の変数選択手順
- ペナルティ付きロジスティック回帰 バイナリ分類の変数選択手順
これはコミュニティWikiであるため、より多くの議論と更新があります。
ある意味で、変数の順序付けは許可するが変数の選択は許可しない手順を提供します(機能の数の選択方法については非常にわかりにくいので、クロス検証を使用すると思いますか?)この方向の答えは?これはあなたが変数の数を選択する方法についての情報を追加するために、回答writterするコミュニティ必要はありませんされてウィキとして(?私はここで、この方向での質問opennedているの数を選択することが非常に高い次元でのクロス検証を(非常に高次元の分類で使用される変数))