私はおそらく以前に100回解決された問題を扱っていますが、どこで答えを見つけることができるかわかりません。
ロジスティック回帰を使用するとき、多くの特徴与えられ、バイナリのカテゴリ値を予測しようとすると、よく予測する特徴のサブセットを選択することに興味があります。 y y
投げ縄に似た使用可能な手順はありますか?(線形回帰に使用されるなげなわを見ただけです。)
適合モデルの係数を見て、さまざまな特徴の重要性を示していますか?
編集-いくつかの回答を見た後の説明:
当てはめられた係数の大きさについて言及するときは、正規化された(平均0および分散1)特徴に当てはめられたものを意味します。そうでない場合、@ probabilityislogicが指摘したように、1000xはxよりも重要度が低いように見えます。
(@Davideが提供していたように)最良のkサブセットを単に見つけることに興味はありませんが、さまざまな機能の相互の重要性を比較検討しています。たとえば、1つの機能は「年齢」で、もう1つの機能は「年齢> 30」です。それらの段階的な重要性は小さいかもしれませんが、両方とも重要かもしれません。