可変重要度ランキングは何に役立ちますか?


25

さまざまな重要度のランキング(すべての種類の多変量モデルのコンテキスト)に関しては、私はややニヒリストになりました。

多くの場合、作業の過程で、他のチームが可変重要度ランキングを作成するのを支援するか、自分の作業から可変重要度ランキングを作成するように依頼されます。これらのリクエストに応えて、私は次の質問をします

この変数の重要度ランキングは何にしたいですか?それから何を学びたいですか?それを使用してどのような決定をしたいですか?

私が受け取る答えはほとんどの場合、2つのカテゴリーのいずれかに分類されます。

  • 応答を予測する上で、モデル内のさまざまな変数の重要性を知りたいと思います。
  • 重要度の低い変数を削除して、機能の選択に使用したいと思います。

最初の応答はトートロジーです(変数の重要度ランキングが必要なため、変数の重要度ランキングが必要です)。多変量モデルの出力を使用する場合、これらのランキングは心理的なニーズを満たすと仮定する必要があります。変数「重要度」を個別にランク付けすると、問題のモデルの多次元の性質が暗黙的に拒否されるように見えるため、これを理解するのは困難です。

2番目の応答は、基本的に後方選択の非公式バージョンに還元され、その統計的な罪はCrossValidatedの他の部分で十分に文書化されています。

また、重要度ランキングの不明確な性質と格闘しています。ランキングがどのような基礎概念を測定すべきかについてはほとんど合意がないようで、非常にアドホックな風味を与えています。重要度スコアまたはランキングを割り当てるには多くの方法があり、一般に欠点と注意事項があります。

  • ランダムフォレストおよびgbmsの重要度ランキングのように、アルゴリズムに大きく依存する場合があります。
  • それらは非常に大きな分散を持ち、基礎となるデータへの摂動で劇的に変化します。
  • それらは、入力予測子の相関の影響を大きく受ける可能性があります。

だから、私の質問は、変数重要度ランキングの統計的に有効な使用法は何ですか、またはそのような欲望の無益さに対する説得力のある議論(統計学者または素人に対する)は何ですか?私は、一般的な理論的議論とケーススタディの両方に興味があります。


1
(重要な手順からの)変数重要度を使用して弱い予測変数を除外することは、ひどい考えのようには見えません。これが悪いと思う理由を明確にできますか?
dsaxton

3
一般的に、多くの統計的プロセスは「重要な」予測因子に支配されておらず、多くの小さな効果の蓄積があると思うと思います。たとえば、リッジ回帰の力は、この構造を明示的に認めることで説明できます。別の言い方をすれば、「弱い予測子」の概念でアプリオリに信じるべき理由は何ですか、そしてなぜそれらを除外する必要がありますか?そして、なぜそのような非公式な手順を使用して、glmnet利用できるのにそうするのでしょうか?
マシュードゥルーリー

2
私たちが専門家ではない分野では、何が心配なのかを知りたいです!多くのビジネスおよび管理の本は、あなたが重要な問題を特定し、それらに焦点を合わせていることを長々と説明することに関するようです(はい)。ここでの誤解は、通常、重要性を定量化する方法があり、それを行う方法を知り、それがいかに難しいかを心配しない統計的な人々の仕事であると仮定して、統計的でない人々から始まると思います。あまり一般的でない方法はわかりませんが、ここでの議論のいくつかはあなたの質問の重要なポイントを見逃しているようです。
ニックコックス

回答:


8

この質問が主張するように、変数の重要性は滑りやすい概念であると主張しました。質問に答えるトートロジー的な最初のタイプの応答と、@ DexGrovesが指摘しているように、因果関係の観点から変数の重要性の結果を解釈する人々の非現実的な希望は、少し詳しく説明する必要はありません。

ただし、後方選択を使用する人にとっては、フランクハレルでさえも、モデリング戦略の一部として許可しています。彼のRegression Modeling Strategies第2版​​の97ページから(同様の声明は関連するコースノートの 131ページにあります):

  1. 精度よりも節約が重要な場合は、限定的な後方ステップダウン変数選択を行います。

ただし、後方選択のこの限られた潜在的な使用は、最終モデルの前の最後のステップ(ステップ14)であるステップ13です。重要な最初のステップの後によく来ます:

  1. 予測値の幅広い分布を使用して、できるだけ正確な関連データを収集します...
  2. 関連する候補予測子と可能な相互作用の特定につながる良い仮説を策定する...

私の経験では、人々は多くの場合、ステップ2をバイパスし、主題知識のインテリジェントなアプリケーションを自動化された手順に置き換えたいと考えています。これにより、変数の重要性に重点が置かれる場合があります。

ハレルのステップ14の完全なモデルの後に、検証と調整の5つのステップが続き、最後のステップがあります。

  1. 希望する精度でモデルを近似することにより、完全なモデルの単純化を開発します。

他の回答が指摘しているように、モデリング結果の実用化には、実行可能性、コスト、シンプルさの問題があります。たとえば、予後を改善するが、1テストあたり10万ドルかかる新しい癌バイオマーカーを開発した場合、保険会社または政府に、目を見張るほど有用でない限り、テストの費用を納得させることは難しいかもしれません。そのため、誰かが「最も重要な」変数に焦点を合わせたり、正確なモデルを多少正確ではないが実装が簡単または安価なものに単純化したりすることは不合理ではありません。

しかし、この変数の選択とモデルの単純化は特定の目的のためである必要があり、私はそれが困難が生じる場所だと思います。この問題は、正しく分類された症例の割合のみに基づいて分類スキームを評価することに似ています。分類エラーが異なるとコストが異なるのと同様に、モデルの単純化スキームが異なるとコストが異なり、期待するメリットとバランスが取れます。

ですから、アナリストとして注目すべき問題は、統計的妥当性それ自体の抽象的な概念を心配するのではなく、統計モデリング手順でこれらのコストと利益を確実に推定し、説明する能力だと思います。たとえば、上にリンクされているHarrellのクラスノートの157-8ページには、ブートストラップを使用して最小二乗でランク付けされた予測子の変動を示す例があります。LASSOが選択した変数セットについても同様の結果が得られます。

変数選択におけるそのタイプの変動が、モデルの特定の実用的なアプリケーションの邪魔にならないなら、それは問題ありません。仕事は、簡素化がどの程度のトラブルを引き起こすかを推定することです。


2
これは@EdMの素晴らしい答えであり、私がこの問題に関して開発した意見と非常に一致しています。特に、1)許容できない予測因子(モラル、規制、またはビジネス上の理由で)をモデリングのに選別する必要がある、2)最終的なモデルの単純化が具体的かつアプリオリに定義された目的のためであるという2つの点が気に入っています。これらは基本的に、ビジネスパートナーへの質問を解き明かそうとするポイントです。
マシュードゥルーリー

Prβ0

そうは言っても、重要度ランキングが把握しようとしている根本的な概念があるのか​​、それともそれらがすべて不明確な統計問題でのアドホック攻撃なのかどうかは疑問です。
マシュードゥルーリー

1
@MatthewDrury、Frank Harrell 、各変数によって説明される対数尤度の割合に基づいて、「変数の重要性」を評価する 1つの原則的な方法を提供します。それほど洗練されていない個人がこのフレーズで意味するものではありません。あなたのように、変数選択の気まぐれを説明するための最良の方法として、複数のブートストラップサンプルからLASSOが各予測子を選択する時間の一部を使用しました。それはほとんど私をLASSOから遠ざけ、中程度の規模の問題のリッジ回帰に向かわせました。
-EdM

8

これは完全な逸話ですが、GBMの間違いや弱点を特定するのに変数の重要性が役立つことがわかりました。

変数の重要度は、他の方法では取得するのが難しい、モデルの一種の巨大な断面の概要を提供します。リストの上位の変数には、より多くのアクティビティが表示されます(変数が「重要」であるかどうかは別の質問です)。多くの場合、振る舞いの悪い予測子(たとえば、前向きなもの、またはカーディナリティの高い要因)がトップになります。

直観変数の重要度とGBM変数の重要度の間に大きな不一致がある場合、通常、いくつかの貴重な知識を得るか、間違いを見つける必要があります。

「なぜこれを求めているのですか?」に3番目の答えを追加します。質問は、「自分の応答の原因を理解したいから」です。うん


4

さまざまな重要度ランキングは、プロセス、あらゆるプロセスへの潜在的に多数の入力に優先順位を付ける必要がある場合は常に、適用されるビジネスの世界で明確な役割を果たします。この情報は、問題を攻撃するための焦点を絞った戦略に関する方向性を提供します。変数が活用可能であり、操作の影響を受けない固定または構造的要因ではないため、プロセスコストの削減など、最も重要度の低いものから順に機能します。一日の終わりに、これはある種のA / Bテストになるはずです。

ただし、Mattは、通常のランキングと同様に、変数間のわずかなニュアンスや違いがあいまいまたはあいまいになり、その有用性が損なわれる可能性があります。


多くのビジネスケースにおける変数ランキングの有用性に完全に同意します。しかし、ここでは「異なるアルゴリズムが異なるランキングを与える」という懸念は取り扱われていません。それに対処する提案はありますか?stats.stackexchange.com/q/251248/71287での私の質問とその下のコメントも参照してください。
アリウェブ16

3
@aliwebの問題の違いは、単一の、固定の、単一のソリューションを持っていません。この点は、階層と階層の区別と同じくらい微妙であり、グローバルランキングは実際には完全にローカルで一時的なものであることが明らかにされています。相対的な変数の重要性に関する文献の最高のレビューは、おそらくウルリケ・グルーエンピングに属します。ウルリケ・グルーエンピングの論文は、そこにあるさまざまな測定基準に関して非常に包括的なものです。さらに、彼女のRモジュールと方法-RELAMPO-は、存在する相対的な重要性を推定するための厳密なアプローチです。
マイクハンター

3

理論的な観点からは完全に同意します。しかし、実用的な観点では、変数の重要度は非常に便利です。

保険会社が、クライアントのリスクを定量化するアンケートの質問の数を減らしたいとします。アンケートが複雑になるほど、クライアントが製品を購入する可能性は低くなります。そのため、リスクの定量化レベルを維持する際に、あまり有用でない質問を減らしたいと考えています。解決策は、多くの場合、変数重要度を使用して質問表から削除する質問を決定することです(そして、見込み客のリスクプロファイルについて「ほぼ」同じ予測を持つ)。


多くのビジネスケースにおける変数ランキングの有用性に完全に同意します。しかし、ここでは「異なるアルゴリズムが異なるランキングを与える」という懸念は取り扱われていません。それに対処する提案はありますか?stats.stackexchange.com/q/251248/71287での私の質問とその下のコメントも参照してください。
アリウェブ16

@aliweb:マシューはすでにあなたの質問に対する優れた答えを提供してくれたと思います。
Metariat
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.