変数の説明力


8

単純な線形回帰モデルがあります。私が計算したいのは、各入力変数がどの程度「重要」であるか、つまり次のようなステートメントを作成することです。

「このモデルの予測力の60%は、変数var1からのもので、var2とvar3はそれぞれ30%と10%です」

これらのパーセンテージを計算するために何をする必要がありますか?


3
「予測力」とはどういう意味ですか?たとえば、var3はサンプルの従属変数と非常に高い相関があるかもしれませんが、var3がサンプルで取得した値から大幅に逸脱する予測を行う必要がある場合があり、それによって予測の大きな不確実性が生じます。OTOH、var1、およびvar2は、個別にDVとの相関性が低い可能性がありますが、意図した予測には一緒にうまく機能する可能性があります。これは、「予測力」の測定には、モデルに加えて特定の予測コンテキストが必要であることを示しています。
whuber

回答:


10

relaimpoの Rパッケージには、あなたが何をしたいのかを正確に行い、それはまた、全体的に個々の予測因子の相対的寄与を評価するブートストラップCIを提供しますR2

使用例は、このチュートリアルの最後にあります:回帰へのモダンなアプローチの開始


+1は、定式化された質問を見逃す簡単な回答です。予測因子の数は50、たとえば、より小さい場合は、この作業だけことを追加する必要があります
user603

@chl RelaImpoの結果(=リグレッサの重要度の順序)は、標準化されていないベータ値の結果とは大きく異なります。それはなぜですか?14人のリグレッサはすべて同じメトリック(範囲0〜3)を持ち、平均と標準偏差は症状間で大幅に異なりますが、標準化されていないベータの重みはRelaImpoとほぼ同じ結果になるはずですか?ありがとうございました。
Torvon
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.