Rでのステップ出力の解釈


11

Rでは、stepコマンドはモデルへの入力変数を選択するのを助けることを意図していると思いますよね?

以下はexample(step)#-> swiss& から来ます step(lm1)

> step(lm1)
Start:  AIC=190.69
Fertility ~ Agriculture + Examination + Education + Catholic + 
    Infant.Mortality

                   Df Sum of Sq    RSS    AIC
- Examination       1     53.03 2158.1 189.86
<none>                          2105.0 190.69
- Agriculture       1    307.72 2412.8 195.10
- Infant.Mortality  1    408.75 2513.8 197.03
- Catholic          1    447.71 2552.8 197.75
- Education         1   1162.56 3267.6 209.36

Step:  AIC=189.86
Fertility ~ Agriculture + Education + Catholic + Infant.Mortality

                   Df Sum of Sq    RSS    AIC
<none>                          2158.1 189.86
- Agriculture       1    264.18 2422.2 193.29
- Infant.Mortality  1    409.81 2567.9 196.03
- Catholic          1    956.57 3114.6 205.10
- Education         1   2249.97 4408.0 221.43

Call:
lm(formula = Fertility ~ Agriculture + Education + Catholic +     Infant.Mortality, data = swiss)

Coefficients:
     (Intercept)       Agriculture         Education  
         62.1013           -0.1546           -0.9803  
        Catholic  Infant.Mortality  
          0.1247            1.0784  

さて、これを見ると、最後のステップテーブルは使用すべきモデルだと思いますか?最後の数行には、実際のモデルとそれに含まれる入力変数を説明する「Call」関数が含まれており、「Coefficients」はこれらの値の実際のパラメーター推定値です。これが私が欲しいモデルですよね?私はこれを自分のプロジェクトに外挿しようとしていますが、ここにはさらに変数があります。

回答:


7

最後のステップテーブルは、「ステップワイズ回帰」の最終結果です。ここでの注意点は、モデル仕様にアプローチするための原則的な方法がある場合、通常はこのアプローチを使用したくないということです。呼び出しは、最終ステップで使用される方程式を生成するlm呼び出しです。係数は実際のパラメーター推定値です。変数または各ステップでのドロップについて評価される「後方」ステップアプローチにデフォルト設定されたスコープまたは方向パラメーターステップを定義しなかったため、選択した変数をドロップするとAICが減少した場合、各ステップで削除されます。モデルからは、単一の変数を削除できない場合になるまで、プロセス全体が繰り返されます。あなたの例では、最後のステップでの生殖能力〜農業+教育+カトリック+幼児。


2

プリントアウトの最後の部分は、残っているモデルです。step関数の値を取得する場合にも取得できます。

final.mod <- step(lm1)
final.mod
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.