次のデータがあり、回帰モデルを実行しているとします。
df=data.frame(income=c(5,3,47,8,6,5),
won=c(0,0,1,1,1,0),
age=c(18,18,23,50,19,39),
home=c(0,0,1,0,0,1))
一方では、収入を予測するために線形モデルを実行します。
md1 = lm(income ~ age + home + home, data=df)
次に、ロジットモデルを実行して、ウォン変数を予測します。
md2 = glm(factor(won) ~ age + home, data=df, family=binomial(link="logit"))
どちらのモデルでも、予測子の応答カテゴリ、近似値、モデルの予測値を含むテーブルまたはデータフレームをどのように生成できるのでしょうか。
したがって、線形モデルの場合、次のようになります。
age fitted_income predicted_income
18 3 5
23 3 3
50 4 2
19 5 5
39 6 4
home fitted_income predicted_income
0 5 6
1 3 9
あるいは、それは各データポイントのためであるべきです。したがって、x_iデータポイントの場合、近似値と予測値は次のようになります。
id age fitted_income predicted_income
1 18 3 5
2 23 3 3
3 50 4 2
4 19 5 5
5 39 6 4
統計的な観点から、そのような事業は有用ですか?なぜですか、なぜそうではありませんか?
Rでこれを行うにはどうすればよいですか?(names(md1)を見て、モデルからプルできるものを見つけましたが、それを超えていません)
ありがとう!