次のデータがあり、回帰モデルを実行しているとします。
df=data.frame(income=c(5,3,47,8,6,5),
              won=c(0,0,1,1,1,0),
              age=c(18,18,23,50,19,39),
              home=c(0,0,1,0,0,1))
一方では、収入を予測するために線形モデルを実行します。
md1 = lm(income ~ age + home + home, data=df)
次に、ロジットモデルを実行して、ウォン変数を予測します。
md2 = glm(factor(won) ~ age + home, data=df, family=binomial(link="logit"))
どちらのモデルでも、予測子の応答カテゴリ、近似値、モデルの予測値を含むテーブルまたはデータフレームをどのように生成できるのでしょうか。
したがって、線形モデルの場合、次のようになります。
age  fitted_income  predicted_income
18    3              5 
23    3              3
50    4              2
19    5              5
39    6              4
home   fitted_income    predicted_income
0       5               6       
1       3               9
あるいは、それは各データポイントのためであるべきです。したがって、x_iデータポイントの場合、近似値と予測値は次のようになります。
id   age  fitted_income  predicted_income
1     18    3              5 
2     23    3              3
3     50    4              2
4     19    5              5
5     39    6              4
統計的な観点から、そのような事業は有用ですか?なぜですか、なぜそうではありませんか?
Rでこれを行うにはどうすればよいですか?(names(md1)を見て、モデルからプルできるものを見つけましたが、それを超えていません)
ありがとう!