私はRに比較的慣れていないので、カテゴリー列と数値(整数)列で構成されるデータにモデルを適合させようとしています。従属変数は連続番号です。
データの形式は次のとおりです。
predCateg、predIntNum、ResponseVar
データは次のようになります。
ranking, age_in_years, wealth_indicator
category_A, 99, 1234.56
category_A, 21, 12.34
category_A, 42, 234.56
....
category_N, 105, 77.27
Rでこれを(おそらくGLMを使用して)どのようにモデル化しますか?
[[編集]]
(データをより徹底的に分析した後)たまたまカテゴリカルな独立変数が実際に順序付けられていることに気づきました。したがって、私は以前に提供された答えを次のように変更しました:
> fit2 <- glm(wealth_indicator ~ ordered(ranking) + age_in_years, data=amort2)
>
> fit2
Call: glm(formula = wealth_indicator ~ ordered(ranking) + age_in_years,
data = amort2)
Coefficients:
(Intercept) ordered(ranking).L ordered(ranking).Q ordered(ranking).C age_in_years
0.0578500 -0.0055454 -0.0013000 0.0007603 0.0036818
Degrees of Freedom: 39 Total (i.e. Null); 35 Residual
Null Deviance: 0.004924
Residual Deviance: 0.00012 AIC: -383.2
>
> fit3 <- glm(wealth_indicator ~ ordered(ranking) + age_in_years + ordered(ranking)*age_in_years, data=amort2)
> fit3
Call: glm(formula = wealth_indicator ~ ordered(ranking) + age_in_years +
ordered(ranking) * age_in_years, data = amort2)
Coefficients:
(Intercept) ordered(ranking).L ordered(ranking).Q
0.0578500 -0.0018932 -0.0039667
ordered(ranking).C age_in_years ordered(ranking).L:age_in_years
0.0021019 0.0036818 -0.0006640
ordered(ranking).Q:age_in_years ordered(ranking).C:age_in_years
0.0004848 -0.0002439
Degrees of Freedom: 39 Total (i.e. Null); 32 Residual
Null Deviance: 0.004924
Residual Deviance: 5.931e-05 AIC: -405.4
私は少しは何で混乱していますordered(ranking).C
、ordered(ranking).Q
そしてordered(ranking).L
出力に平均し、この出力を理解する上でいくつかの助けをいただければ幸いです、そしてどのように応答変数を予測するためにそれを使用します。
factor(ranking)
、そうではないのas.factor(ranking)
ですか?