Rを使用して、連続予測子と離散予測子の混合からの単一応答変数の線形モデルを近似しました。これは基本的ですが、離散因子の係数がどのように機能するかを理解するのに苦労しています。
コンセプト:明らかに、連続変数「x」の係数は次の形式で適用されy = coefx(varx) + intercept
ますが、係数が非数値の場合、係数zに対してどのように機能しますか?y = coefx(varx) + coefz(factorz???) + intercept
具体的:私はRのモデルをlm(log(c) ~ log(d) + h + a + f + h:a)
どこにh
、そしてf
離散的で非数値的な因子としてフィットさせました。係数は次のとおりです。
Coefficients:
Estimate
(Intercept) -0.679695
log(d) 1.791294
h1 0.870735
h2 -0.447570
h3 0.542033
a 0.037362
f1 -0.588362
f2 0.816825
f3 0.534440
h1:a -0.085658
h2:a -0.034970
h3:a -0.040637
これらを使用して予測方程式を作成する方法:
log(c) = 1.791294(log(d)) + 0.037362(a) + h??? + f???? + h:a???? + -0.679695
それとも私はそれを間違っていますか?
私は、被験者が、カテゴリに該当する場合はその概念だと思うh1
とf2
、式は次のようになります。
log(c) = 1.791294(log(d)) + 0.037362(a) + 0.870735 + 0.816825 + h:a???? + -0.679695
しかし、h:a
インタラクティブな用語がどのように解析されるのか、私は本当にはっきりしていません。安心してくれてありがとう。
g1