カテゴリカルデータを使用した負の二項GLMからの.L&.Q出力の解釈


14

私は負の二項GLMを実行しただけで、これが出力です。

Call:
glm.nb(formula = small ~ method + site + depth, data = size.dat, 
    init.theta = 1.080668549, link = log)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.2452  -0.9973  -0.3028   0.3864   1.8727  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   1.6954     0.1152  14.720  < 2e-16 ***
method.L     -0.6828     0.1637  -4.171 3.04e-05 ***
site.L        0.9952     0.2050   4.854 1.21e-06 ***
site.Q       -0.4634     0.1941  -2.387    0.017 *  
depth.L       0.8951     0.1988   4.502 6.74e-06 ***
depth.Q       0.2060     0.1984   1.038    0.299    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for Negative Binomial(1.0807) family taken to be 1)

    Null deviance: 185.1  on 89  degrees of freedom
Residual deviance: 100.8  on 84  degrees of freedom
AIC: 518.24

私の予測因子はすべてカテゴリカルです。私は取得しています理由です.L.Q。私はそれらが異なるカテゴリを表していると思いますが、GLMを実行する前にそれらにラベルを付けて、代わりに異なるカテゴリとして表示されるコードを知っている人はいますか?



コードがかなりわかりにくいと思うのですが、もっと単純なコードはありますか?カテゴリは非常に単純です。方法1と方法2、サイト1、サイト2とサイト3、深さは5、10、15
Vivienne

回答:


12

変数は、(カテゴリー化するために)因子としてコード化されるだけでなく、順序付けされ因子としてコード化されます。次に、デフォルトで、Rは一連の多項式関数を変数のレベルに適合させます。1つ目は線形(.L)、2つ目は2次(.Q)、3つ目(十分なレベルがある場合)は3次などです。Rは、変数のレベル数よりも1つ少ない多項式関数に適合します。たとえば、レベルが2つしかない場合は、線形トレンドのみが当てはまります。さらに、使用される多項式ベースは直交です。(価値のあることとして、これはRに固有ではありません。または負の二項モデルに固有です。すべてのソフトウェアと回帰モデルのタイプは同じことを行います。)


特にRに焦点を当て、変数を順序付けまたは順序付けなしでコーディングする場合は、?factorを使用します

my.variable <- factor(my.variable, ordered=TRUE)   # an ordered factor
my.variable <- factor(my.variable, ordered=FALSE)  # an unordered factor

ああ、今はラベルが貼ってあるので注文しました、本当にありがとう!
Vivienne
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.