ポアソンGLMにオフセットを使用する必要がありますか?


11

私は、2つの異なる水中視覚センサス法を使用した場合の魚密度と魚種の豊富さの違いを調べるための研究を行っています。私のデータは元々はカウントデータでしたが、通常は魚の密度に変更されますが、ポアソンGLMを使用することに決めました。

model1 <- glm(g_den ~ method + site + depth, poisson)

私の3つの予測変数は、メソッド、サイト、および深さです。

私の応答変数は、ハタ種の豊富さ、ハタ密度、および他の魚群と同じです。密度は整数ではなく、数値データであることを認識しています(例:1.34849)。私は今このエラーを得ています:

In dpois(y, mu, log = TRUE) : non-integer x = 0.037500

私は読んでいて、多くの人がオフセットの使用を提案していますが、これは最も賢明なことですか?


1
これは、実際にはRの使用方法に関するものではありません。これは、Rの質問に偽装した基本的な統計的な質問です。ここで話題になるはずです。
ガン-モニカの復活

回答:


11

ここにはいくつかの問題があります:

  1. 観測されたカウントを応答変数として使用する必要があります。密度(g_den)は使用しないでください。
  2. 観測されたカウントが異なる領域からのものである場合、それらの領域のログを新しい変数として取得する必要があります。

    larea = log(area)
  3. 次の2つの方法で、観測の異なる領域を制御できます。

    • lareaオフセットとして使用する。これにより、応答が実際にレートになります(モデルの左側にリストされているのはカウントです)。
    • larea共変量として使用する。これは異なる領域を制御しますが、応答をレートと同等にすることはありません。これはより柔軟なアプローチでlarea、の増加がカウントに増加または減少の影響を与えるかどうか(つまり、勾配が1より小さいか大きいかどうか)を評価できます。

これらの問題についての詳細は、次のCVスレッドにあります。


6

調査した水の量(またはおそらく面積)で魚の数を割ったようです。その場合、オフセットは確かに適切です。除算したもののログを使用する必要があります。たぶん

model1 <- glm(g_den ~ method + site + depth + offset(log(area)), poisson)

(以前の正しくないバージョンから編集され、ログがありません)

エラーメッセージの理由は、ポアソン分布は通常整数値ですが、応答が整数ではなかったためです。これは、オフセットが存在すると変化します。(応答/オフセット)は整数である必要があります(もちろん、元のカウントが整数であると仮定すると、これはそうです)。


2
(ポアソンモデルはログリンクを使用するため)領域の対数変換を使用する必要があると述べましたが、コードは変換を行いません。offsetデフォルトでは変換を適用しないと思いますが、を使用してから久しぶりoffsetです。
iacobus

3
offset() デフォルトでは変換を適用しないことに注意しください。係数を強制的に1にするだけです。たとえば、こちらを参照してください。
ガン-モニカの回復

1
コメントありがとうございます。では、データを密度ではなくカウントに戻し、面積を別の変数として含める必要がありますか?また、別のフォーラムで、ガンマまたは逆ガウスモデルを実行し、データを密度として保持する場合はゼロ値を0.00001に変更するようアドバイスされていますが、それも適切でしょうか。
Vivienne

4
E(count)=exp(βTx)area=exp(βTx+log(area))E(count/area)=E(count)/area=exp(βTx)

5
密度を応答として使用することはできません。元のカウントを応答として使用する必要があります。オフセットを含めると、カウント応答が正しい方法で密度と同等になります。
ガン-モニカの

5

ポアソンを使用してモデル化する場合は、応答変数に整数値が必要です。次に、2つのオプションがあります

  • オフセットとして面積または他の適切な分母を使用します。これは通常、最初にログに記録する必要があります
  • 予測変数として面積などを含めます。ここでも、ログ数をモデル化しているため、これは通常、ログとして含まれます。

オフセットアプローチを使用する場合は、面積を2倍にすると、カウントが2倍になると予想しています。予測手法を使用する場合、面積を乗算するとカウントが乗算されるが、必ずしも同じ係数であるとは限らないことを知っていると言えます。

それはあなたの呼び出しです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.