ログリンクされたガンマGLM対ログリンクされたガウスGLM対ログ変換されたLM


12

私の結果から、GLM Gammaはほとんどの仮定を満たしているように見えますが、ログ変換されたLMよりも価値のある改善でしょうか?私が見つけたほとんどの文献は、ポアソンまたは二項GLMを扱っています。ランダム化を使用した一般化線形モデルの仮定の評価の記事は非常に有用であることがわかりましたが、意思決定に使用される実際のプロットが欠けています。うまくいけば、経験のある人が私を正しい方向に向けることができます。

応答変数Tの分布をモデル化したいのですが、その分布を下にプロットします。ご覧のとおり、正の歪度です
有効なXHTML

考慮すべき2つのカテゴリー要因があります:METHとCASEPART。
この研究は主に探索的であり、モデルを理論化してその周辺でDoEを実行する前のパイロット研究として本質的に機能することに注意してください。

Rには次のモデルと診断プロットがあります。

LM.LOG<-lm(log10(T)~factor(METH)+factor(CASEPART),data=tdat)

有効なXHTML
有効なXHTML

GLM.GAMMA<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="Gamma"(link='log'))

有効なXHTML
有効なXHTML

GLM.GAUS<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="gaussian"(link='log'))

有効なXHTML
有効なXHTML

また、Shapiro-Wilksの残差検定を使用して、次のP値を達成しました。

LM.LOG: 2.347e-11  
GLM.GAMMA: 0.6288  
GLM.GAUS:  0.6288  

AICとBICの値を計算しましたが、正しい場合は、GLM / LMのさまざまなファミリーのために、あまりわかりません。

また、極端な値に注意しましたが、明確な「特別な原因」がないため、それらを外れ値として分類することはできません。



1
リグレッサーの増加が通常の応答の相対的な変化に関連しているという意味で、3つのモデルすべてが乗法的であることに注意する価値があります。2つの対数線形GLMでは、「標準」は算術平均を意味し、対数変換LMでは幾何平均を意味します。したがって、効果と予測を解釈する方法は、完全な残差プロット(これらはとにかく駆動されるデータ)だけでなく、モデル選択の駆動要因でもあります。
マイケルM

@MichaelMayer-ご回答ありがとうございます。選択が解釈にどのように影響するかについて、少し詳しく説明していただけますか?または、参照の方向に私を向けますか?
TLJ

@ Marcinthebox-投稿する前にその質問に目を通しました。私の質問に正確に答えているわけではありません。
TLJ

回答:


18

まあ、ガウスへの対数線形適合が不適切であることは非常に明確です。残差には強い不均一分散性があります。それでは、それを考慮しないようにしましょう。

残っているのは対数正規対ガンマです。

のヒストグラムに注意してくださいT直接使用されない、周辺分布が変量の混合になるためです(それぞれが予測子の異なる値のセットで条件付けされます)。2つのモデルのいずれかが正しい場合でも、そのプロットは条件付き分布のようには見えません。

この場合、どちらのモデルもほぼ同等に適しています。どちらも平均の2乗に比例する分散を持っているため、近似に対する残差の広がりのパターンは似ています。

低外れ値は、対数正規分布よりもガンマの方がわずかによく適合します(高外れ値の場合は逆)。与えられた平均と分散では、対数正規分布はスキューが大きく、変動係数が高くなります。

覚えておくべきことの1つは、対数正規の期待値は expμ; 平均に興味があるなら、単にログスケールフィットを累乗することはできません。確かに、平均に興味がある場合、ガンマは対数正規分布に関する多くの問題を回避します(たとえば、σ2対数正規分布では、平均を持たないlog-t分布に基づく予測があります。予測間隔は依然として正常に機能しますが、平均を予測するための問題になる場合があります。

関連する議論については、こちらこちらもご覧ください。


1
@Gleb_bこの答えは私の分析に非常に役立ちます。少し質問があります。(1)最初に、これは残差対適合プロットに基づいて、「両者は平均の二乗に比例する分散を持っています...」ですか?(2)そして、qqプロットに基づいて、この「低外れ値はガンマでわずかに良く適合します...与えられた平均と分散で...」(3)glm(たとえば、ガンマ、ポアソン、負の二項)の理解から、残差の正規性と分散の均一性の仮定はありません。もしそうなら、なぜ残差vs適合および通常のqqプロットが診断に関連するのでしょうか?

2
これは、まったく新しい質問、または実際にはいくつかの質問(そのほとんどがすでにサイトで回答されています!)-モデルの一部になるほど十分に広範です。2.いいえ、これらはディストリビューションに関する一般的な事実です。3.正常ではないことを修正しますが、QQプロットで使用される残差は(内部的にスチューデント化された)逸脱残差であり、特にガンマの場合、一般に正規分布に非常に近い傾向があります(理由を説明する回答を書きましたいくつかのポイント)、本質的に一定の分散を持つ必要があります。正常からのいくらかの逸脱は予想外ではありませんが、実質的な逸脱... ctd
Glen_b -Reinstate Monica

2
正規性からのctd ...(他のプロットが正常であると仮定)は、分布の仮定に問題があることを示している可能性があります。
Glen_b
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.