皆さんの中には、この素晴らしい論文を読んだことがあるかもしれません。
O'Hara RB、Kotze DJ(2010)カウントデータをログ変換しません。生態学と進化の方法1:118–122。クリック。
現在、私は、変換されたデータの負の二項モデルをガウスモデルと比較しています。O'Hara RBとは異なり、Kotze DJ(2010)は、サンプルサイズが低く、仮説検定のコンテキストでの特殊なケースを調べています。
両方の違いを調査するために使用されたシミュレーション。
タイプIエラーシミュレーション
すべての計算はRで行われました。
1つのコントロールグループ()と5つの処理グループ()を含む要因計画のデータをシミュレーションしました。存在量は、固定分散パラメーター(θ= 3.91)の負の二項分布から抽出されました。存在量はすべての処理で同等でした。
シミュレーションでは、サンプルサイズ(3、6、9、12)とアバンダンス(2、4、8、...、1024)を変化させました。100のデータセットが生成され、負の二項GLM(MASS:::glm.nb()
)、準ポアソンGLM(glm(..., family = 'quasipoisson'
)およびガウスGLM +対数変換データ(lm(...)
)を使用して分析されました。
尤度比検定(lmtest:::lrtest()
)(ガウスGLMおよび否定ビンGLM)とF検定(ガウスGLMおよび準ポアソンGLM)(anova(...test = 'F')
)を使用して、モデルをnullモデルと比較しました。
必要に応じてRコードを提供できますが、私の関連する質問についてはこちらもご覧ください。
結果
サンプルサイズが小さい場合、LRテスト(緑-負のビン;赤-ガウス)により、Type-Iエラーが増加します。F検定(青-ガウス、紫-準ポアソン)は、小さいサンプルサイズでも機能するようです。
LRテストでは、LMとGLMの両方で同様の(増加した)タイプIエラーが発生します。
興味深いことに、準ポアソンはかなりうまく機能します(ただし、F検定でも機能します)。
予想どおり、サンプルサイズが増加すると、LR-Testも適切に実行されます(漸近的に正しい)。
サンプルサイズが小さい場合、GLMにはいくつかの収束の問題(表示されていません)がありましたが、存在量が少ない場合のみであるため、エラーの原因は無視できます。
ご質問
データがneg.binから生成されたことに注意してください。モデル-したがって、GLMが最高のパフォーマンスを発揮することを期待していました。ただし、この場合、変換された存在量の線形モデルのパフォーマンスが向上します。準ポアソン(F検定)についても同様です。これは、F検定が小さいサンプルサイズでよりよく機能しているためと考えられます。これは正しいですか、なぜですか
LR-Testは、症状がないため、うまく機能しません。改善の可能性はありますか?
GLMのパフォーマンスが向上する可能性のある他のテストはありますか?GLMのテストを改善するにはどうすればよいですか?
サンプルサイズが小さいカウントデータには、どのタイプのモデルを使用する必要がありますか?
編集:
興味深いことに、二項GLMのLR-Testはかなりうまく機能します。
ここで、上記と同様の設定で、二項分布からデータを描画します。
赤:ガウスモデル(LRテスト+アルクシン変換)、黄土色:二項GLM(LRテスト)、緑:ガウスモデル(Fテスト+アルクシン変換)、青:準二次GLM(Fテスト)、紫:非パラメトリック。
ここでは、ガウスモデル(LR-Test + arcsin変換)のみがType Iエラーの増加を示していますが、GLM(LR-Test)はType Iエラーの点でかなり優れています。そのため、ディストリビューションにも違いがあるようです(または、glmとglm.nbの違いはありますか?)。