低いサンプルサイズ:LR vs F-テスト


8

皆さんの中には、この素晴らしい論文を読んだことがあるかもしれません。

O'Hara RB、Kotze DJ(2010)カウントデータをログ変換しません。生態学と進化の方法1:118–122。クリック

現在、私は、変換されたデータの負の二項モデルをガウスモデルと比較しています。O'Hara RBと​​は異なり、Kotze DJ(2010)は、サンプルサイズが低く、仮説検定のコンテキストでの特殊なケースを調べています。

両方の違いを調査するために使用されたシミュレーション。

タイプIエラーシミュレーション

すべての計算はRで行われました。

1つのコントロールグループ(μc)と5つの処理グループ(μ15)を含む要因計画のデータをシミュレーションしました。存在量は、固定分散パラメーター(θ= 3.91)の負の二項分布から抽出されました。存在量はすべての処理で同等でした。

シミュレーションでは、サンプルサイズ(3、6、9、12)とアバンダンス(2、4、8、...、1024)を変化させました。100のデータセットが生成され、負の二項GLM(MASS:::glm.nb())、準ポアソンGLM(glm(..., family = 'quasipoisson')およびガウスGLM +対数変換データ(lm(...))を使用して分析されました。

尤度比検定(lmtest:::lrtest())(ガウスGLMおよび否定ビンGLM)とF検定(ガウスGLMおよび準ポアソンGLM)(anova(...test = 'F'))を使用して、モデルをnullモデルと比較しました。

必要に応じてRコードを提供できますが、私の関連する質問についてはこちらご覧ください。

結果 ここに画像の説明を入力してください

サンプルサイズが小さい場合、LRテスト(緑-負のビン;赤-ガウス)により、Type-Iエラーが増加します。F検定(青-ガウス、紫-準ポアソン)は、小さいサンプルサイズでも機能するようです。

LRテストでは、LMとGLMの両方で同様の(増加した)タイプIエラーが発生します。

興味深いことに、準ポアソンはかなりうまく機能します(ただし、F検定でも機能します)。

予想どおり、サンプルサイズが増加すると、LR-Testも適切に実行されます(漸近的に正しい)。

サンプルサイズが小さい場合、GLMにはいくつかの収束の問題(表示されていません)がありましたが、存在量が少ない場合のみであるため、エラーの原因は無視できます。

ご質問

  1. データがneg.binから生成されたことに注意してください。モデル-したがって、GLMが最高のパフォーマンスを発揮することを期待していました。ただし、この場合、変換された存在量の線形モデルのパフォーマンスが向上します。準ポアソン(F検定)についても同様です。これは、F検定が小さいサンプルサイズでよりよく機能しているためと考えられます。これは正しいですか、なぜですか

  2. LR-Testは、症状がないため、うまく機能しません。改善の可能性はありますか?

  3. GLMのパフォーマンスが向上する可能性のある他のテストはありますか?GLMのテストを改善するにはどうすればよいですか?

  4. サンプルサイズが小さいカウントデータには、どのタイプのモデルを使用する必要がありますか?

編集:

興味深いことに、二項GLMのLR-Testはかなりうまく機能します。 ここに画像の説明を入力してください

ここで、上記と同様の設定で、二項分布からデータを描画します。

赤:ガウスモデル(LRテスト+アルクシン変換)、黄土色:二項GLM(LRテスト)、緑:ガウスモデル(Fテスト+アルクシン変換)、青:準二次GLM(Fテスト)、紫:非パラメトリック。

ここでは、ガウスモデル(LR-Test + arcsin変換)のみがType Iエラーの増加を示していますが、GLM(LR-Test)はType Iエラーの点でかなり優れています。そのため、ディストリビューションにも違いがあるようです(または、glmとglm.nbの違いはありますか?)。

回答:


5

使用している尤度比検定では、カイ二乗分布を使用して、尤度のnull分布を近似します。この近似は、サンプルサイズが大きい場合に最適に機能するので、サンプルサイズが小さい場合の不正確さには意味があります。

あなたの状況でType-Iエラーを改善するためのオプションがいくつかあります:

  • バートレットの修正など、尤度比検定の修正バージョンがあります。私はこれらについてはあまり知りませんが(それらが存在するという事実を除いて)、Ben Bolkerがもっと知っていると聞きました。
  • ブートストラップによって尤度比のnull分布を推定できます。観測された尤度比がブートストラップ分布の真ん中の95%から外れる場合、それは統計的に有意です。

最後に、ポアソン分布は、負の二項式よりも1つ少ない自由パラメーターを持ち、サンプルサイズが非常に小さい場合に試す価値があります。


デビッドに感謝します。過剰分散カウントの場合、準ポアソンはかなりうまく機能します(F検定)。ただし、データは2次平均分散関係船で生成されており、準ポアソンは線形mv関係を持っています。バートレットの訂正によるヒントをありがとう(ベンはチャットでそれを述べた)。私はあなたのブートストラップのアイデアをチェックします、妥当に聞こえます...
EDi
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.