モデルの尤度がnullより有意に高くない場合の(GAM)回帰係数の有意性


10

私は、Rパッケージgamlssを使用して、データのゼロインフレベータ分布を想定して、GAMベースの回帰を実行しています。モデルには説明変数が1つしかないため、基本的には次のようになりますmymodel = gamlss(response ~ input, family=BEZI)

アルゴリズムは、説明変数が平均(μ)に与える影響の係数と、k input = 0の関連するp値を次のように与えます。kμk入力=0

Mu link function:  logit                                               
Mu Coefficients:                                                      
              Estimate  Std. Error  t value   Pr(>|t|)                  
(Intercept)  -2.58051     0.03766  -68.521  0.000e+00                  
input        -0.09134     0.01683   -5.428  6.118e-08

上記の例でわかるように、仮説は高い信頼度で棄却されます。k入力=0

次にnullモデルを実行null = gamlss(response ~ 1, family=BEZI)し、尤度比検定を使用して尤度を比較します。

p=1-pchisq(-2*(logLik(null)[1]-logLik(mymodel)[1]), df(mymodel)-df(null)).

(上記のように)入力の係数が非常に有意であると報告されていても、多くの場合、になります。私はこれを非常に珍しいと思います-少なくとも、線形またはロジスティック回帰の経験では決して発生しませんでした(実際、これは、gamlssでゼロ調整されたガンマを使用しているときも発生しませんでした)。p>0.05

私の質問は、これが当てはまる場合でも、応答と入力の間の依存関係を信頼できるかどうかです。

回答:


1

これがGAMに関連する理由はすぐにはわかりません。実際には、同じものに対して2つのテストを使用しています。統計には絶対的な確実性がないため、一方に有意な結果を与え、他方に与えないことは非常に可能です。

おそらく、2つのテストのうちの1つがより強力である(ただし、いくつかのより多くの仮定に依存している)か、単一の重要なテストが20分の1タイプIエラーである可能性があります。

良い例は、サンプルが同じ分布からのものであるかどうかのテストです。非常にパラメトリックなテストがあります(T検定は、これに使用できるものです。平均が異なる場合、分布も同じである必要があります)。もの:パラメトリックなものは重要な結果を与え、ノンパラメトリックなものはそうしないことが起こり得ます。最後に、データは、(I型)は、単に異常であるため、またはノンパラメトリック検定は、差をピックアップするためのサンプルサイズが十分でないため、またはパラメトリック試験の仮定は、偽であるので、これは可能性があるため態様のさまざまなテストによってチェックされる本当にテストしたいもの(さまざまな分布)は、まったく異なります(さまざまなことは、<->の確率が「より高い」ことを意味します)。

1つのテスト結果が重要な結果を示し、他のテスト結果がわずかでも重要でない場合は、あまり心配する必要はありません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.