私は、Rパッケージgamlssを使用して、データのゼロインフレベータ分布を想定して、GAMベースの回帰を実行しています。モデルには説明変数が1つしかないため、基本的には次のようになりますmymodel = gamlss(response ~ input, family=BEZI)
。
アルゴリズムは、説明変数が平均(μ)に与える影響の係数と、k (input )= 0の関連するp値を次のように与えます。
Mu link function: logit
Mu Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.58051 0.03766 -68.521 0.000e+00
input -0.09134 0.01683 -5.428 6.118e-08
上記の例でわかるように、仮説は高い信頼度で棄却されます。
次にnullモデルを実行null = gamlss(response ~ 1, family=BEZI)
し、尤度比検定を使用して尤度を比較します。
p=1-pchisq(-2*(logLik(null)[1]-logLik(mymodel)[1]), df(mymodel)-df(null)).
(上記のように)入力の係数が非常に有意であると報告されていても、多くの場合、になります。私はこれを非常に珍しいと思います-少なくとも、線形またはロジスティック回帰の経験では決して発生しませんでした(実際、これは、gamlssでゼロ調整されたガンマを使用しているときも発生しませんでした)。
私の質問は、これが当てはまる場合でも、応答と入力の間の依存関係を信頼できるかどうかです。