-2対数尤度は1つのモデルのみで計算できますか?


9

このglmfit関数をMATLABで使用しています。この関数は、逸脱度のみを返し、対数尤度は返しません。逸脱は基本的にモデルの対数尤度の違いの2倍であることを理解していますがglmfit、1つのモデルを作成するためだけに使用しているのではなく、どういうわけか逸脱が発生しています。

  • -2対数尤度の計算には2つのモデルが必要ですか?
  • モデルが1つしかない場合、逸脱をどのように分析できますか?

私が持っているもう1つの質問は、2つのモデルがあり、対数尤度検定を使用してそれらを比較していたということです。帰無仮説は最初のモデルであり、対立仮説は2番目のモデルです。対数尤度検定の統計を取得した後、それをカイ二乗cdfと照合してp値を決定しますか?アルファレベルよりも小さい場合はnullを拒否し、それよりも大きい場合はnullを拒否できません。


2
あなたの最初の質問に。はい、2つのモデルがあります。もう1つは、対数尤度= 0の完全なモデルです。このようにして、逸脱度はモデルの対数尤度と等しくなります。
FMZ 2012年

1
それは完璧なモデル-私のモデル、または私のモデル-完璧なモデルでしょうか?そして、それを-2で割ると、モデルの対数尤度が本当に得られ、対数尤度テストを実行するためにそれを使用できますか?
shiu6rewgu 2012年

回答:


13

統計的な用語の逸脱は、少なすぎます。ほとんどの場合、プログラムは逸脱を返します

D(y)=2log{p(y|θ^)},
どこ θ^ は、モデルフィッティングからの推定パラメーターであり、 y 問題の乱数の潜在的に観測された/観測可能な発生です。

参照するより一般的な逸脱は、上記の逸脱を2つの変数、つまりデータと近似パラメーターの関数として扱います。

D(y,θ^)=2log{p(y|θ^)}
そして、もしあなたが持っていたら y 値ですが、2つの競合する適合パラメータ値、 θ^1 そして θ^2、それからあなたはあなたが言った逸脱を得るでしょう
2(log{p(y|θ^1)}log{p(y|θ^2)}).
ここglmfit()リンクされている、 言及したMatlab関数について読むことができます。より実りのある、より短いですが、逸脱の議論はここにリンクされています

逸脱統計量は、暗黙的に2つのモデルを想定しています。最初のモデルは、によって返された近似モデルで、glmfit()このパラメーターベクトルを呼び出します。θ^1。2つ目は「フルモデル」(「飽和モデル」とも呼ばれます)です。これは、すべてのデータポイントに自由変数があるモデルです。このパラメーターベクトルを呼び出します。θ^s。非常に多くの自由変数を持つことは明らかに愚かなことですが、それによってそのデータに正確に合わせることができます。

したがって、逸脱度統計は、適合モデルで計算された対数尤度と飽和モデルの差として計算されます。しましょうY={y1y2yN}N個のデータポイントのコレクションです。次に:

DEVθ^1Y=2[ログpY|θ^1ログpY|θ^s]
上記の用語は、個々のデータポイントの合計に展開されます y独立性の仮定による。この計算を使用してモデルの対数尤度を計算する場合は、最初に飽和モデルの対数尤度を計算する必要があります。がここにありますこれを計算するためのいくつかのアイデアを説明リンクです...しかし、問題は、いずれの場合でも、データのタイプの対数尤度を計算する関数を書き留める必要があるということです、そしてその場合たまたま、逸脱度計算からバックトラックするよりも、対数尤度を自分で計算する独自の関数を作成する方が良いでしょう。

ベイジアンデータ分析の第6章を参照逸脱の良い議論については。

尤度検定統計量に関する2番目の点については、はい、基本的に正しいことを知っているように思えます。しかし、多くの場合、帰無仮説はエキスパートであり、外部の知識によって事前に推測できるものと見なします(一部の係数がゼロに等しいなど)。これは、必ずしもモデルフィッティングを行った結果として生じるものではありません。


EMSありがとうございます!あなたは本当に逸脱が何であるかを理解するのを本当に助けてくれました!まだいくつか質問がありますが、どのように質問したらよいかわかりません。言い方がわかれば、必ずここで返信します。
shiu6rewgu 2012年

最初の質問で、MATLABが逸脱のみを与えることを考慮して、作成したモデルの対数尤度を逸脱からどのように抽出しますか?また、(これは私がかなり愚かに見えることを知っていますが)p(y | θˆ2)の場合、これは、結果データセットまたはフィットされたパラメーターを指定した独立変数から特定のy値を取得する確率になります
shiu6rewgu

Matlabの方法が間違っていたようです。2つのモデルを見て逸脱度を計算します。これを反映するために上記の回答を編集しました。
e

+1、これは本当に良い答えです。将来はもっと見たいです。
ガン-モニカの復活

1
@SibbsGambling このリンクには、対数尤度がゼロでない「完全」または「飽和」モデルを示すcoolibahツリーデータの例があります。私は、飽和モデルが定義により1の可能性を持たなければならない特定の状況があると信じていますが、すべての状況ではありません。
2015年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.