AICの「パラメーターの数」の意味


21

AICを計算するとき、

AIC=2k2lnL

kは「パラメーターの数」を意味します。しかし、パラメーターとして何が重要ですか?たとえば、モデルでは

y=ax+b

aとbは常にパラメーターとしてカウントされますか?インターセプトの値を気にしない場合、無視できますか、それともカウントされますか?

仮に

y=af(c,x)+b

どこ Cとxの関数である、私は今、3つのパラメータを数えるのですか?f


9
微妙な点があるため、これは良い質問ですは推定される識別可能なパラメーターの数です。たとえば、回帰モデル 5つのパラメーターが記述されていますが、それでもです。(このモデルはとおよびであり、明示的に4つのパラメーターのみが必要です。 。)kYN(β0+β1X1+β2X2+β3(X1+X2),σ2) k=4YN(β0+α1X1+α2X2,σ2)α1=β1+β3α2=β2+β3
whuber

3
厳密には、識別可能なすべての無料パラメーター(平均パラメーター、形状およびスケールパラメーターなど)をカウントします(AICにとって)が、AICの場合、比較するモデルに共通のパラメーターを省略しても意味はありません。したがって、たとえば回帰では、分散パラメーターをカウントする必要があります。したがって、私のカウントでは、質問内のすべてのパラメーターカウントは1つだけです。ただし、すべてのモデルに1つだけあれば、AICでドロップしても問題はありません。Rは、回帰モデルでAICを計算するときに、分散パラメーターを明示的にカウントします。C
Glen_b -Reinstateモニカ

@whuberなぜこの素晴らしいコメントが回答として投稿されないのですか?:)
アレクシス14年

ありがとう、@アレクシス。この考えはPシュネルの回答で十分にカバーされているため、この考えをコメントとして投稿しました。もう少し強調したいだけです。
whuber

回答:


17

mugenが述べたように、は推定されたパラメーターの数を表します。つまり、モデルを完全に指定するために知る必要がある追加の数量の数です。単純な線形回帰モデルでは あなたは推定することができ、、またはその両方を。見積もらない数量は修正する必要があります。パラメータを知らず、気にしないという意味で、パラメータを「無視」することはありません。と両方を推定しない最も一般的なモデルは、インターセプトなしモデルで、を修正します。これには1つのパラメーターがあります。またはを簡単に修正できますk

y=ax+b
ababb=0a=2b=1それが現実を反映していると信じる何らかの理由があるなら。(細かい点:は単純な線形回帰のパラメーターでもありますが、すべてのモデルに存在するため、AICの比較に影響を与えることなくドロップできます。)σ

モデルが の場合、パラメーターの数は、これらの値のいずれかを修正するかどうか、およびの形式に依存します。たとえばを推定であることがわかっている場合、モデルを書き出す と、3つの未知のパラメーターを持つ 得られます。もし、しかし、、我々はモデル有する 実際には二つのパラメータがあります

y=af(c,x)+b
fa,b,cf(c,x)=xc
y=axc+b
f(c,x)=cx
y=acx+b
および bacb

cによってインデックス付けされた関数のファミリーであることが重要です。f c x が連続的であり、cxに依存していることしかわからない場合、無数の連続関数が存在するため、運が悪いです。f(c,x)cf(c,x)cx


2
(+1)「推定」全体を通じて「最尤法による推定」を意味することに言及する価値があります。
Scortchi -復活モニカ

f(c,x)ccr2c

2
@SideshowBob:はい-2つのモデルを比較すると、最大化された対数尤度の差は、予想されるKullback-Leibler情報損失の差の偏った推定量であり、AICのペナルティ項はその偏りをほぼ修正します。
Scortchi -復活モニカ

1
@SideshowBob:一般化された推定方程式などにAICの修正があることに言及する必要があります-それらは最大化された準尤度とやや複雑なペナルティ項を使用します。
Scortchi -復活モニカ

4

AIC=2k2ln(L)

こちらをご覧ください

k

k

私はあなたの2番目の質問に答えるのに十分な知識がないと感じています。コミュニティの別のメンバーに任せます。


1
λ

1
はい、確かに。
PA6OTA 14年

1

まず、AICに精通していない人にとっては、赤池情報量基準(AIC)は、モデルの「良さ」を比較するために設計された単純な指標です。

AICによると、同じ入力変数と応答変数に適用する2つの異なるモデル、つまり同じ問題を解決するために設計されたモデルを選択しようとすると、AICの低いモデルは「より良い」と見なされます。

k

cf(c,x)k

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.