モデル選択のAICガイドライン


32

私の理解では、AICよりもpar約をより重視するということなので、私は通常BICを使用します。ただし、私は今、より包括的なアプローチを使用することを決定し、AICも使用したいと考えています。Raftery(1995)がBICの違いに関する優れたガイドラインを提示したことを知っています:0-2は弱い、2-4は1つのモデルが優れているという肯定的な証拠などです。

私は教科書を調べましたが、AICでは奇妙に見えます(差が大きいほど弱く、AICの差が小さいほど1つのモデルが優れているように見えます)。これは、私が教えられたことを知っていることに反します。私の理解では、AICを低くしたいということです。

RafteryのガイドラインがAICにも適用されるかどうか、またはあるモデルと別のモデルの「証拠の強さ」に関するガイドラインをどこで引用できるかを知っていますか?

そして、はい、カットオフは素晴らしいものではありません(私はそれらをいらいらさせます)が、それらは異なる種類の証拠を比較するときに役立ちます。


1
、これは(PDFファイル)、あなたが参照しているラフテリー紙?
GUNG -復活モニカ

4
ここの読者は、次の優れたCVスレッドを読むことに興味があるかもしれません:他よりもAICまたはBICを好む理由はありますか?
GUNG -復活モニカ

1
「教科書を見て、AICで奇妙に見える(AICの差が大きいほど、AICの差が小さいほど、1つのモデルが優れていることを意味する)」と言うとき、どの教科書を参照していますか?いう?
-Glen_b-モニカの復職14

1
2番目のパラは不明です。おそらくこれを意味します。大きな違いは、値が小さいモデルが望ましいことを示唆しますが、小さな違いは評価が困難です。さらに、統計学者は、「小さい」と「大きい」の違いについてはまだ同意していません-歌手とウィレット(2003、p.122)
休止

1
3番目のパラに関しては、ジェフリーズ(1961、p。432)によって進められた証拠強度のカテゴリーを採用したい場合、完全な参考文献を提供できます。
休止

回答:


23

AICとBICは、モデル比較に関して同じ解釈を保持しています。つまり、AICまたはBICの差が大きいほど、1つのモデルの証拠が他のモデルよりも強いことを示します(低いほど良い)。AICがBICほど強力にパラメーターの数を減らさないのです。サンプルサイズが小さい場合に使用されるAIC(AICc)の修正もあります。AIC / BICの比較の詳細については、こちらをご覧ください


5
+1。追加/明確にするために:AIC(およびAICc)はKL発散を採用しています。したがって、AICが「追加の」情報を反映するのは、それが小さいほど良いということです。言い換えると、サンプルサイズであるため、AICスコアが最小のモデルは、Kullback-Leibler発散が最小であるため、「真の」モデルに最も近いモデルになります。N
–usεr11852によると、Reinstate Monicは14

28

AC1AC2AC1<AC2
12n=ACACmnACACmn>10mn0。


1
あぁ!これにより、「より大きい」ビットが完全にクリアされました。ありがとう!
トムカーペンター14年

7

私は通常、モデルに適切に適合することを説明するためにAICまたはBICを客観的に使用しません。私が行う 2つの予測モデルの相対的なフィットを比較するために、これらのICを使用します。「2」または「4」のAICに関しては、完全にコンテキストに依存します。「良い」モデルがどのように適合するかを知りたい場合は、常にシミュレーションを使用できます(する必要があります)。AICの理解は正しいです。AICは、パラメーターから正の寄与を受け取り、尤度から負の寄与を受け取ります。あなたがやろうとしているのは、たくさんのパラメータをモデルにロードすることなく、可能性を最大化することです。ですから、私のバブル崩壊の意見は、AICのカットオフは文脈から外れたものではないということです。


モデルでシミュレーションが許可されていない場合はどうなりますか?
統計14年

6
ツタンカーメン!それはどのように可能ですか?世界をブートストラップすることができます。
AdamO 14年

それで神の運...世界をシミュレートしますlol
Stat

2
@Statモデルからのデータをシミュレートすることが不可能になる状況を想像できないと言うとき、私は非常に深刻です。少なくとも、トレーニングデータセットからのブートストラップは、有効なシミュレーションアプローチとしての資格があります。
AdamO 14年

ブートストラップがハードクロスバリデーションである場合、または単純なジャックナイフでさえ機能するはずです。また、モデル平均化は、類似したAICを持つモデルからの情報を調整する手段を提供します。
Nブラウワー

2

ここに関連する質問があります-それは適切なモデルを選択するのに最適化されていますか?。アカデミックな世界で認識できない人々が書くのにふさわしいと考えるものや、残すべき重要な参考文献の一般的な考えを示します。

一般的に、重要なのは尤度またはAICの違いであり、絶対値ではありません。質問の「BIC:0-2 is weak」の重要な単語「difference」を見逃しています-Rafteryの表6を確認してください-そして誰もそれを修正したくないのは奇妙です。

私自身は、MAICE(最小AIC推定-赤池が呼んだように)を探すように教えられました。だから何?ある有名人が未知の女性に書いたものは次のとおりです。

Dear Miss -- 
I have read about sixteen pages of your manuscript ... I suffered exactly the same 
treatment at the hands of my teachers who disliked me for my independence and passed 
over me when they wanted assistants ... keep your manuscript for your sons and
daughters, in order that they may derive consolation from it and not give a damn for
what their teachers tell them or think of them. ... There is too much education
altogether.

私の教師は「2つのAICが大きく異なるかどうかのテスト」などのタイトルの論文を聞いたことはなく、AICをサンプリング分布やその他の特性を持つ統計と呼んだことも覚えていません。AICは、可能な場合は自動で最小化する基準であると教えられました。

数年前にIrishStatによってここで表明されたさらに別の重要な問題(その答えを見つけられなかったので間違っていると謝罪します)は、AIC、BICおよび他の基準が異なる目的のために導出されていることです異なる条件(仮定)の下で、たとえば、目的が予測である場合、それらを互換的に使用できないことがよくあります。不適切なものを好むことはできません。

私の情報源によると、Burnham and Anderson(2002、p.70)への引用を使用して、0-2内のデルタ(AICの違い)に実質的なサポートがあることを示しています。4〜7以内のデルタはかなりサポートが少なく、10より大きいデルタは本質的にサポートされていません。また、「著者は、これらのガイドラインが役立つ可能性のある条件についても議論した」と書いた。この本はStatの回答で引用されており、私は最も関連性が高いと主張しました。


0

情報の基準に関して、SASは次のように述べています。

「赤池(AIC)、シュワルツ(SC、BIC)、QICなどの情報基準を使用して、競合するネストされていないモデルを比較できますが、比較のテストは提供されないことに注意してください。 GENMOD、LOGISTIC、GLIMMIX、MIXED、およびその他の手順は、情報基準の尺度を提供します。」

2つの比較モデルテスト手順があります。a)Vuongテストとb)ノンパラメトリッククラークテストです。詳細については、このペーパーを参照してください。


引用された「論文」(すなわちプレゼンテーション)で採用されている数学的表記は、コメントなしでは理解できない。特に、ダッシュのラインは何を象徴していますか?含意?
アダムリツコフスキ14年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.