「モデルの不確実性」の世界で私が見つけた興味深いことの1つは、「真のモデル」の概念です。これは、「モデル命題」が次の形式であることを暗黙的に意味します。
M(1)i:The ith model is the true model
そこから事後確率を計算します。この手順は、概念レベルでは非常に疑わしいようです。命題が網羅的であると仮定することは、大きな呼びかけ(または不可能な計算)です。作成できるモデルのセットには、まだ考えていない代替モデルが必ずあります。無限回帰も同様です...M (1 ) iP(M(1)i|DI)M(1)i
ここでは網羅性が非常に重要です。これにより、確率が1に加算されるため、モデルを無視することができるためです。
しかし、これはすべて概念レベルです。モデルの平均化は優れたパフォーマンスを発揮します。したがって、これはより良いコンセプトがなければならないことを意味します。
個人的に、私はモデルをハンマーやドリルのようなツールと見なしています。モデルとは、観察可能なものについて予測したり記述したりするために使用される精神的な構成要素です。「真のハンマー」について話すのは非常に奇妙に聞こえますが、「真のメンタルコンストラクト」について話すのも同様に奇異です。これに基づいて、「本当のモデル」という概念は私には奇妙に思えます。「正しい」モデルや「間違った」モデルではなく、「良い」モデルや「悪い」モデルを考える方がはるかに自然に思えます。
この観点から、モデルの選択から、使用する「最良の」モデルについても同様に不確かになる可能性があります。したがって、代わりに命題について推論するとします。
M(2)i:Out of all the models that have been specified,
the ith model is best model to use
M(2)iM(2)i
ただし、このアプローチでは、「最適な」モデルがどれだけ優れているかを測定するために、何らかの適合度の尺度が必要です。これは、通常のGoF統計(KL発散、カイ2乗など)に相当する「確実な」モデルに対してテストすることにより、2つの方法で実行できます。これを評価するもう1つの方法は、非常に柔軟なモデルをモデルのクラスに含めることです。おそらく、数百のコンポーネントを持つ通常の混合モデル、またはディリクレプロセス混合です。このモデルが最適である場合は、他のモデルが不十分である可能性があります。
このホワイトペーパーでは、理論的に優れた議論があり、実際にモデルを選択する方法の例を順を追って説明します。