残念ながら、この質問には良い答えがありません。尤度にペナルティを与えるいくつかの基準(AIC、BICなど)を使用して、絶対誤差、二乗誤差を最小化し、尤度を最大化するという事実に基づいて、最も一般的な選択肢をいくつか選択できます。問題は、これらの基準のどちらも客観的に最適なモデルを選択することはできず、比較した最高のモデルを選択できることです。もう1つの問題は、最適化を行うと、常にローカルな最大値または最小値になる可能性があることです。さらに別の問題は、モデル選択の基準の選択が主観的であることです。多くの場合、あなたは意識的に、または半意識的に、あなたが興味を持っているものを決定し、それに基づいて基準を選択します。用例、AICではなくBICを使用すると、より少ないパラメーターでより節約的なモデルになります。通常、モデリングについては、宇宙に関するいくつかの一般的な結論につながるより節約的なモデルに興味がありますが、予測についてはそうである必要はなく、時にはより複雑なモデルがより良い予測力を持つことができますありません)。さらに他のケースでは、実際の理由でより複雑なモデルが好まれる場合があります。たとえば、MCMCを使用してベイジアンモデルを推定する場合、階層ハイパープライアを使用したモデルは、単純なモデルよりもシミュレーションで優れた動作をすることができます。一方、一般的には過剰適合を恐れていますそして、より単純なモデルは過剰適合のリスクが低いため、より安全な選択です。これの良い例は、自動的に段階的にモデルを選択することです。これは一般に推奨されません。推定値がオーバーフィットおよびバイアスされやすいためです。また、最も単純なモデルが好ましいものであるという哲学的議論、Occamのカミソリもあります。また、ここではさまざまなモデルの比較について説明していることに注意してください。実際の状況では、さまざまな統計ツールを使用してさまざまな結果につながる可能性があるため、方法を選択する追加のレイヤーがあります!
これはすべて、私たちが決して確信できないという悲しい、しかし面白い事実につながります。私たちは不確実性から始め、それに対処するための方法を使用します。これは逆説的かもしれませんが、ことがわかっているため、統計を使用していることを思い出して、世界は不確実で確率的であると信じている(そうでなければ、預言者のキャリアを選択します)。客観的な停止ルールはありません。複数の可能なモデルがありますが、それらはすべて間違っています(決まり文句はごめんなさい!)複雑な(絶えず変化し、確率論的な)現実を単純化しようとするためです。私たちは、それらのいくつかが私たちの目的のために他のものよりも有用であり、時にはそうすることがありますさまざまな目的に役立つさまざまなモデルを見つけます。一番下に移動すると、多くの場合、未知のモデルが作成されます。θ、ほとんどの場合、決して知ることができないか、存在しないことさえあります(人口はμ年齢のため?)。ほとんどのモデルは何ではありません、現実を記述するさえしようと、むしろ抽象化と一般化を提供するため、「正しい」または「正しい」ことはできません。
さらに詳しく調べてみると、現実には「確率」というものは存在しないことがわかります。それは、私たちの周りの不確実性の近似値であり、ファジィ論理などの別の近似方法もあります(Kosko、1993を参照)議論のために)。私たちの方法の基礎となっている非常に基本的なツールや定理でさえも近似値であり、可能なものだけではありません。このような設定では、単純に確信が持てません。
あなたが探している停止規則は、常に問題固有で主観的です。つまり、いわゆる専門的な判断に基づいています。ちなみに、専門家は(で論文や書籍で復活例えば素人よりも自分の判断で、多くの場合ではない、より良い、時には悪化していることを示した研究例がたくさんあるダニエル・カーネマンはしやすいながら)、過信(これは実際にはなぜすべきではないかに関する議論モデルについて「確信する」ことを試みる)。
Kosko、B.(1993)。ファジー思考:ファジーロジックの新しい科学。ニューヨーク:ハイペリオン。