あなたは本質的に非常に興味深い質問をしています。「MAP Bayesian」最大事後推定または「Real Bayesian」を使用して予測する必要があります。
の真の分布を知っていて、次にMAP推定を使用して、次の100のフリップ結果で100の予測を行いたいと仮定します。20頭と80尾を推測するのではなく、常にフリップが尾であると推測する必要があります。これは「MAP Bayesian」と呼ばれ、基本的にはP(H)=0.22080
argmaxθf(x|θ)
そうすることで、予測誤差(0-1損失)を最小化できることを証明するのは難しくありません。証明は、統計学習入門の〜ページ53にあります。
これを行う別の方法として、「リアルベイジアン」アプローチがあります。基本的に、「最も高い確率で結果を選択するが、すべてのケースを確率的に考慮する」ことを試みていないので、誰かが「次の100を予測する」フリップを頼んだ場合、あなたは彼/彼女を一時停止する必要があります。各結果の確率的情報が消えます。代わりに、結果を知った後に何をしたいのか尋ねる必要があります。
彼/彼女がいくつかの損失関数を持っていると仮定します(0-1の損失には必要ありません、例えば、損失関数は、頭を逃した場合、1 ドルを支払う必要がありますが、尾を逃した場合、あなたは支払う必要があります5 ドル、つまり不均衡な損失)を予測し、結果分布に関する知識を使用して、分布全体の損失を最小限に抑える必要があります
∑x∑yp(x,y)L(f(x),y)
つまり、「段階的な方法」ではなく、損失に対する分布に関する知識を取り入れて、予測を取得し、次のステップを実行します。
さらに、多くの可能性のある結果がある場合に何が得られるかについて、非常に良い直観を持っています。結果の数が多く、確率質量が広く拡散している場合、MAP推定はうまく機能しません。100のサイドサイコロがあり、本当の分布を知っていると考えてください。ここで、、およびP (S 2)= P (S 3)= P (S 100)= 0.9 / 99 = 0.009090P(S1)=0.1P(S2)=P(S3)=P(S100)=0.9/99=0.009090。MAPで何をしますか?それは他と比較して最大の確率を持っているので、あなたはいつもあなたが最初の側を得ると推測します。ただし、90 %の間違いが発生します!!S190%