ベイジアン統計が頻出法による推定が非常に困難なパラメーターを推定する方法の例


9

ベイジアン統計学者は、「ベイジアン統計は、頻度論的手法による推定が非常に困難なパラメーターを推定できる」と主張しています。このSASドキュメントからの次の引用は、同じことを言っていますか?

これは、漸近近似に依存せずに、データを条件として正確な推論を提供します。小さなサンプルの推論は、大きなサンプルがある場合と同じように進行します。ベイジアン分析では、「プラグイン」手法(関数の推定されたパラメーターをプラグインして関数を推定する方法)を使用せずに、パラメーターの関数を直接推定することもできます。

私はいくつかの教科書で同様の声明を見ましたが、どこで覚えていません。誰かが例を挙げてこれを説明してくれませんか?


明日太陽が昇る確率はどれくらいですか?en.wikipedia.org/wiki/Sunrise_problem この例は、期待していたよりも簡単なものになる可能性があります
Hugh

見積もりを質問に直接入力できますか?タイトルは2番目の箇条書きとは関係がないようです。
Hugh

1
その引用のステートメントは、(a)「正確」はそこに何も意味しないこと、および(b)プラグインの批評は、選択された損失関数に応じて、完全な事後予測を考慮し、別の推定を考慮しない場合にのみ適用されます。推定のため。いくつかの回答については、この他の質問を参照してください。
西安

回答:


8

私はその引用に反対します:

  1. θθ
  2. π(θ|D)π(θ|D)π(θ)θ事前確率xのペアによって提供されるフレームワーク内の確率ステートメントのみ。ペアの1つの用語を変更すると、事後と推論が変更されますが、単一の事前確率または尤度を防御するための一般的な引数はありません。
  3. 同様に、このSASドキュメントの同じページにある「真のパラメーターは95%の信頼できる間隔で0.95の確率で落ちる」などの他の確率ステートメントは、事後分布のフレームワークに関連していますが、絶対値ではありません。
  4. f(x|θ)=g(x,z|θ)dz
    g(x,z|θ)(X,Z)Zθ(θ,Z)、共通の祖先からの個体群の進化には、二分木の潜在的なイベントが含まれます。このモデルは、ABCと呼ばれるアルゴリズムによる[近似]ベイジアン推論によって処理できますが、非ベイジアンソフトウェア解像度も存在します。
  5. しかし、そのような場合でも、ベイズ推論が唯一可能な解決策であるとは思いません。ニューラルネット、ランダムフォレスト、ディープラーニングなどの機械学習手法は、クロス検証によってサンプルをトレーニングし、[真のモデルの下で]期待値と見なせるエラーまたは距離基準を最小化するため、頻出法として分類できます。サンプル平均によって近似されます。たとえば、キングマンの合体モデルは、ベイジアン以外のソフトウェア解像度でも処理できます。
  6. h(θ)h(θ^)θ

それに関する限り、答えは良いです。MLメソッドには、理論ではまだ正当化されていない優れたパフォーマンスがあるため、ポイント5に反対します。また、「...真のモデル...」とはどういう意味ですか?間違いなく、これらの方法は人気がありますが、その人気は通常、「スケーリングする」能力によって正当化されます。残念ながら、非MLベイジアン手法や頻出手法によって提供される診断洞察の多くは、そのようなアプローチを使用すると失われます。特に、相互検証は他の手法よりも高いエラー率をもたらす可能性があります。Efron、1983、1986、JASAを参照してください。
Jan Galkowski

ありがとう。実際、私はMLメソッドに「優れた」パワーを与えることはせず、複雑なモデルに対して一部のMLの回答が提案される可能性があることだけを述べます。「真のモデル」とは、データがそのモデルによって生成されたと(誤って)仮定したメソッドのパフォーマンスの評価を意味します。これは、ほとんどの統計分析の欠点です。
西安
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.