ベイジアン推論について読んでいて、「限界尤度の数値積分は高すぎる」というフレーズに出会いました
私は数学のバックグラウンドを持っていませんが、ここで高価とはどういう意味か疑問に思っていましたか?それは単に計算能力の観点からですか、それとも何かありますか。
ベイジアン推論について読んでいて、「限界尤度の数値積分は高すぎる」というフレーズに出会いました
私は数学のバックグラウンドを持っていませんが、ここで高価とはどういう意味か疑問に思っていましたか?それは単に計算能力の観点からですか、それとも何かありますか。
回答:
ベイジアン推論の数値的方法を含む計算問題の文脈では、「あまりにも高価」というフレーズは、一般に2つの問題を指す場合があります
いずれの場合も、「予算」を構成する計算リソースは、CPUサイクル(時間の複雑度)、メモリ(スペースの複雑度)、または通信帯域幅(計算ノード内または計算ノード間)などで構成されます。2番目の例では、「高すぎる」とは手に負えないことを意味します。
ベイジアン計算のコンテキストでは、引用は、多くの変数の周辺化の問題を指している可能性があります。
たとえば、この最近の論文の要約は始まります
統合は次元の呪いの影響を受け、問題の次元が大きくなるとすぐに手に負えなくなります。
そして言い続ける
たとえば、限界計算やモデル選択などに使用できるランダム化アルゴリズムを提案します。
(比較のために、この最近の本の章では、「あまり高価ではない」と考えられる方法について説明しています。)
離散ケースの例を挙げて、なぜ統合/合計が非常に高価なのかを示します。
確率的グラフィカルモデルの文献、周辺分布を計算するよう「推論」を実行する「ブルートフォース」アプローチと呼ばれます。名前では、それが高価であることを知っているかもしれません。そして、人々は推論を実行するために他の多くの方法を使用します。例えば、周辺分布を効果的に取得します。おおよその推論などを含む「その他の方法」
通常、ベイジアン推論を実行するとき、たとえば迷惑な変数を介した激しい統合に遭遇するのは簡単です。別の例として、この場合の尤度関数からの数値サンプリングがあります。これは、所定の分布からランダムサンプリングを実行することを意味します。モデルパラメーターの数が増えると、このサンプリングが非常に重くなり、さまざまな計算手法が開発されて手順が高速化され、非常に高速な実装が可能になり、もちろん高い精度が保たれます。これらの技法は、たとえばMC、MCMC、Metropolis eccです。Gelman et。によるベイジアンデータ分析をご覧ください。それはあなたに幅広い紹介を与えるはずです!幸運を