タグ付けされた質問 「bayesian」

ベイズ推定は、モデルパラメータを確率変数として扱い、ベイズの定理を適用して、観測されたデータセットを条件とするパラメータまたは仮説に関する主観的な確率ステートメントを推定することに依存する統計的推定の方法です。


1
限界尤度を推定するのが難しい/扱いにくいのはなぜですか?
私がここで尋ねる一般的に基本的な質問がありますが、これはしばらくの間私を悩ませてきました。私がベイジアン統計を読んだことのほとんどを通して、それは事実上、限界尤度はしばしば扱いにくいか、推定することが難しいと述べました。どうして? しばしば述べられる理由には、推定される積分/総和の高次元の性質に関するステートメント、または可能なモデルの領域が無限であるというステートメントが含まれます。 このコミュニティに、理由を掘り下げ、この問題を簡単な言葉で説明することをお願いします。 リソースへのリンクもいただければ幸いです。これを明確に説明するリソースを探すために用語をグーグルで検索しましたが、それらのほとんどは説明なしで問題を述べているだけです。また、機械学習の本のパターン認識とケビンマーフィーの機械学習の本も持っています。私はこれらのテキストの説明に満足していないので、明確でシンプルなものを探しています。

2
以前のクラスの確率分布をロジスティック回帰に組み込む
ロジスティック回帰やランダムフォレストなどの分類器に事前クラス確率分布を組み込む方法についての記事や講義が見つからないことに驚いています。 だから私の質問は: 以前のクラスの確率分布をロジスティック回帰またはランダムフォレストに組み込むにはどうすればよいですか? 以前のクラス確率分布を組み込むことは、ベイジアン機械を使用する必要があることを意味しますか? 私はクラスaがクラスbよりもはるかに可能性が高いことを知っている分類タスクに直面しています。 アドホックな解決策は、クラスAのサンプルをトレーニングセットに含めるだけですが、これに関する理論的な結果はありますか? 私が考えたのは、決定しきい値を0.5からこの以前の不均衡を考慮した値に変更することでした。しかし、それが理論的に理にかなっているのかどうかさえわかりません。決定を下す準​​備ができた時点で、すでにすべての特徴値を調べているため、事前確率ではなくクラスの条件付き確率を気にする必要があるためです。

1
二項一様ベイズ統計
パラメータの事前分布が均一である二項分布があるとします。パラメータの事後分布を取得するにはどうすればよいですか?

1
ベイジアンp値とは何ですか?
私は、頻出のp値を理解しているが、統計に対するベイジアンアプローチの基礎を理解しているだけの読者を満足させる答えを探しています。 現在のところ、グーグル検索では、ウィキペディアのページや他の一般に受け入れられているリソースの定義は明らかにされていません。 この質問は関連しているようですが、ユーザーが実際にベイズのp値を計算していないことが判明したため、実際にはそうではありません。ただし、受け入れられた回答は、ベイズのp値とは何かを説明するこのゲルマン論文にリンクしています。

3
ベイジアンはどのくらい正確に確率を定義(または解釈)しますか?
ベイジアン対頻度論者を理解しようとする一連の流れの一部:1 2 3 4 5 6 7 ベイジアンと常連がどのように仮説の選択にアプローチするかについては違いがあると思いますが、それが確率をどのように見ているのかを私に説明するのかどうか、どのように説明するのかはよくわかりません。 私が理解していることから、Wikiによれば、頻度論者は確率を次のように「定義」しています: 確率空間与えられた場合、、、ここで、は実施された試行の数であり、はそれらの試行でAが発生した回数です。∀ A ∈ F P(A )≈ N A(Ω,F,P)(Ω,F,P)(\Omega, \mathscr{F}, \mathbb{P})∀A∈F∀A∈F\forall A \in \mathscr{F} ntnAP(A)≈nAntP(A)≈nAnt\mathbb{P}(A) \approx \frac{n_A}{n_t}ntntn_tnAnAn_A さらに、です。P(A)=limnt→∞nAntP(A)=limnt→∞nAnt\mathbb{P}(A) = \lim_{n_t \to \infty} \frac{n_A}{n_t} では、ベイジアンはどのように確率を定義するのでしょうか?上記は、確率を定義することに加えて、イベントの確率を計算する1つのアプローチのようです。 ベイジアンは事前確率を仮定し、いくつかの試行を行ってから確率を更新するように見えますが、それが実際に確率がどのように定義されているかを説明しているようには見えません。 Wikiは、「ベイジアン確率は、知識の状態または信念の状態を表す目的で割り当てる量です」と述べています。 どういう意味ですか?州は同義語ですか?たとえば、特定のコインが公正であるというウォルターの信念の状態は0.1で表され、同じコインが公正であるというジェシーの信念の状態は0.2で表されます。新しい情報があれば、ウォルターの信念の状態は0.96になり、ジェシーの信念の状態は0.03になる可能性があります。それで、当初、ウォルターはコインが公正であると信じる傾向が少なかったが、後にジェシーはコインが公正であると信じる傾向が強くなったのだろうか? 上記のような常連客のようなシンボルに関して何かを期待しています。 同じWikiページでは、「確率のベイジアン解釈は、仮説、つまり真理または誤りが不確かな命題を用いた推論を可能にする命題論理の拡張と見なすことができます」と述べています。それぞれブール論理。


4
ベイジアンフレームワークではどのようにデータが生成され、データを生成するパラメーターの性質は何ですか?
私はベイジアン統計を再学習しようとしていました(私が最終的にそれを得たと思うたびに、以前に考慮しなかった何かがポップアウトします...)。しかし、データ生成プロセスが(私にとって)明確ではありませんでした。ベイジアンフレームワークでは実際にそうです。 頻出主義の枠組みは私には明らかです。いくつかの「真の」パラメータあり、そのパラメータは、パラメータ化する分布に従ってデータを生成します。θθ\theta ただし、ベイジアン設定では、パラメーターを確率変数としてモデル化します。その部分は私を混乱させません。ベイジアンはこの確率をそれ自体の信念の不確実性として解釈するので、それは理にかなっています。彼らは確率を繰り返し不可能なイベントに割り当てても大丈夫です。だから私が「ベイズ主義」を解釈した方法は、データを生成するいくつかのパラメータがあると信じているということでした、それは決定的には不明ですが、それでも「自然」によって決定されたら修正されましたすることが)。それにもかかわらず、それは修正され、それゆえ、それは「再現不可能な出来事」でした。再現性はありませんでしたが、信念を更新することのみを試みていますθθ\theta与えられたデータ。したがって、データは、確率分布によって考慮されている(以前の)パラメーターのいずれかによって生成された可能性がありますが、それでもパラメーターは固定されており、不明です。確率値を付けているだけです。 この見解では、データ生成プロセスが常連客のプロセスとほぼ同じであると想定することは私にとって理にかなっています。「自然」は、「真の」「前の」分布を使用してパラメーターを選択し、確率変数がその「真の」(しかし固定された)実現を実現すると、観測したデータの生成を開始します。θθ\thetaP∗(θ )P∗(θ)P^*(\theta) これは、ベイジアンフレームワークでのデータ生成プロセスを解釈する標準的な方法ですか? 私の見解の主なものは、パラメーターが決定的に固定され(rvの実現として見られる)、に従ってデータを生成することです。したがって、私の見解のもう1つの非常に重要な点は、私にとって、以前のものは、パラメータを作成する固定された(反復不可能な)イベントに対する不確実性を表現する定量化可能な方法にすぎないということです。それは人々が以前のをどのように解釈するのですか?θθ\thetaθθ\thetaθθ\thetaP(θ )P(θ)P(\theta) ユーモラスなメモ: 彼女がどうやってそれをやっているのかを「自然」に尋ねて、これを一度に解決することができればいいのに...


2
さまざまな規模の企業の機関車の問題
私はThink Bayes(ここから無料です:http : //www.greenteapress.com/thinkbayes/)で作業しており、エクササイズ3.1に取り組んでいます。問題の概要は次のとおりです。 「鉄道は機関車に1..Nの順序で番号を付けています。ある日、60番の機関車が見えます。鉄道が持っている機関車の数を見積もります。」 このソリューションは、次のように尤度関数と指数事前分布で見つかります。 class Train(Suite): def __init__(self, hypos, alpha=1.0): # Create an exponential prior Pmf.__init__(self) for hypo in hypos: self.Set(hypo, hypo**(-alpha)) self.Normalize() def Likelihood(self, data, hypo): if hypo < data: return 0 else: return (1.0/hypo) 概念的には、これは、仮説の1つより大きいトレイン番号(1 ... 1000)が表示された場合、小さい仮説すべてが正しい可能性がゼロであることを示しています。残りの仮説には、1 / number_of_trainsの確率でこの番号の列車が表示されます。 私が作成者に取り組んでいる演習では、少し余分なものを追加します。これは、会社が1つしかないことを前提としています。ただし、実際には、大企業と中小企業、および大企業(どちらも同じくらい可能性があります)が混在しています。ただし、これは、大企業の列車の方が多いため、大企業の列車を見る可能性が高くなることを意味します。 ここで問題は、これを尤度関数にどのように反映するかです。 これはスタックオーバーフローではないので、実際にコーディングのヘルプを求めているのではなく、尤度関数の観点からこの問題についてどのように考えるかについて単に助けているだけかもしれません。

1
ベイジアン95%予測区間の解釈
次の二変量回帰モデルを仮定 IIDであるのために。U 、I N (0 、σ 2 = 9 )I = 1 、... 、n個y私= βバツ私+ u私、yi=βxi+ui, y_i = \beta x_i + u_i, あなた私uiu_iN(0 、σ2= 9 )N(0,σ2=9)N(0, \sigma^2 = 9)i = 1 、… 、ni=1,…,ni = 1,\ldots, n noninformative前想定、のための事後PDFことを示すことができるである ここでβ P (β | Y)= (18 π )- 1p (β)∝ 定数p(β)∝constantp(\beta) \propto \text{constant}ββ\beta …

1
ベイズ線形回帰の事後分布
私はベイジアン線形回帰の使用を研究してきましたが、私は混乱している例を見つけました。 モデルを考える: y=βX+ϵy=βX+ϵ{\bf y} = {\bf \beta}{\bf X} + \bf{\epsilon} 仮定すると、ϵ∼N(0,ϕI)ϵ∼N(0,ϕI){\bf \epsilon} \sim N(0, \phi I)およびp(β,ϕ)∝1ϕp(β,ϕ)∝1ϕp(\beta, \phi) \propto \frac{1}{\phi}、 どのようにp(β|ϕ,y)p(β|ϕ,y)p(\beta|\phi, {\bf y})到達しますか? ここで、p(β|ϕ,y)∼N(XTX)−1XTy,ϕ(XTX)−1)p(β|ϕ,y)∼N(XTX)−1XTy,ϕ(XTX)−1)p(\beta|\phi, {\bf y}) \sim N({\bf X}^{\text{T}}{\bf X})^{-1}{\bf X}^{\text{T}}{\bf y}, \phi ({\bf X}^{\text{T}}{\bf X})^{-1})。

1
逆共分散行列の前のウィッシュアートのパラメーター(スケール行列と自由度)の超優先分布
jags / rjags / Rのウィッシュアートの事前分布を使用して、さまざまなサブ母集団にわたる一連の測定値のいくつかの逆共分散行列を推定しています。 以前の逆共分散行列(ウィッシュアート分布)にスケールマトリックスと自由度を指定する代わりに、スケール母とハイパー自由度にハイパープライアを使用して、サブ母集団間の変動から推定できるようにします。 スケールマトリックスと自由度のハイパープライアに関する文献はあまりありません。ほとんどの文献は、共分散/逆共分散の前の選択で階層を停止するようであり、および/または異なる母集団にわたる複数の共分散行列ではなく単一の共分散行列の推定に焦点を当てています。 これをどのように行うかについての提案-スケールマトリックスとwishart分布の自由度に使用するために推奨されるハイパープライオ分布は何ですか?これについて私が見逃している文献はありますか?

1
マウス補完機能はどのように機能しますか?
「マウス:Rの連鎖方程式による多変量代入(JSS 2011 45(3))」で説明されているように、誰かがマウス機能を使用した経験があるかどうか疑問に思いました。それぞれが欠落しているデータの程度が異なる多数の変数を含むデータセットがあります。 私の主な質問は、ベイジアン線形回帰を使用して欠損データを補完miceすることですが、最も重要なものから最も重要でないものまでの予測変数を自動的に使用しますか?また、帰属されたすべてのデータセットをおそらく平均化することは一般的ですか?

1
単純ベイズ分類器でのカーネル密度推定の使用?
この質問は、ここでの私の以前の質問のフォローアップであり、この質問に も意図的に関連しています。 このwikiページ 確率密度値のトレーニングセットについて想定正規分布からの実際の確率値よりベイズ事後むしろを計算するために使用されます。しかし、トレーニングセットが正規に分布していない場合、トレーニングセットのカーネル密度推定から取得した密度値を使用してベイジアン事後を計算することは同等に有効でしょうか? 目的のアプリケーションでは、このカーネル密度の推定は、MC手法によって生成された理論的に理想的な経験的データセットから取得されます。
9 bayesian  kde 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.