タグ付けされた質問 「bayesian」

ベイズ推定は、モデルパラメータを確率変数として扱い、ベイズの定理を適用して、観測されたデータセットを条件とするパラメータまたは仮説に関する主観的な確率ステートメントを推定することに依存する統計的推定の方法です。

3
ベイジアンパラメータ推定またはベイジアン仮説検定?
ベイジアンコミュニティ内では、ベイジアンパラメータの推定とベイジアン仮説の検定のどちらを行うべきかについて議論が続いているようです。これについて意見を募集することに興味があります。これらのアプローチの相対的な長所と短所は何ですか?どちらが適切なのでしょうか?パラメータ推定と仮説検定の両方を行うべきですか、それとも1つだけですか?

2
コイン投げのベータ分布
クルシュケのベイジアンの本は、コインを弾くためのベータ分布の使用に関して、 たとえば、コインに表側と裏側があるという知識以外に事前知識がない場合、これは以前にa = 1とb = 1に対応する1つの頭と1つの尾を観察したことと同じです。 なぜ1つの頭と1つの尾を見たことに等しい情報がないのですか?0頭と0尾は私にとってより自然に見えます。

2
ベイズ分類器が理想的な分類器であるのはなぜですか?
これは、カテゴリーの基礎となる確率構造が完全にわかっている理想的なケースと見なされます。 なぜベイズ分類器を使用すると、達成可能な最高のパフォーマンスが得られるのですか? これの正式な証明/説明は何ですか?常にベイズ分類器をベンチマークとして使用して、他のすべての分類器のパフォーマンスを比較します。

2
ベイジアン手法は本質的に逐次的ですか?
つまり、頻出主義の方法で逐次分析(収集するデータの量が事前に正確にわからない)を行うには、特別な注意が必要です。p値が十分に小さくなるか、信頼区間が十分に短くなるまで、データを収集することはできません。 しかし、ベイジアン分析を行うとき、これは懸念事項ですか?信頼できる間隔が十分に小さくなるまで、データ収集などを自由に行うことができますか?

3
周波数についてのベイズ推定における事前のベータ共役の理解
以下は、ボルスタッドの「ベイジアン統計入門」からの抜粋です。 そこにいるすべての専門家にとって、これは些細なことかもしれませんが、ある値の事後確率を計算するために統合を行う必要がないと著者が結論付けている方法はわかりません。比例であり、すべての項がどこから来たのか(尤度x事前)である2番目の式を理解しています。さらに、分子だけが直接比例しているので、分母を気にする必要はありません。しかし、3番目の方程式に移って、ベイズ規則の分母を忘れていませんか?どこに行ったの?そして、ガンマ関数によって計算された値、それは定数ではありませんか?定数はベイズの定理で相殺されませんか?ππ\pi

1
統計学者は実際の応用研究でジェフリーズの事前を使用しますか?
大学院の統計推論クラスでジェフリーズの以前のことを知ったとき、私の教授たちは、誰もがそれを使用するというよりも、歴史的な理由から、それが興味深いものであるように思わせました。次に、ベイジアンデータ分析を行ったときに、ジェフリーズの事前分布を使用するように求められることはありませんでした。実際にこれらを実際に使用する人はいますか?その場合(またはそうでない場合)、その理由または理由は何ですか?なぜ一部の統計学者はそれを真剣に受け止めないのですか?

1
PyMC3でのベイジアンモデルの選択
私のデータでベイジアンモデルを実行するためにPyMC3を使用しています。 私はベイジアンモデリングに不慣れですが、このサイトのいくつかのブログ投稿、Wikipedia、およびQAによると、ベイズ係数とBIC基準を使用して、データを最もよく表すモデル(生成するモデル)を選択できるようにする有効なアプローチのようです私のデータ)。 ベイズ係数を計算するには、比較するモデルの相対的な尤度が必要です。少し混乱するかもしれませんが、可能性を得るには2つの方法があると思います(間違っている場合は修正してください)。 モデルが単純な場合の代数的方法:ウィキペディアのベイズ因子の例のページを参照 数値的な方法:これは、MCMCアルゴリズムでPyMC3を実行する方法です。 PyMC3で尤度にアクセスしてモデルを比較するにはどうすればよいですか?私model.logpは、ドキュメントによると、「対数確率密度関数」である方法を見つけました。それを使用して可能性を取得できますか? おまけの質問:2つのモデルを比較すると、両方の尤度の比率が計算されます。複数のモデルを比較したい場合はどうなりますか? PyMC3の具体的な例は非常に役立ちます。

2
Normal-Wishart後部の派生
Normal-Wishart事後の導出に取り組んでいますが、パラメーターの1つ(スケールマトリックスの事後、下部を参照)で行き詰まっています。 コンテキストと完全性のために、ここにモデルと残りの派生があります: xiμΛ∼N(μ,Λ)∼N(μ0,(κ0Λ)−1)∼W(υ0,W0)xi∼N(μ,Λ)μ∼N(μ0,(κ0Λ)−1)Λ∼W(υ0,W0)\begin{align} x_i &\sim \mathcal{N}(\boldsymbol{\mu}, \boldsymbol{\Lambda})\\ \boldsymbol{\mu} &\sim \mathcal{N}(\boldsymbol{\mu_0}, (\kappa_0 \boldsymbol{\Lambda})^{-1})\\ \boldsymbol{\Lambda} &\sim \mathcal{W}(\upsilon_0, \mathbf{W}_0) \end{align} (比例定数まで)3つの要因のそれぞれの展開形式は次のとおりです。 可能性: N(xi|μ,Λ)∝|Λ|N/2exp(−12∑i=1N(xTiΛxi−2μTΛxi+μTΛμ))N(xi|μ,Λ)∝|Λ|N/2exp⁡(−12∑i=1N(xiTΛxi−2μTΛxi+μTΛμ))\begin{align} \mathcal{N}(\mathbf{x}_i &| \boldsymbol{\mu}, \boldsymbol{\Lambda}) \propto\notag\\ &|\boldsymbol{\Lambda}|^{N/2} \exp{\left(-\frac{1}{2}\sum_{i=1}^N \left( \mathbf{x}_i^T\boldsymbol{\Lambda}\mathbf{x}_i - 2 \boldsymbol{\mu}^T \boldsymbol{\Lambda}\mathbf{x}_i + \boldsymbol{\mu}^T\boldsymbol{\Lambda}\boldsymbol{\mu}\right) \right)} \end{align} 以前の通常: N(μ|(μ0,κ0Λ)−1)∝|Λ|1/2exp(−12(μTκ0Λμ−2μTκ0Λμ0+μT0κ0Λμ0))N(μ|(μ0,κ0Λ)−1)∝|Λ|1/2exp⁡(−12(μTκ0Λμ−2μTκ0Λμ0+μ0Tκ0Λμ0))\begin{align} \mathcal{N}(\boldsymbol{\mu} &| (\boldsymbol{\mu}_0, \kappa_0 \boldsymbol{\Lambda})^{-1}) \propto\notag\\ &|\boldsymbol{\Lambda}|^{1/2} \exp{\left(-\frac{1}{2}\left( \boldsymbol{\mu}^T\kappa_0 \boldsymbol{\Lambda}\boldsymbol{\mu} - …

1
最小リスク分類子の計算しきい値?
2つのクラスとに属性あり、分布がととします。次のコストマトリックスの前のが等しい場合:、C 2、X N(0 、0.5 )N(1 、0.5 )P (C 1)= P (C 2)= 0.5C1C1C_1C2C2C_2xxxN(0,0.5)N(0,0.5) \cal{N} (0, 0.5)N(1,0.5)N(1,0.5) \cal{N} (1, 0.5)P(C1)=P(C2)=0.5P(C1)=P(C2)=0.5P(C_1)=P(C_2)=0.5 L=[010.50]L=[00.510]L= \begin{bmatrix} 0 & 0.5 \\ 1 & 0 \end{bmatrix} なぜ、は最小リスク(コスト)分類器のしきい値ですか?x0&lt;0.5x0&lt;0.5x_0 < 0.5 これは私が誤解している私のメモの例です(つまり、このしきい値にどのように到達したのですか?) 編集1:尤度比のしきい値には、P(C1)/ P(C2)を使用できると思います。 編集2:しきい値に関するいくつかのテキストをパターンのDuda Bookから追加します。

2
イベント研究方法論へのベイズのアプローチの計量経済学
イベント研究は、経済への影響と金融で広く行われ、イベントが株価に与える影響を特定しますが、ほとんどの場合、頻度論的推論に基づいています。イベントウィンドウとは異なる参照期間にわたるOLS回帰は、通常、資産の通常の収益をモデル化するために必要なパラメーターを決定するために使用されます。次に、指定されたイベントウィンドウから間のイベント後のアセットの累積異常リターン()の統計的有意性を決定します。仮説検定を使用して、これらのリターンが有意であり、実際に異常であるかどうかを判断します。したがって:i T 1 T 2車CAR\text{CAR}私iiT1T1T_1T2T2T_2 H0:車私= 0H0:CARi=0H_0 : \text{CAR}_i = 0、ここで 車私= ∑T2t = T1AR私、t= ∑T2t = T1(r私、t− E [ r私、t] )CARi=∑t=T1T2ARi,t=∑t=T1T2(ri,t−E[ri,t])\text{CAR}_i = \sum_{t=T_1}^{T_2} \text{AR}_{i,t} = \sum_{t=T_1}^{T_2} \left( r_{i,t} -\mathbb{E}[r_{i,t}] \right)、および E [ r私、t]E[ri,t]\mathbb{E}[r_{i,t}]は、モデルによって予測された資産の収益です。 観測数が十分に多い場合、資産収益の分布の漸近的正規性を仮定できますが、これは、サンプルサイズが小さい場合には検証されない場合があります。 このため、(訴訟などで必要とされる)単一企業、単一イベントの調査は、ベイジアンアプローチに従う必要があると主張できます。これは、無限に多くの繰り返しを想定すると、ケースの場合よりも「検証されない」ためです。複数の企業の。しかし、頻出主義的アプローチは依然として一般的な慣行です。 このテーマに関する乏しい文献を考えると、私の質問は、ベイジアンアプローチを使用して、イベントスタディに上手くアプローチする方法です。 この問題は、経験的な企業金融のコンテキスト内で発生しますが、それは、ベイジアン回帰と推論の計量経済学、および頻度論的アプローチとベイジアンアプローチの背後にある推論の違いについてです。具体的には: ベイジアンアプローチを使用してモデルパラメーターの推定に最も近づくにはどうすればよいですか(ベイジアン統計の理論的理解はあるものの、経験的研究にそれを使用した経験はほとんどない)。 (モデルからの通常のリターンを使用して)累積異常リターンが計算されたら、統計的有意性をどのようにテストしますか? これはMatlabでどのように実装できますか?

1
多変量正規分布と共変量を使用したベイズモデリング
説明変数があるとします。ここで、sは特定の座標を表します。また、応答変数Y = ( Y (s 1)、… 、Y (s n))があります。これで、両方の変数を次のように組み合わせることができます。X=(X(s1),…,X(sn))X=(X(s1),…,X(sn)){\bf{X}} = \left(X(s_{1}),\ldots,X(s_{n})\right)sssY=(Y(s1),…,Y(sn))Y=(Y(s1),…,Y(sn)){\bf{Y}} = \left(Y(s_{1}),\ldots,Y(s_{n})\right) W(s)=(X(s)Y(s))∼N(μ(s),T)W(s)=(X(s)Y(s))∼N(μ(s),T){\bf{W}}({\bf{s}}) = \left( \begin{array}{ccc}X(s) \\ Y(s) \end{array} \right) \sim N(\boldsymbol{\mu}(s), T) この場合、我々は単に選択とTは関係について説明共分散行列であり、X及びYは。これは、sでのXとYの値のみを示します。XとYの他の場所からのポイントが多いため、次のように W(s)のより多くの値を記述できます。μ(s)=(μ1μ2)Tμ(s)=(μ1μ2)T\boldsymbol{\mu}(s) = \left( \mu_{1} \; \; \mu_{2}\right)^{T}TTTXXXYYYXXXYYYsssXXXYYYW(s)W(s){\bf{W}}(s) (XY)=N((μ11μ21),T⊗H(ϕ))(XY)=N((μ11μ21),T⊗H(ϕ))\left( \begin{array}{ccc} {\bf{X}} \\ {\bf{Y}} \end{array}\right) = N\left(\left(\begin{array}{ccc}\mu_{1}\boldsymbol{1}\\ \mu_{2}\boldsymbol{1}\end{array}\right), T\otimes H(\phi)\right) とYのコンポーネントを再配置して、列内のすべてのX (s i)を取得し、その後、すべてのY (s i)を連結します。各成分H (ϕ )i …

1
ベイズの定理の誤用の例
このMath Overflowコミュニティの質問は、「非数学的な文脈における数学の定理の適用を含む悪い議論の例」を尋ね、病理学的に適用された数学の興味深いリストを作成しました。 ベイジアン推論の病理学的使用の同様の例について疑問に思っています。誰でも、ベイジアン手法を気まぐれに使用する学術記事、風変わりなブログ投稿に遭遇しました。
11 bayesian 


2
ラプラス平滑化とディリクレ事前
ラプラス平滑化(または加法平滑化)のウィキペディアの記事では、ベイズの観点から、 これは、事前分布としてパラメーターを持つ対称ディリクレ分布を使用して、事後分布の期待値に対応します。αα\alpha それが実際にどのように真実であるかについて私は困惑しています。誰かが私にそれらの2つのものが同等である方法を理解するのを手伝ってくれる? ありがとう!

1
予測間隔=信頼できる間隔?
予測間隔と信頼できる間隔が同じことを評価するかどうか疑問に思っています。 たとえば、線形回帰の場合、近似値の予測区間を推定するとき、値が下がると予想される区間の限界を推定します。信頼区間とは逆に、平均値などの分布パラメーターに焦点を合わせるのではなく、説明変数が特定のX値に対して取ることができる値に焦点を合わせます(と想定)。Y = +のB 。バツ(1 - α )%(1−α)%(1-\alpha)\% Y= a + b 。バツ Y=a+b。バツ\ Y = a + b.X ベイジアンフレームワーク内の特定の値の近似値を事後確率分布から推定する場合、信頼できる区間を推定できます。この間隔は、近似値について同じ情報を提供しますか?バツバツX

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.