タグ付けされた質問 「bayesian」

ベイズ推定は、モデルパラメータを確率変数として扱い、ベイズの定理を適用して、観測されたデータセットを条件とするパラメータまたは仮説に関する主観的な確率ステートメントを推定することに依存する統計的推定の方法です。

1
通常の可能性と通常の事前確率で正方形を完了するにはどうすればよいですか?
中断したところから正方形を完成させるにはどうすればよいですか?これまでのところ正しいですか? 私はの形式の通常の事前を持っています。P (β | σ 2)〜N(0 、σ 2 V )ββ\betap(β|σ2)∼N(0,σ2V)p(β|σ2)∼N(0,σ2V)p(\beta|\sigma^2)\sim \mathcal{N}(0,\sigma^2V) p (β| σ2)= (2 πσ2V)p2exp[ − 12つのσ2βTβ]p(β|σ2)=(2πσ2V)p2exp⁡[−12σ2βTβ]p(\beta|\sigma^2)=(2\pi\sigma^2V)^\frac{p}{2}\exp[-\frac{1}{2\sigma^2}\beta^T\beta] ここで、は です。P Σ iは= 1 β 2 IβTββTβ\beta^T\betaΣi = 1pβ2私∑i=1pβi2\sum\limits_{i=1}^p \beta_i^2 私の可能性は、の形式のデータポイントyの正規分布を持っていますp (y| β、σ2)〜N(B β、σ2私)p(y|β,σ2)∼N(Bβ,σ2I)p(y|\beta,\sigma^2)\sim\mathcal{N}(B\beta,\sigma^2I) p (y| β、σ2)= (2 πσ2V)ん2exp[ − 12つのσ2(Y - B β)T(Y - B β)]p(y|β,σ2)=(2πσ2V)n2exp⁡[−12σ2(y−Bβ)T(y−Bβ)]p(y|\beta,\sigma^2)=(2\pi \sigma^2V)^\frac{n}{2}\exp[-\frac{1}{2\sigma^2}({\bf y}-{\bf B}{\bf \beta})^T({\bf …

1
mcmcsamp関数を使用した分散の事後シミュレーション
mcmcsamp()関数を使用したlmer()モデルの分散コンポーネントの事後シミュレーションを取得したいと思います。実行する方法 ? たとえば、以下はlmer()フィッティングの結果です。 > fit Linear mixed model fit by REML Formula: y ~ 1 + (1 | Part) + (1 | Operator) + (1 | Part:Operator) Data: dat AIC BIC logLik deviance REMLdev 97.55 103.6 -43.78 89.18 87.55 Random effects: Groups Name Variance Std.Dev. Part:Operator (Intercept) 2.25724 1.50241 Part …

3
ベイズ計量経済学におけるガンマ分布のパラメータに関する質問
ウィキペディアのガンマ分布に関する記事には、2つの異なるパラメーター化手法がリストされています。そのうちの1つは、ベイズ計量経済学でおよびβ > 0として頻繁に使用され、αは形状パラメーター、βはレートパラメーターです。α > 0α>0\alpha>0β> 0β>0\beta>0αα\alphaββ\beta バツ〜G A M M A(α 、β)。X∼Gamma(α,β).X\sim \mathrm{Gamma}(\alpha,\beta). ゲイリー・コープによって書かれたベイズ計量経済学の教科書では、精度パラメーターあるガンマ分布、次の事前分布を1σ2= h1σ2=h\frac{1}{\sigma^2}=h H 〜G A M M A(S–− 2、ν––)、h∼Gamma(s_−2,ν_),h\sim \mathrm{Gamma}(\underline{s}^{-2},\underline{\nu}), ここで、は平均であり、v _は彼の付録によると自由度です。また、s 2は定義付きの標準エラーですs–− 2s_−2\underline{s}^{-2}ν––ν_\underline{\nu}s2s2s^2 s2= ∑ (y私- β^バツ私)ν。s2=∑(yi−β^xi)ν.s^2=\frac{\sum(y_i-\hat{\beta}x_i)}{\nu}. したがって、平均と分散が異なるため、私にとって、ガンマ分布のこれら2つの定義は完全に異なります。ウィキペディアの定義に従うと、平均はs _ − 2ではなく、なります。α / βα/β\alpha/\betas–− 2s_−2\underline{s}^{-2} 私はここで非常に混乱していますが、誰かが私がここで考えを強化するのを手伝ってくれませんか?

1
頻度論者は、バイナリ応答に関してグループAがグループBを上回る可能性をどのように計算しますか
...(オプション)Google Web Optimizerのコンテキスト内。 2つのグループとバイナリ応答変数があるとします。これで、次の結果が得られます。 オリジナル:401回の試行、125回の成功した試行 組み合わせ16:試行441件、成功141件 差は統計的に有意ではありませんが、Combination16がOriginalを上回る確率を計算できます。 「オリジナルを打つチャンス」を計算するために、私はベイジアンアプローチを使用しました。これがコードです: trials <- 10000 resDat<-data.frame("orig"=rbeta(trials,125+1,401-125+1), "opt"=rbeta(trials,144+1,441-144+1)) length(which(resDat$opt>resDat$orig))/trials これは0.6764になります。 頻度主義者が「打つチャンス...」を計算するために使用するテクニックはどれですか?たぶん、フィッシャーの正確確率検定のべき関数ですか? オプション:Google Webオプティマイザーのコンテキスト Google Webオプティマイザーは、多変量テストまたはA / Bテストを制御するためのツールです。これは導入部にすぎません。これは質問自体には関係ないためです。 上記の例は、ここにあるGoogle Webオプティマイザー(GWO)の説明ページ(「推定コンバージョン率の範囲」のセクションまでスクロールしてください)、特に図2から取得したものです。 ここで、GWOは67.8%を「オリジナルを倒すチャンス」を提供しますが、これは私の結果とは少し異なります。私はグーグルがより頻繁な手法のようなアプローチを使用していると思います、そして私は疑問に思いました:それは何であることができるでしょうか? 編集:この質問は消える寸前だったので(私はその特定の性質が原因であると思います)、私は一般的な興味があると言い換えました。

1
ベイジアン対最大エントロピー
推論したい量が確率分布であると仮定します。私たちが知っているのは、分布が、たとえばその瞬間のいくつかによって決定された集合からのものであり、以前のです。EEEQQQ 最大エントロピー原理(MEP)は、からの相対的エントロピーが最も少ない(つまり、)は選択するのに最適です。一方、ベイズの選択規則には、ベイズの定理によってサポートされている事前分布を考慮して事後を選択するプロセスがあります。P⋆∈EP⋆∈EP^{\star}\in EQQQP⋆=argminP∈ED(P∥Q)P⋆=argminP∈ED(P‖Q)P^{\star}=\displaystyle \text{argmin}_{P\in E}D(P\|Q) 私の質問は、これら2つの推論方法の間に関係があるかどうか(つまり、2つの方法が同じ問題に適用され、共通点があるかどうか)です。または、ベイジアン推論での設定が上記の設定と完全に異なるかどうか。それとも意味がありませんか?!

1
非対称の事前知識を持つ多項分布のベイズ推定?
二項分布からいくつかのサンプルを取得するとします。私の以前の知識をモデル化する1つの方法は、パラメーターおよびベータ分布を使用することです。私が理解しているように、これは試験で「頭」を回見たのと同じです。そのため、本格的なベイジアン推論を行うための良い近道は、回の試行で頭を見た後の「頭」の確率の新しい平均としてを使用することです。β α α + β H + ααα\alphaββ\betaαα\alphaα + βα+β\alpha + \beta HのNh + αn + α + βh+αん+α+β\frac{h+\alpha}{n+\alpha+\beta}hhhんんn ここで、3つ以上の状態があると仮定します。そのため、多項分布からいくつかのサンプルを取得します。事前分布としてパラメーターを使用したディリクレ分布を使用するとします。ここでもショートカットとして、これをイベントの確率の事前知識としてと同等に扱うことができます回の試行でイベント回を目撃した場合、私の事後なります。。I α Iαα\alpha私私i IHNIH+αIα私Σのαjα私Σαj\frac{\alpha_i}{\sum \alpha_j}私私i hhhんんn私私ih + α私N + Σ αjh+α私ん+Σαj\frac{h + \alpha_i}{n + \sum \alpha_j} 今二項の場合には、それは「頭」の事前知識が発生していることをうまくいくで時間を裁判起こる「尾」に相当しますで時間をトライアル。論理的には、「尾」よりも「頭」の可能性についてより強い知識を持つことができるとは思いません。ただし、これは2つ以上の結果を伴ってより興味深いものになります。私が6面ダイスと言った場合、50トライアルではサイド1の事前知識は10に相当し、100トライアルではサイド2の事前知識は15 2に相当すると想像できます。α + β β α + βαα\alphaα + βα+β\alpha + \betaββ\betaα + βα+β\alpha + …

4
2つのデータポイントと専門家の制約に一致する、おそらく珍しい分布を求めていますか?
ベイジアンメタアナリシスの以前の分布を述べようとしています。 確率変数に関する次の情報があります。 2つの観察:3.0、3.6 変数を研究する科学者は、であり、6という高い値はゼロ以外の確率を持つと私に言っています。P(X&lt;2)=P(X&gt;8)=0P(X&lt;2)=P(X&gt;8)=0P(X<2)=P(X>8)=0 私は、最適化に次のアプローチを使用している(ログ-Nのモードを= :eμ−σ2)eμ−σ2)e^{\mu-\sigma^2)} prior &lt;- function(parms, x, alpha) { a &lt;- abs(plnorm(x[1], parms[1], parms[2]) - (alpha/2)) b &lt;- abs(plnorm(x[2], parms[1], parms[2]) - (1-alpha/2)) mode &lt;- exp(parms[1] - parms[2]^2) c &lt;- abs(mode-3.3) return(a + b + c) } v = nlm(prior,c(log(3.3),0.14),alpha=0.05,x=c(2.5,7.5)) x &lt;- seq(1,10,0.1) plot(x, dlnorm(x, v$estimate[1], v$estimate[2])) …

5
ベイズ因子分析に関する論文?
私は、因子分析のようなモデルを資産の収益や他の同様の潜在変数モデルに当てはめることに興味があります。このトピックについて読むのに適した紙は何ですか?因子分析モデルが「因子負荷」の符号変更の下で同一であるという事実を処理する方法に特に興味があります。

1
各評価に複数のカテゴリがあるベイジアン評価システム
私は自分のウェブサイトで使用される評価システムを実装しています。ベイジアン平均はそれを行うための最良の方法だと思います。すべてのアイテムは、ユーザーによって6つの異なるカテゴリで評価されます。高評価が1つしかないアイテムを上に向けたくないので、ベイジアンシステムを実装します。 ここに式があります: Bayesian Rating = ( (avg_num_votes * avg_rating) + (this_num_votes * this_rating) ) / (avg_num_votes + this_num_votes) アイテムは6つの異なるカテゴリで評価されるため、これらのカテゴリの合計の平均をベイズシステムの「this_rating」として使用する必要がありますか?たとえば、2つの評価(0〜5のスケール)を持つ1つのアイテムを取り上げます。 Rating 1: Category A: 3 Category B: 1 Category C: 2 Category D: 4 Category E: 5 Category F: 3 Sum: 18 Rating 2: Category A: 2 Category B: 3 Category …
8 bayesian 

4
ベイジアン分析とロジスティック回帰を理解するためのビデオ/オーディオのオンライン資料
ええと、私は日々エンジニアです。私の仕事のほとんどはモデリングを中心に展開していますが、通常はかなり基本的なことを行います。「高度な」モデルは、R2テストを使用して検証されたモンテカルロシミュレーションです。 現在、私の分野では、ロジスティック分析とベイズ分析を使用した多くの研究があります。 私の質問は、最初にビデオ/オーディオ、次に2番目に読むことで最もよく学ぶ人のために、MITのオープンコースサイトまたはその他のサイトからどのコースを推奨するかです。 私が学びたいのは以下です: モデルとそれらを採用する時期を理解できる フィールドデータ(一度生成され、再生成できない)を取り込み、実験を設計および実行できる 結果を理解し、それらを見て、何かがオフであるか、「ストッパーを示す」または「外れ値」であるか、またはすべてが正常でダンディであるかを理解することができる モデルを検証して、実際の「完成した」結果に合わせて調整できる 適切な感度分析を使用して結果を予測できる 不足しているデータを予測/「プラグ」できる 私の分野に関連するジャーナル論文を書くことができる 一言で言えば、私の分野は、一般的な4ステップモデル、またはPECASやurbansimなどの社会経済活動/ツアーベースのモデルを使用した、乗用車の輸送需要モデリングです。

3
iid実数値確率変数の合計に対するベイズ推定
ましょう、、...、 IID RVの範囲となるが、未知の分布。(必要に応じて、配信が継続的であると仮定しても構いません。)X1X1X_1X2X2X_2XnXnX_n[0,1][0,1][0,1] 定義します。Sn=X1+⋯+XnSn=X1+⋯+XnS_n = X_1 + \cdots + X_n 私はS_kを与えられSkSkS_k、尋ねます:S_nについてベイジアンの方法で何を推測でき SnSnS_nますか? つまり、RVのサイズkkkのサンプルの合計が与えられ、ベイジアンアプローチを使用して、すべてのRVの合計の分布について何を推測できるかを知りたいのです(そして、分布)。 サポートが[0,1]ではなく\ {0,1 \}である場合、この問題は十分に研究されており、(事前分布が均一であれば)S_nの推定分布のベータ二項複合分布が得られます。しかし、[0,1]を範囲としてどのようにアプローチするのかわかりません...{0,1}{0,1}\{0,1\}[0,1][0,1][0,1]SnSnS_n[0,1][0,1][0,1] 完全な開示:私はすでにこれをMathOverflowに投稿しましたが、ここに投稿した方がいいと言われたので、これは再投稿です。

3
アンサンブル分類器で分類はどのようにマージされますか?
アンサンブル分類器は、構成要素である分類器の予測をどのようにマージしますか?明確な説明が見つからない。私が見つけたいくつかのコード例では、アンサンブルは予測を平均化するだけですが、これがどのようにして「より良い」全体的な精度を実現できるかはわかりません。 次のケースを考えてください。アンサンブル分類子は、10個の分類子で構成されています。1つの分類子の精度は、データサブセットXの時間の100%、それ以外の時間はすべて0%です。他のすべての分類子の精度は、データサブセットXでは0%、その他の場合はすべて100%です。 分類器の精度が無視される平均化式を使用すると、集団分類器の精度はせいぜい50%になります。これは正しいですか、それとも何か不足していますか?N個の潜在的に無知な分類子から平均予測を取得すると、特定のドメインの専門家である単一の分類子よりも優れた予測を作成できる可能性があります。

2
ベイズの定理を使用して尤度を更新するための算術
これは、StackexchangeまたはMathoverflowでそれを見つけることができなかった理由である基本的な質問かもしれませんが、私が取り組んでいる問題のベイズ定理を使用して尤度を更新することに関連する算術に問題があります。 バックグラウンド: 先例がないか、ほとんどない将来の出来事に、可能性の予測を与えることを試みています。以前に知られている分布を使用して同様のパラメーター内で将来のイベントの可能性を与えるベイズに関するほとんどの文献やテキストとは異なり、私の状況は専門家の意見に基づいています。 例: GMは彼らが新しい自動車を開発していると発表した、しかしそれがいつリリースされるかについては言わなかった。KIAのプロダクションマネージャーは、新しい車を同時にリリースできるように、いつリリースできるかを知る必要があります。 KIAは、新車をリリースするために次のコンポーネントが必要であることを知っています(1)エンジン、(2)トランスミッション、(3)ボディ、(4)ホイールとサスペンション。KIAの経験豊富なエンジニアは、このような新しいプロジェクトの場合、2年で完了することができると90%確信していると述べています。KIAはまた、GMが別のSUVで新しいトランスミッションを使用してテストを行い、95%の成功率で設計どおりに機能したことを発見しました。同じエンジニアは、このトランスミッションテストが与えられれば、70%の時間内に自動車を完成させることができると述べました。 私のやり方では、この時点で、KIAは以下のように初期サンプルを使用してベイジアン計算を開始できます。 A = GM will release the new car in two years B1 = GM will successfully test a new transmission P(A) = Prior Probability that GM will release the new car in two years P(B1) = Probability that GM will successfully test a …
8 bayesian 

2
電球色問題
まず、次の小さな問題をご覧ください。 2つの区別できない電球AとBがあります。Aは、確率.8で赤色のライトを、確率.2で青色のライトを点滅させます。B .2と青.8の赤。これで.5確率で、AまたはBのいずれかが表示されます。電球の色を観察して、どの電球であるかを正確に推測する(正しい推測の確率を最大にする)必要があります。ただし、観察を始める前に、それを何回観察するかを決定する必要があります(たとえば、n回、それからn回点滅して観察して推測します)。フラッシュが独立しているとします。 直観的には、観察が多いほど、可能性は高くなると思います。奇妙なことに、n = 2はn = 1を改善せず、n = 4はn = 3を改善しないことを示すのは簡単な計算です。私はさらに進めませんでしたが、n = 2kはn = 2k-1を改善しないと推測します。一般的なケースでは証明できません。しかし、それは本当ですか?もしそうなら、どのように結果を直感的に理解できますか?

1
バグでベイジアン混合効果モデルを指定する方法
私はこれを週の初めに投稿し、人々の時間を無駄にしたくない、良い情報源を見つけたときに質問を撤回しました。残念ながら、あまり進歩していません。ここで善良な市民になろうとすることで、問題をできるだけ明確にします。テイカーは少ないと思います。 RIにBUGSまたはRで分析したいデータフレームがあります。これは長い形式です。これは、120人の複数の観測値からなり、合計885行です。カテゴリカルな結果の発生について調査していますが、ここではあまり関係ありません。問題は、より深いものについてです。 ここまで使ってきたモデルは mymodel&lt;-gee(Category ~ Predictor 1 + Predictor 2..family=binomial(link="logit"), data=mydata, id=Person) 限界モデルは基本的に患者のクラスタリングを説明します。次に調べた mymodel&lt;-gee(Category ~ Predictor 1 + Predictor 2.. , family=binomial(link="logit"), corstr = "AR-M", data=mydata, id=Person) 個々の人々の観察の時間順を説明するため。 これはあまり変わりませんでした。 次に、次の一連のMCMCPackコマンドを使用してモデル化を試みました。 mymodel&lt;-MCMCglmm(category~ Predictor1 + Predictor2.., data=mydata, family=binomial(link="logit")) 出力の調査はスリル満点で、多くの予測因子に統計的有意性を示しました。私は、患者の中の反復測定を考慮に入れていなかったことに気づくまで、新しく改宗したベイズ人として自分を称賛しました。 私はそれを説明しなければならないことを理解しています。これは、各個人にハイパープライアを適合させることを意味する可能性があることを理解しています-それは正しいですか?バグではこれはどのような形になりますか? 基本的なログ登録モデルは次のとおりです:(kudos to Kruschke、J.、Indiana) model { for( i in 1 : nData ) …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.