統計とビッグデータ bayesian

2

問題情報に基づいた事前データとデータを指定して事後密度を推定するベイズ分析を実行するR関数を書いています。ユーザーが前のものを再検討する必要がある場合、関数が警告を送信することを望みます。この質問では、事前評価の評価方法に興味があります。以前の質問では、情報に基づいた事前情報を示すメカニズムを説明しました（こことここ。）次の場合は、事前の再評価が必要になる場合があります。データは、以前のことを述べたときに考慮されなかった極端なケースを表していますデータのエラー（たとえば、前のデータがkgであるときにデータがgの単位である場合）コード内のバグのため、利用可能な事前設定のセットから間違った事前設定が選択されました最初のケースでは、データ値がサポートされていない範囲（たとえば、logNまたはGammaの0未満）にない限り、通常、事前分布は依然として十分拡散しているため、データは一般的に圧倒します。その他のケースはバグまたはエラーです。ご質問データを使用して事前評価を行うことの妥当性について何か問題はありますか？この問題に最適な特定のテストはありますか？例これらは、（赤）または（青）のいずれかの母集団からのものであるため、以前のとの一致が不十分な2つのデータセットです。N （0 、5 ）N （8 、0.5 ）l o gN（0 、1 ）logN(0,1)logN(0,1)N（0 、5 ）N(0,5)N(0,5)N（8 、0.5 ）N(8,0.5)N(8,0.5) 青色のデータは有効な事前+データの組み合わせである可能性がありますが、赤色のデータは負の値でサポートされる事前分布が必要です。 set.seed(1) x<- seq(0.01,15,by=0.1) plot(x, dlnorm(x), type = 'l', xlim = c(-15,15),xlab='',ylab='') points(rnorm(50,0,5),jitter(rep(0,50),factor =0.2), cex = 0.3, col = 'red') points(rnorm(50,8,0.5),jitter(rep(0,50),factor =0.4), cex …

10 distributions probability bayesian

4

統計モデリングを始めるためのヒントとコツ？

私はデータマイニングの分野で働いており、統計に関する正式な教育はほとんど受けていません。最近、学習とマイニングのためのベイズのパラダイムに焦点を当てた多くの仕事を読んでいますが、それは非常に興味深いと思います。私の質問は（いくつかの部分で）、問題があり、統計モデルを構築することができる一般的なフレームワークがあるかどうかです。基礎となるプロセスをモデル化するデータセットが与えられたときに最初に行うことは何ですか？このプロセスを説明する良い本やチュートリアルはありますか、それとも経験の問題ですか？モデルを構築するとき、あなたの心の最前線で推論ですか、それとも計算にどのように使用するかについて心配する前に、最初にデータを記述することを目指していますか？どんな洞察もいただければ幸いです！ありがとう。

10 bayesian modeling references eda

2

情報のない事前分布と不適切な事前分布の違い

これら2種類の事前分布の違いは何でしょうか。有益ではない不適切

10 bayesian prior improper-prior

2

同じですか、それとも違いますか？ベイジアンウェイ

次のモデルがあるとします。 Poisson(λ)∼{λ1λ2if t<τif t≥τPoisson(λ)∼{λ1if t<τλ2if t≥τ\text{Poisson}(\lambda) \sim \begin{cases} \lambda_1 & \text{if } t \lt \tau \\ \lambda_2 & \text{if } t \geq \tau \end{cases} そして私はのための事後推測およびλ 2私のデータから、下に示します。伝える（または定量）のベイズの方法があればそこにあるλ 1およびλ 2があり、同一または異なりますか？λ1λ1\lambda_1λ2λ2\lambda_2λ1λ1\lambda_1λ2λ2\lambda_2 おそらく、測定する確率異なるλ 2をλ1λ1\lambda_1λ2λ2\lambda_2？または、おそらくKL分岐を使用していますか？例えば、どのように測定することができ、又は少なくとも、P （λ 2 > λ 1）を？p(λ2≠λ1)p(λ2≠λ1)p(\lambda_2 \neq \lambda_1)p(λ2>λ1)p(λ2>λ1)p(\lambda_2 \gt \lambda_1) 一般的に、以下に示すように後処理者（両方でゼロでない PDF値を想定）を取得したら、この質問に答える良い方法は何ですか？更新この質問には2つの方法で回答できるようです。 λ1≠λ2λ1≠λ2\lambda_1 \neq \lambda_2λ2>λ1λ2>λ1\lambda_2 > \lambda_1 後世のある種の違いを統合する。そして、それは私の質問の重要な部分です。その統合はどのように見えますか？おそらくサンプリング手法はこの積分を近似するでしょうが、この積分の定式化について知りたいのです。 …

10 distributions bayesian poisson-distribution

4

混合モデルのアイデアとベイズ法

混合モデルでは、変量効果（パラメーター）は正規分布に従う確率変数であると想定します。これは、すべてのパラメータがランダムであると見なされるベイズ法に非常に似ています。では、変量効果モデルはベイジアン法の特殊なケースですか？

10 bayesian mixed-model

1

不適切な事前確率を持つベイズ因子

ベイズ因子を使用したモデル比較について質問があります。多くの場合、統計学者は不適切な事前分布（たとえば、一部のジェフリーズ事前分布と参照事前分布）を使用したベイジアンアプローチの使用に関心を持っています。私の質問は、モデルパラメーターの事後分布が明確に定義されている場合、不適切な事前分布を使用してベイズ因子を使用するモデルを比較することは有効ですか？簡単な例として、正規モデルとロジスティックモデルをジェフリーズ事前分布と比較することを検討してください。

10 bayesian model-selection prior

1

では、どのようにベイズ推定をメタ分析に含めますか？

この質問、特に「問題3」に触発されました。事後分布は、分布の頻出者によるパラメトリックな説明が提供されていない限り、メタ分析に組み込むのがいくらか困難です。メタアナリシスをベイジアンモデルに組み込むことについて、最近はかなりのことを考えていました。ベイジアン分析が実際に普及し、既存のコードに組み込むのが非常に簡単になった場合（SAS 9.2以降のBAYESステートメントが頭に浮かぶ）、より頻繁にベイジアン推定の効果を文献で取得する必要があります。ベイズ分析を実行することを決定した応用研究者がいると仮定してみましょう。私がこの質問で使用したのと同じシミュレーションコードを使用して、頻度主義のフレームワークを使用した場合、彼らは次の頻度主義者の推定値になります。 log relative risk = 1.1009, standard error = 0.0319, log 95% CI = 1.0384, 1.1633 標準の、すべてデフォルトで情報のない事前のBAYESステートメント分析を使用すると、対称的な信頼区間または標準誤差が対称になる理由はありません。この場合、事後は正規分布でかなり簡単に説明できるので、それをそのように説明して「十分に近い」ものにすることができますが、誰かがベイズ効果の推定と非対称の信頼できる間隔を報告するとどうなりますか？それを標準のメタ分析に含める簡単な方法はありますか、または推定値をパラメトリックに記述された分布にできるだけ近いものに戻す必要がありますか？または、他の何か？

10 bayesian meta-analysis

1

休業。この質問は意見に基づいています。現在、回答を受け付けていません。この質問を改善してみませんか？この投稿を編集して、事実と引用で回答できるように質問を更新してください。昨年休業。トップ100のUSニュース統計プログラムの研究領域を閲覧すると、それらのほとんどすべてがベイジアン統計で重くなっています。しかし、私が下層の学校に通った場合、それらのほとんどはまだ古典的/頻出統計学の研究を行っています。たとえば、私の現在の学校（統計のQSワールドランキングで150から200にランク付けされているため、一流の学校とは見なされていません）には、ベイジアン統計に焦点を当てた教授が1人だけで、ベイジアン統計にはほとんど憤慨があります。私が話をしたいくつかの大学院生は、ベイジアン統計学者がそのためにベイジアン統計を行っているとさえ言っていますが、もちろん私は強く反対します。しかし、なぜそうなのでしょうか。私はいくつかの教育を受けた推測をしています：（a）クラシック/頻出統計の方法論の進歩のための十分な余地がなく、クラシック/頻出統計の研究で実行可能な唯一の研究は、上位層の学校がより多いはずであるので、下位層の学校の主な焦点となるアプリケーションに関するものです理論的および方法論的研究に傾倒。（b）フィールドに大きく依存します。統計の特定のブランチは、統計手法の多くの科学的アプリケーションなどのベイジアン統計に適していますが、その他のブランチは、金融分野などの古典的な統計に適しています。（私が間違っている場合は修正してください）これを考えると、一流の学校には科学分野でアプリケーションを実行する統計学部がたくさんあるようですが、下層の学校の統計学部は主に金融分野でアプリケーションに焦点を当てているため、収入を生み出すのに役立ちますそして資金。（c）たとえば、MLEの過剰適合の傾向があるなど、解決できない頻出主義の方法には大きな問題があります。ベイジアンは素晴らしい解決策を提供しているようです。（d）計算能力がここにあるので、ベイジアン計算は30年前のようにボトルネックではなくなりました。（e）これは、私が最も根拠のある推測である可能性があります。古典的統計の役割を潜在的に追い越すことができる方法論の新しい波を好まないだけの、古典的/頻繁な統計学者からの抵抗があります。しかし、ラリー・ワッサーマンが言ったように、それは私たちが何をしようとしているのかに依存し、誰もが、特に研究者として、オープンマインドを保つべきです。

10 bayesian frequentist

1

ガウス過程/ディリクレ過程などの確率過程には密度がありますか？そうでない場合、ベイズのルールをそれらにどのように適用できますか？

ディリクレポセスとガウス過程は、しばしば「関数の分布」または「分布の分布」と呼ばれます。その場合、GPの下での関数の密度について意味のある話をすることができますか？つまり、ガウス過程またはディリクレ過程は、確率密度の概念を持っていますか？そうでない場合、関数の事前確率の概念が明確に定義されていない場合、ベイズの規則を使用して事後から前に進むにはどうすればよいでしょうか。MAPやEAPの推定値などは、ベイジアンノンパラメトリックの世界に存在しますか？どうもありがとう。

10 machine-learning probability bayesian nonparametric nonparametric-bayes

5

条件付き確率-それらはベイジアン固有のものですか？

条件付き確率がベイジアン主義に固有のものであるのか、それとも統計学/確率論の人々の間でいくつかの学派の間で共有されているより一般的な概念であるのだろうか。私はそうだと思います、私は誰もできないと思いますは一種の論理的であり、ベイジアンに対して警告しながら、常連は少なくとも理論的に同意するだろうと思います条件付き確率のためではなく、実際的な理由からさらに推論します。p （A 、B ）= p （A | B ）p （B ）p(A,B)=p(A|B)p(B)p(A,B) = p(A|B)p(B)

10 bayesian conditional-probability

1

ARIMA対カルマンフィルター-それらはどのように関連していますか

カルマンフィルターについて読み始めたとき、それはARIMAモデル（つまりARIMA（0,1,1））の特殊なケースであると思いました。しかし、実際には状況はより複雑であるようです。まず、ARIMAは予測に使用でき、カルマンフィルターはフィルタリングに使用できます。しかし、それらは密接に関連していませんか？質問： ARIMAとカルマンフィルターの関係は何ですか？別のものを使用していますか？別の特別なケースですか？

10 time-series bayesian arima kalman-filter

1

二項尤度の事前Jeffreys

二項確率パラメータジェフリーズプライアーを使用する場合、これは分布を使用することを意味します。θθ\thetaθ∼beta(1/2,1/2)θ∼beta(1/2,1/2)\theta \sim beta(1/2,1/2) Iは、基準の新しいフレームに変換する場合、次いで明確またとして配布されていない分布。ϕ=θ2ϕ=θ2\phi = \theta^2ϕϕ\phibeta(1/2,1/2)beta(1/2,1/2)beta(1/2,1/2) 私の質問は、Jeffreysが再パラメータ化に対して不変であるという意味です。正直に言うと誤解しているようです... ベスト、ベン

10 bayesian jeffreys-prior

2

正常モデルと二項モデルでは、事後分散は常に前の分散よりも小さいですか？

またはそれを保証する条件は何ですか？一般に（通常モデルと二項モデルだけでなく）この主張を破った主な理由は、サンプリングモデルと以前のモデルの間に不整合があるためだと思いますが、他に何があるでしょうか。私はこのトピックから始めているので、簡単な例に本当に感謝しています

10 bayesian variance information-theory

2

ベイジアン線形回帰で事後予測分布を評価する

ベイジアン線形回帰の事後予測分布を、3ページのここで説明した基本的なケースを超えて評価し、以下にコピーする方法に混乱しています。 p （y〜∣ y）= ∫p （y〜| β、σ2）p （β、σ2∣ y）p(y~∣y)=∫p(y~∣β,σ2)p(β,σ2∣y) p(\tilde y \mid y) = \int p(\tilde y \mid \beta, \sigma^2) p(\beta, \sigma^2 \mid y) 基本的なケースは次の線形回帰モデルです。 y= Xβ+ ϵ 、y〜N（Xβ、σ2）y=Xβ+ϵ,y∼N(Xβ,σ2) y = X \beta + \epsilon, \hspace{10mm} y \sim N(X \beta, \sigma^2) で均一な事前分布、でscale-Inv事前分布、または正規逆ガンマ事前分布（ここを参照）を使用する場合、事後予測分布は分析的であり、学生tです。 χ 2 σ 2ββ\betaχ2χ2\chi^2σ2σ2\sigma^2 このモデルについてはどうですか？ y= Xβ+ ϵ …

10 regression bayesian predictive-models prediction posterior

1

ベイジアンA / Bテストの式が意味をなさない

ベイジアン手法を使用してABテストの結果を計算するために、ベイジアンabテストの式を使用しています。 Pr(pB>pA)=∑i=0αB−1B(αA+i,βB+βA)(βB+i)B(1+i,βB)B(αA,βA)Pr(pB>pA)=∑i=0αB−1B(αA+i,βB+βA)(βB+i)B(1+i,βB)B(αA,βA) \Pr(p_B > p_A) = \sum^{\alpha_B-1}_{i=0} \frac{B(\alpha_A+i,\beta_B+\beta_A)}{(\beta_B+i)B(1+i,\beta_B)B(\alpha_A, \beta_A)} どこ 1プラス Aの成功数αAαA\alpha_A 1プラス Aの失敗数βAβA\beta_A 1プラス Bの成功数αBαB\alpha_B 1プラス Bの失敗数βBβB\beta_B はベータ関数ですBBB データの例： control: 1000 trials with 78 successes test: 1000 trials with 100 successes 標準的な非ベイジアンプロップテストでは、重要な結果が得られます（p <10％）： prop.test(n=c(1000,1000), x=c(100,78), correct=F) # 2-sample test for equality of proportions without continuity correction # # data: …

10 r bayesian ab-test

タグ付けされた質問 「bayesian」

タグ付けされた質問「bayesian」