θ
y1,...,yny=(y1,...,yn)T
y1,...,yn|θ∼N(θ,σ2)
あるいは、ベイジアンがより一般的に書いたように
y1,...,yn|θ∼N(θ,τ)
τ=1/σ2τ
yi
f(yi|θ,τ)=(√τ2π)×exp(−τ(yi−θ)2/2)
θ^=y¯
θ
θ∼N(a,1/b)
この正規-正規(多くの代数の後の)データモデルから取得する事後分布は、別の正規分布です。
θ|y∼N(bb+nτa+nτb+nτy¯,1b+nτ)
b+nτay¯bb+nτa+nτb+nτy¯
θ|yθθ
とはいえ、これを説明するために、通常のデータテキストブックの例を使用できます。airquality
R内のデータセットを使用します。平均風速(MPH)を推定する問題を考えます。
> ## New York Air Quality Measurements
>
> help("airquality")
>
> ## Estimating average wind speeds
>
> wind = airquality$Wind
> hist(wind, col = "gray", border = "white", xlab = "Wind Speed (MPH)")
>

> n = length(wind)
> ybar = mean(wind)
> ybar
[1] 9.957516 ## "frequentist" estimate
> tau = 1/sd(wind)
>
>
> ## but based on some research, you felt avgerage wind speeds were closer to 12 mph
> ## but probably no greater than 15,
> ## then a potential prior would be N(12, 2)
>
> a = 12
> b = 2
>
> ## Your posterior would be N((1/))
>
> postmean = 1/(1 + n*tau) * a + n*tau/(1 + n*tau) * ybar
> postsd = 1/(1 + n*tau)
>
> set.seed(123)
> posterior_sample = rnorm(n = 10000, mean = postmean, sd = postsd)
> hist(posterior_sample, col = "gray", border = "white", xlab = "Wind Speed (MPH)")
> abline(v = median(posterior_sample))
> abline(v = ybar, lty = 3)
>

> median(posterior_sample)
[1] 10.00324
> quantile(x = posterior_sample, probs = c(0.025, 0.975)) ## confidence intervals
2.5% 97.5%
9.958984 10.047404
この分析では、研究者(あなた)は、データ+以前の情報が与えられた場合、50パーセンタイルを使用した平均風速の推定速度は10.00324であり、単にデータの平均を使用するよりも大きいと言えます。また、2.5と97.5の変位値を使用して95%の信頼できる区間を抽出できる完全な分布を取得します。
以下に2つのリファレンスを含めますが、カゼラの短い論文を読むことを強くお勧めします。具体的には、経験的なベイズ法を目的としていますが、ノーマルモデルの一般的なベイズ法について説明しています。
参照:
カゼラ、G。(1985)。経験的ベイズデータ分析の概要。アメリカの統計学者、39(2)、83-87。
ゲルマン、A(2004)。ベイジアンデータ分析(第2版、統計科学のテキスト)。フロリダ州ボカラトン:チャップマン&ホール/ CRC。