スタン・


16

ここからダウンロードできるStanドキュメントを調べていました。Gelman-Rubin診断の実装に特に興味がありました。元の論文Gelman&Rubin(1992)は、潜在的な縮尺率(PSRF)を次のように定義しています。

ましょうであるサンプリング番目のマルコフ連鎖、および全体的な存在であるとするサンプリング独立チェーン。ましょうから平均する番目の鎖、及び全体平均です。定義、 ここで そして、定義Xi,1,,Xi,NiMX¯iˉ X W = 1iX¯s 2 m =1

W=1Mm=1Msm2,
B B = N
sm2=1N1t=1N(X¯mtX¯m)2.
B
B=NM1m=1M(X¯mX¯)2.

定義 PSRFはで推定されここで ここで、。

V^=(N1N)W+(M+1MN)B.
R= VR^
R^=V^Wdf+3df+1,
df=2V^/Var(V^)

Stanドキュメント(349ページでは、を含む用語は無視され、(M + 1)/ M乗法用語も削除されます。これが彼らの公式ですdf(M+1)/M

分散推定量は

var^+(θ|y)=N1NW+1NB.
最後に、潜在的なスケール削減統計は、\ hat {R} = \ sqrt {\ frac {\ widehat {\ text {var}} ^ {+}(\ theta \、| \、y)} {W}}で定義され
R^=var^+(θ|y)W.

私が見ることができることから、彼らはこの式の変更についての参考文献を提供しておらず、それについても議論していません。通常、大きすぎではない、としばしば低いようにすることができので、あっても、無視すべきではない用語は、1で近似することができます。M2(M+1)/Mdf

それでは、この式はどこから来たのでしょうか?


編集: 私は、「この式はどこから来たのか?」という質問に対する部分的な答えを見つけましたゲルマン、カーリン、スターン、ルービンによるベイジアンデータ分析の本(第2版)はまったく同じ式です。しかし、本はこれらの用語を無視することを正当化する方法/理由を説明していませんか?


公開された論文はまだありません。公式はおそらく今後数ヶ月で変更されるでしょう。
ベングッドリッチ

@BenGoodrichコメントありがとうございます。この式を使用する動機について、他に何か言えることはありますか?そして、なぜ式が正確に変わるのですか?
グリーンパーカー

1
現在の分割R-hat式は、チェーンが1つしかない場合に適用するのが最も一般的な方法です。今後の変更は、主に、基礎となる周辺事後分布が正規ではないか、平均および/または分散を持つ可能性があるという事実に対処することです。
ベングッドリッチ

1
@BenGoodrichはい、STANがRhatを分割した理由はわかります。それでも、その場合に、及び定数のでM + 1 / M = 3 / 2無視できません。M=2(M+1)/M=3/2
グリーンパーカー

回答:


4

Iは、ゲルマン・ルービン(1992)に与えられた特定のリンクに従い、それが有する σ = N - 1 以降のバージョンと同様に、ものの σはと置き換え σ +ブルックス・ゲルマン(1998)とを有する ^ V R +BDA2に(ゲルマンら、2003)及びBDA3(ゲルマンら、2013)。

σ^=n1nW+1nB
σ^σ^+var^+

var^+

R^=m+1mσ^+Wn1mn,
R^=σ^+W+σ^+Wmn1mn.
n

Gelman&Rubin(1992)には、dfがdf /(df-2)の用語もありました。Brooks&Gelman(1998)には、このdf相関が正しくない理由を説明するセクションがあり、(df + 3)/(df + 1)を定義しています。Brooks&Gelman(1998)のセクション3.1の前の段落では、(d + 3)/(d + 1)を削除できる理由を説明しています。

σ^+Wmn1mn

R^nm

通常、Mは大きすぎず、しばしば2

R^

追加リファレンス:

  • ブルックスとゲルマン(1998)。Journal of Computational and Graphical Statistics、7(4)434-455。

σ^2R^(σ^2+B/mn)/Wdfterm(m+1)/m
グリーンパーカー

よくわかりません。あなたが提供したリンク経由の記事とStat ScienceのWebページの記事には457-472ページしかありません。今はチェックしていませんが、数年前と昨年、codaをチェックしたときに、現在の推奨バージョンがありませんでした。
アキヴェタリ

回答を編集したことに注意してください。Gelman&Brooks(1998)には(m + 1)/ m項がより明確に記載されており、意思決定のために(m + 1)/ m項の効果をほとんどキャンセルする最後の項を見逃したようです。セクション3.1の前の段落を参照してください。
アキヴェタリ

申し訳ありませんが、それはタイプミスでした。465ページで、GelmanとRubinにはBrooksとGelman(上記で述べた)とまったく同じ定義があります。BrooksとGelmanの式1.1は、正確に書き留めたものです(いくつかの用語を並べ替えるとき)。
グリーンパーカー

「nが大きい場合、第2項と第3項の効果は意思決定に無視できることがわかります」と言っているので、BDAの表現、したがってSTANは大きなnのこれらの用語を本質的に無視することに由来しますか?
グリーンパーカー
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.