パレート平滑化重要度サンプリング(PSIS-LOO)の失敗を防ぐ


10

私は最近、以下の論文で説明されているパレート平滑化重要度サンプリングのリーブワンアウト相互検証(PSIS-LOO)の使用を開始しました。

  • Vehtari、A.および&Gelman、A.(2015)。パレート平滑化重要度サンプリング。arXivプレプリント(リンク)。
  • Vehtari、A.、Gelman、A.、およびGabry、J.(2016)。Leave-one-out交差検証とWAICを使用した実用的なベイズモデル評価。arXivプレプリント(リンク

これは、MCMCを1回実行するだけでLOO-CVを実行できるため、サンプル外のモデル評価に対する非常に魅力的なアプローチを表しており、WAICなどの既存の情報基準よりも優れているとされています。

PSIS-LOOには、近似が信頼できるかどうか、つまり、重要度の経験的分布の裾にフィットするパレート分布の推定指数(データポイントごとに1つの重み)によって与えられるかどうかを診断する機能があります。つまり、推定重量場合、悪いことが発生する可能性があります。k^ik^i0.7

悲しいことに、この方法を私の問題に適用したところ、関心のあるモデルの大部分で、\ hat {k} _i \ gg 0.7の大部分が見つかりましたk^i0.7。当然のことながら、報告されたLOOの対数尤度の一部は、明らかに他のデータセットと比較して無意味でした。ダブルチェックとして、私は従来の(そして時間のかかる)10分割交差検証を実行しましたが、実際に上記のケースでは、PSIS-LOOがひどく間違った結果を与えていたことがわかりました(良い面では、結果は10と非常によく一致しました)すべてのk^i0.7)のモデルのCVを折りたたみます。参考までに、Aki VehtariによるPSIS-LOOのMATLAB実装を使用しています。

多分私は、この方法を適用する私の現在の最初の問題がPSIS-LOOにとって「困難」であるという点で非常に不運なだけかもしれませんが、このケースは比較的一般的かもしれないと思います。私のような場合、Vehtary、Gelman&Gabryの論文は単に次のように述べています:

PSIS推定値に有限の分散がある場合でも、場合、ユーザーは問題のあるについてから直接サンプリングすることを検討する必要があります倍交差を使用します検証、またはより堅牢なモデルを使用します。k^>0.7p(θs|yi)ik

これらは明白ですが、時間がかかるか、追加の操作が必要であるため、実際には理想的なソリューションではありません(MCMC モデルの評価はすべて操作に関するものですが、少ないほど優れています)。

PSIS-LOOの失敗を防ぐために事前に適用できる一般的な方法はありますか?暫定的なアイデアはいくつかありますが、人々が採用している実証的な解決策はすでにあるのでしょうか。

回答:


8

参考までに、同様の質問をStan usersメーリングリストに投稿しました。元のPSIS-LOO論文の著者の1人と、スタンの他の寄稿者からも回答がありました。以下は私の個人的な要約です。

簡単に言えば、PSIS-LOOの失敗を防ぐ一般的な方法は知られていないということです。PSIS-LOOが失敗する場合、それは通常、モデルに問題があるためであり、その修正は必然的にユーザーに任されます。

具体的には、PSIS-LOOが失敗する理由は、通常、影響力のある観測のために、1つ以上のLOO分布がシフトされているか、事後分布より広いか、または重要度のサンプリング分布が1つまたはいくつかの点に崩れているためです。

私は、この問題を解決するために、なんらかの形の並列事後調整アプローチを採用しようと試みることができると考えていました。この考えは必ずしも間違っているわけではありませんが、次のように指摘されました。

  • 教科書後部焼戻しでも、適切な温度レベルを見つけるためにケースバイケースで多くの手作業が必要になります。これを行うための明白な方法も既知の方法もないためです(このため、スタンには並列焼戻しが含まれていません)。
  • 3つ以上の温度レベルを使用する場合(堅牢なアプローチが必要になる場合があるため)、最終的な計算コストは​​、K分割交差検証、または問題のあるLOO分布でのMCMCの実行に近づきます。

つまり、PSIS-LOOが失敗した場合、他の単純なパッチと同じくらい堅牢で一般的な方法を入手するのは難しいようです。そのため、ヴェタリ、ゲルマン、ガブリーは、元の質問で私が投稿した引用に従って、これらの方法を提案しました。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.