でMCMCの方法、私は約読み続けるburn-in
時間やサンプルの数"burn"
。これは正確には何ですか?なぜ必要なのですか?
更新:
MCMCが安定したら、安定したままですか?burn-in
時間の概念は混合時間のそれとどのように関連していますか?
でMCMCの方法、私は約読み続けるburn-in
時間やサンプルの数"burn"
。これは正確には何ですか?なぜ必要なのですか?
MCMCが安定したら、安定したままですか?burn-in
時間の概念は混合時間のそれとどのように関連していますか?
回答:
バーンインは、特に粗い開始点から始まった場合に、マルコフチェーンが平衡分布に到達する時間を与えることを目的としています。チェーンを「バーンイン」するには、ポイントの収集を開始する前に、最初のサンプルを破棄するだけです。
「悪い」開始点は、それが平衡分布に落ち着く前に、平衡分布の下で実際に非常に低い確率である領域をオーバーサンプリングする可能性があるという考えです。それらのポイントを捨てると、ありそうもないはずのポイントが適切にレアになります。
このページは良い例ですが、バーンインは原理的な手法というよりはハック/アートフォームであることも指摘しています。理論的には、本当に長時間サンプリングするか、まともな開始点を選択する方法を見つけることができます。
編集:混合時間とは、チェーンが定常状態に近づくのにかかる時間を指しますが、直接計算することはしばしば困難です。混合時間を知っている場合は、その数のサンプルを破棄するだけですが、多くの場合、破棄しません。したがって、代わりに十分な大きさのバーンイン時間を選択します。
安定性に関する限り、それは状況によって異なります。チェーンが収束した場合、それは...収束しています。ただし、チェーンが収束したように見えても、実際には状態空間の一部で「ハングアウト」している場合もあります。たとえば、いくつかのモードがあるが、各モードは他のモードとの接続が不十分であると想像してください。サンプラーがそのギャップを通過するまでに非常に長い時間がかかる場合があり、そのジャンプが行われるまで、チェーンが正しく収束したように見えます。
収束の診断はありますが、それらの多くは、真の収束と疑似収束を区別するのに苦労しています。マルコフ連鎖のモンテカルロハンドブックのチャールズガイヤーの章(#1)は、できる限り連鎖を実行することを除いて、すべてについてかなり悲観的です。
Metropolis-Hastingsアルゴリズムは、事後分布からランダムにサンプリングします。マルコフ連鎖は定常分布に対して安定していないため、通常、初期サンプルは完全に有効ではありません。バーンインサンプルを使用すると、まだ静止していない初期サンプルを破棄できます。