ログスペースの離散(カテゴリ)分布からサンプリングする方法を教えてください。


12

Iはベクトルによって定義された離散的な分布があるとθ0,θ1,...,θNカテゴリなるように0確率で描画されますθ0とそうで。次に、分布の値の一部が非常に小さいため、コンピューターの浮動小数点数表現がアンダーフローすることを発見しました。そのため、すべての計算を対数空間で行います。今は対数空間ベクトル有するlog(θ0),log(θ1),...,log(θN)

それは、元の確率は(カテゴリを保持するように、分布からサンプリングすることも可能であるi確率で描かれているθi)が、これまでのログ・スペースを残しませんか?言い換えれば、アンダーフローなしでこの分布からどのようにサンプリングするのですか?

回答:


15

Gumbel-maxトリックを使用すると、ログスペース残さずに、ログ確率指定したカテゴリ分布からサンプリングできます。アイデアは、あなたが与えられている場合は、非正規化対数確率はということであるα 1... α kのソフトマックス関数を使用して、適切な確率に変換することができ、α1,,αk

pi=exp(αi)jexp(αj)

そのような分布からサンプルを次の場合事実使用することができの位置によってパラメータ化標準ガンベル分布から取られた独立したサンプルであるMをg1,,gkG(0)m

F(Gg)=exp(exp(g+m))

それはそれを示すことができます(下記の参考文献を参照)

argmaxi{gi+αi}exp(αi)jexp(αj)maxi{gi+αi}G(logiexp{αi})

そして、私たちは取ることができます

z=argmaxi{gi+αi}

p1,,pk

gi=log(logui)ui(0,1)


Maddison、CJ、Tarlow、D.、&Minka、T.(2014)。A *サンプリング。[In:]神経情報処理システムの進歩(pp。3086-3094)。

Yellott、JI(1977)。ルースの選択公理、サーストンの比較判断理論、および二重指数分布の間の関係。Journal of Mathematical Psychology、15(2)、109-144。

マディソン、CJ、Mnih、A。、およびTeh、YW(2016)。コンクリート分布:離散確率変数の連続緩和。arXivプレプリントarXiv:1611.00712。

Jang、E.、Gu、S.、&Poole、B.(2016)。Gumbel-Softmaxによるカテゴリー再パラメーター化。arXivプレプリントarXiv:1611.01144。

マディソン、CJ(2016)。モンテカルロのポアソンプロセスモデル。arXivプレプリントarXiv:1602.05986。


5

アンダーフロー/オーバーフローを回避する一般的な方法を次に示します。

させる m=最大ログθ

させる θ=expログθm

からサンプリングできます θ=[θ1θ2]


1
これは、いずれかの値と最大値の差が大きすぎない限り機能します。その場合、exp精度が低下し、[1.0、3.45e-66、0.0、7.54e-121]のような分布になります。 。その場合でも堅牢な回答をお待ちしております。しかし、今のところ私はあなたの答えを支持しています。
ジョシュハンセン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.