回答:
Gumbel-maxトリックを使用すると、ログスペースを残さずに、ログ確率を指定したカテゴリ分布からサンプリングできます。アイデアは、あなたが与えられている場合は、非正規化対数確率はということであるα 1、... 、α kのソフトマックス関数を使用して、適切な確率に変換することができ、
そのような分布からサンプルを次の場合事実使用することができの位置によってパラメータ化標準ガンベル分布から取られた独立したサンプルであるMを、
それはそれを示すことができます(下記の参考文献を参照)
そして、私たちは取ることができます
Maddison、CJ、Tarlow、D.、&Minka、T.(2014)。A *サンプリング。[In:]神経情報処理システムの進歩(pp。3086-3094)。
Yellott、JI(1977)。ルースの選択公理、サーストンの比較判断理論、および二重指数分布の間の関係。Journal of Mathematical Psychology、15(2)、109-144。
マディソン、CJ、Mnih、A。、およびTeh、YW(2016)。コンクリート分布:離散確率変数の連続緩和。arXivプレプリントarXiv:1611.00712。
Jang、E.、Gu、S.、&Poole、B.(2016)。Gumbel-Softmaxによるカテゴリー再パラメーター化。arXivプレプリントarXiv:1611.01144。
マディソン、CJ(2016)。モンテカルロのポアソンプロセスモデル。arXivプレプリントarXiv:1602.05986。
exp
精度が低下し、[1.0、3.45e-66、0.0、7.54e-121]のような分布になります。 。その場合でも堅牢な回答をお待ちしております。しかし、今のところ私はあなたの答えを支持しています。