与えられた平均と共分散行列を使用して、合計が1になるように範囲に切り捨てられた次元多変量ガウス分布から値を生成できるようにしたいと考えています。
これはガウス分布による標準 -simplex からのサンプリングと同じだと思いますが、どうすればこれを実行できますか?
sampling from the standard n-simplex according to the Gaussian distribution
ガウス分布は空間全体で定義されているため、は用語の矛盾です。
与えられた平均と共分散行列を使用して、合計が1になるように範囲に切り捨てられた次元多変量ガウス分布から値を生成できるようにしたいと考えています。
これはガウス分布による標準 -simplex からのサンプリングと同じだと思いますが、どうすればこれを実行できますか?
sampling from the standard n-simplex according to the Gaussian distribution
ガウス分布は空間全体で定義されているため、は用語の矛盾です。
回答:
シンプレックス([ -これらの論文は、(1、P)に切り捨て多変量正規からサンプルする方法を説明http://ieeexplore.ieee.org/abstract/document/6884588/]、[dobigeon.perso.enseeiht.fr/papers/ Dobigeon_TechReport_2007b.pdf])。サンプリングは、ギブスサンプリングまたはHMCを介して行われます。つまり、(条件付き)多変量正規分布からのアイデアを使用します。シンプレックスで切り捨てられた多変量正規に制約されているベクトルをサンプリングしたいとします。つまり、。条件としてコンポーネント()をサンプリングできます(つまり、)、最後の成分()をを条件付き平均および条件付き分散。私が言及した論文は、これらを計算する方法を説明しています。個の情報しかないことに注意してください。
ロジット正規分布が必要なようです。この分布は、Compositional Data Analysis(CDA)で多く表示されます。CDAは、土壌または岩石サンプル内の鉱物の組成を測定するために地質学でよく使用されます。ロジット法線はランダム変数のロジット変換を取り、このロジット変換ランダム変数は正規分布確率変数です。正式には
ここで、はロジット正規で、は正規です。多変量拡張が存在し、密度のより一般的に使用される形式です。
これが必要なものではなく、制約のコレクションによって制限される通常の確率変数が常に1になり、すべてのエントリが負でない場合は、他のシミュレーション手法を使用して描画を行う必要があります。分布から。これらの描画を実行するのはかなり複雑です。ジョンGewekeは書いた紙を、このことについてとキリスト教のロバートも書いた紙を配布、このタイプからのサンプリングに。