分布の瞬間を使用して分布をサンプリングできますか?


14

統計/機械学習法では、分布はガウス分布で近似されることが多く、サンプリングにはガウス分布が使用されます。彼らは、ディストリビューションの最初の二つのモーメントを計算することによって開始し、推定するために、それらを使用μ及びσ2。その後、彼らはそのガウスからサンプリングできます。

計算する瞬間が多いほど、サンプリングしたい分布を近似できるようになるはずです。

3つのモーメントを計算するとどうなりますか?それらを使用して分布からサンプリングできますか?そして、これをNモーメントに拡張できますか?


2
3つの瞬間は分布形式を決定しません*。最初の3つの母集団モーメントに関連する3つのパラメーターを持つ分布ファミリーを選択した場合、モーメントマッチング(「モーメント法」)を実行して3つのパラメーターを推定し、そのような分布から値を生成できます。このようなディストリビューションは多数あります。[*実際、すべての瞬間を持っいるだけで、分布を決定するには不十分な場合があります。]
Glen_b -Reinstate Monica

ありがとう、@ Glen_b!「瞬間の方法」について読み、それがいつ可能かを理解します。モーメントが分布を決定するのに十分でない場合を説明する理論を教えてください。
curious_dan

「モーメント法」は、モーメントからパラメータを推定する方法を示しています。コメントの残りの部分は新しい質問です(サイトで既に回答済みだと思います)。短時間-モーメント生成関数が存在する場合(0の近傍)、分布を一意に識別します(技術的には、原則として逆ラプラス変換を実行できます)。いくつかの瞬間が有限されていない場合は確かにこれはMGFを意味します。..存在するが、すべてのモーメントが有限であるが、MGFはまだ0の近傍に存在しない場合もあるしない
Glen_b -Reinstateモニカ

コメントに基づいて回答を書いています。
Glen_b-モニカを

回答:


22

3つの瞬間は分布形態を決定しません。最初の3つの母集団モーメントに関連する3つのパラメーターを持つ分布ファミリーを選択した場合、モーメントマッチング(「モーメント法」)を実行して3つのパラメーターを推定し、そのような分布から値を生成できます。このようなディストリビューションは多数あります。

時々、すべての瞬間を持っているだけでは、分布を決定するのに十分ではありません。モーメント生成関数が(0の近傍に)存在する場合、分布を一意に識別します(原則として、逆ラプラス変換を実行して分布を取得できます)。

[いくつかのモーメントが有限でない場合、これはmgfが存在しないことを意味しますが、すべてのモーメントが有限であるが、mgfが0の近傍にまだ存在しない場合もあります。

分布の選択がある場合、最初の3つのモーメントに制約がある最大エントロピー解を検討したいと思うかもしれませんが、それを達成する実際のラインには分布がありません(指数の結果の3次が制限されないため)。


特定の配布選択に対してプロセスがどのように機能するか

γ1=μ3/μ23/2

関連する歪度を持つ分布を選択したので、これを行うことができます。その後、スケーリングとシフトにより、所望の平均と分散を取り消すことができます。

例を考えてみましょう。昨日、分布を関数型の計算を試みていない大きなデータセット(まだRセッションにある)を作成しました(nでのコーシーのサンプル分散のログの値の大きなセットです) = 10)。最初の3つの生のモーメントはそれぞれ1.519、3.597、11.479、またはそれに対応する平均1.518、標準偏差* 1.136、歪度1.429です(これらは大きなサンプルのサンプル値です)。

正式には、モーメント法は生のモーメントと一致させようとしますが、歪度から始めると計算はより簡単になります(3つの未知数の3つの方程式の解を一度に1つのパラメーターの解に変える、はるかに簡単なタスク)。

*分散のn分母(モーメントの正式な方法に対応)とn-1分母の使用の区別を手放し、単純にサンプル計算を使用します。

σμγ

γ1=(eσ2+2)eσ21

σ2σ~2

なお、γ12ある(τ+2)2(τ1)τ=eσ2τ3+3τ24=γ12τ~1.1995σ~20.1819γ1

μ

しかし、シフトガンマ分布またはシフトワイブル分布(またはシフトFまたはその他の選択肢)を簡単に選択して、基本的に同じプロセスを実行することもできます。それらはそれぞれ異なります。

[私が扱っていたサンプルでは、​​値のログの分布がスキューのままであり、それらの立方根の分布が対称に非常に近かったため、シフトガンマはおそらくシフト対数正規よりもかなり良い選択でした。これらは、(シフトされていない)ガンマ密度で見られるものと一致しますが、ログの左スキュー密度は、シフトされた対数正規分布では実現できません。]

ピアソンプロットで歪度-尖度図を取得し、目的の歪度で線を引くことで、2点分布、ベータ分布のシーケンス、ガンマ分布、ベータプライム分布のシーケンス、逆数ガンマ分布とピアソンタイプIV分布のシーケンスは、すべて同じ歪度を持ちます。

β1=γ12β2

所望の歪度線が描かれたピアソンプロット

γ12=2.042σ


もっと瞬間

モーメントは分布をあまりピンダウンしません。したがって、多くのモーメントを指定しても、それらに一致する多くの異なる分布が(特に、極端なテールの動作に関して)残っています。

もちろん、少なくとも4つのパラメーターを持ついくつかの分布ファミリーを選択し、3つ以上のモーメントを一致させることができます。たとえば、上記のピアソン分布では、最初の4つのモーメントを一致させることができます。また、同様の柔軟性を可能にする他の分布の選択肢があります。

混合分布、スプラインを使用したログ密度のモデリングなど、分布特性に一致する分布を選択するために他の戦略を採用できます。

ただし、多くの場合、ディストリビューションを見つけようとしていた当初の目的に戻ると、ここで説明したような戦略よりも優れた方法があることがわかります。


2

だから、答えは一般に NOです、あなたはこれを行うことはできませんが、時にはすることができます。

できないとき

これができない理由は通常 2つあります。

まず、N個の観測値がある場合、最大でN個のモーメントを計算できます。他の瞬間はどうですか?単にゼロに設定することはできません。

γ100=ixi100n

できるとき

今、時々あなたは瞬間から分布を得ることができます。ある種の分布について仮定するときです。たとえば、正常だと宣言します。この場合、必要なのはわずか2モーメントで、通常はかなりの精度で計算できます。正規分布に、実際には尖度など、より高いモーメントがありますが、必要ではないことに注意してください。正規分布のすべてのモーメントを(正規であると仮定せずに)計算してから、分布からサンプリングする特性関数を回復しようとしても、うまくいきません。ただし、より高い瞬間を忘れて最初の2つに固執する場合は、機能します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.