統計/機械学習法では、分布はガウス分布で近似されることが多く、サンプリングにはガウス分布が使用されます。彼らは、ディストリビューションの最初の二つのモーメントを計算することによって開始し、推定するために、それらを使用及び。その後、彼らはそのガウスからサンプリングできます。
計算する瞬間が多いほど、サンプリングしたい分布を近似できるようになるはずです。
3つのモーメントを計算するとどうなりますか?それらを使用して分布からサンプリングできますか?そして、これをNモーメントに拡張できますか?
統計/機械学習法では、分布はガウス分布で近似されることが多く、サンプリングにはガウス分布が使用されます。彼らは、ディストリビューションの最初の二つのモーメントを計算することによって開始し、推定するために、それらを使用及び。その後、彼らはそのガウスからサンプリングできます。
計算する瞬間が多いほど、サンプリングしたい分布を近似できるようになるはずです。
3つのモーメントを計算するとどうなりますか?それらを使用して分布からサンプリングできますか?そして、これをNモーメントに拡張できますか?
回答:
3つの瞬間は分布形態を決定しません。最初の3つの母集団モーメントに関連する3つのパラメーターを持つ分布ファミリーを選択した場合、モーメントマッチング(「モーメント法」)を実行して3つのパラメーターを推定し、そのような分布から値を生成できます。このようなディストリビューションは多数あります。
時々、すべての瞬間を持っているだけでは、分布を決定するのに十分ではありません。モーメント生成関数が(0の近傍に)存在する場合、分布を一意に識別します(原則として、逆ラプラス変換を実行して分布を取得できます)。
[いくつかのモーメントが有限でない場合、これはmgfが存在しないことを意味しますが、すべてのモーメントが有限であるが、mgfが0の近傍にまだ存在しない場合もあります。
分布の選択がある場合、最初の3つのモーメントに制約がある最大エントロピー解を検討したいと思うかもしれませんが、それを達成する実際のラインには分布がありません(指数の結果の3次が制限されないため)。
特定の配布選択に対してプロセスがどのように機能するか
関連する歪度を持つ分布を選択したので、これを行うことができます。その後、スケーリングとシフトにより、所望の平均と分散を取り消すことができます。
例を考えてみましょう。昨日、分布を関数型の計算を試みていない大きなデータセット(まだRセッションにある)を作成しました(nでのコーシーのサンプル分散のログの値の大きなセットです) = 10)。最初の3つの生のモーメントはそれぞれ1.519、3.597、11.479、またはそれに対応する平均1.518、標準偏差* 1.136、歪度1.429です(これらは大きなサンプルのサンプル値です)。
正式には、モーメント法は生のモーメントと一致させようとしますが、歪度から始めると計算はより簡単になります(3つの未知数の3つの方程式の解を一度に1つのパラメーターの解に変える、はるかに簡単なタスク)。
*分散のn分母(モーメントの正式な方法に対応)とn-1分母の使用の区別を手放し、単純にサンプル計算を使用します。
なお、ある
しかし、シフトガンマ分布またはシフトワイブル分布(またはシフトFまたはその他の選択肢)を簡単に選択して、基本的に同じプロセスを実行することもできます。それらはそれぞれ異なります。
[私が扱っていたサンプルでは、値のログの分布がスキューのままであり、それらの立方根の分布が対称に非常に近かったため、シフトガンマはおそらくシフト対数正規よりもかなり良い選択でした。これらは、(シフトされていない)ガンマ密度で見られるものと一致しますが、ログの左スキュー密度は、シフトされた対数正規分布では実現できません。]
ピアソンプロットで歪度-尖度図を取得し、目的の歪度で線を引くことで、2点分布、ベータ分布のシーケンス、ガンマ分布、ベータプライム分布のシーケンス、逆数ガンマ分布とピアソンタイプIV分布のシーケンスは、すべて同じ歪度を持ちます。
もっと瞬間
モーメントは分布をあまりピンダウンしません。したがって、多くのモーメントを指定しても、それらに一致する多くの異なる分布が(特に、極端なテールの動作に関して)残っています。
もちろん、少なくとも4つのパラメーターを持ついくつかの分布ファミリーを選択し、3つ以上のモーメントを一致させることができます。たとえば、上記のピアソン分布では、最初の4つのモーメントを一致させることができます。また、同様の柔軟性を可能にする他の分布の選択肢があります。
混合分布、スプラインを使用したログ密度のモデリングなど、分布特性に一致する分布を選択するために他の戦略を採用できます。
ただし、多くの場合、ディストリビューションを見つけようとしていた当初の目的に戻ると、ここで説明したような戦略よりも優れた方法があることがわかります。
だから、答えは一般に NOです、あなたはこれを行うことはできませんが、時にはすることができます。
これができない理由は通常 2つあります。
まず、N個の観測値がある場合、最大でN個のモーメントを計算できます。他の瞬間はどうですか?単にゼロに設定することはできません。
今、時々あなたは瞬間から分布を得ることができます。ある種の分布について仮定するときです。たとえば、正常だと宣言します。この場合、必要なのはわずか2モーメントで、通常はかなりの精度で計算できます。正規分布には、実際には尖度など、より高いモーメントがありますが、必要ではないことに注意してください。正規分布のすべてのモーメントを(正規であると仮定せずに)計算してから、分布からサンプリングする特性関数を回復しようとしても、うまくいきません。ただし、より高い瞬間を忘れて最初の2つに固執する場合は、機能します。