最初のk(経験的)モーメントを使用して、近似PDF(つまり、密度推定)をフィットさせる方法は?


11

データセットの(最初の)モーメントを推定できる状況があり、それを使用して密度関数の推定を生成したいと考えています。k

私はすでにピアソン分布に出くわしましたが、それが最初の4つのモーメントのみに依存していることを認識しました(モーメントの可能な組み合わせにいくつかの制限があります)。

さらに、仮定を使用しない場合、有限のモーメントセットは特定の分布を「固定」するのに十分ではないことも理解しています。ただし、(ピアソンファミリーのディストリビューション以外の)より一般的なクラスのディストリビューションを希望します。他の質問を見て、私はそのような分布を見つけることができませんでした(参照:ここここここここここここ、およびここ)。

モーメントの任意のセットに対して定義できるいくつかの(「単純な」)一般化された分布ファミリーはありますか?(標準の正規分布を取り、モーメントのすべてのセットで確認されるまで変換する一連の変換)kkk

(他のモーメントが0であると仮定しても、あまり気にしません)k+1

ありがとう。

ps:私は、拡張された例を喜んでいます。Rコードの例が望ましい。


2
最初のモーメントは、特性関数の最初の導関数をゼロで定義します:。したがって、特性関数のゼロ付近のテイラー展開の最初の項がわかります。その後、反転定理を使用して密度を導出できる場合があります。k E [ X k ] = i k ϕ k X0 kkkE[Xk]=(i)kϕX(k)(0)k
Stephan Kolassa、2015年

@StephanKolassaに感謝します。拡張された回答/ Rコード例の可能性がありますか
Tal Galili、2015年

2
en.wikipedia.org/wiki/Maximum_entropy_probability_distributionは、一般的な方法を提案しています。
whuber

@whuber様、Rコードの例を提案していただけませんか。(また、これはウルフィーの答えに合いますか?)
Tal Galili

これはその回答とはまったく異なるアプローチです。
whuber

回答:


11

方法1:高次ピアソンシステム

ピアソンシステムは、慣例により、微分方程式の解群と見なされます。p(x)

dp(x)dx=(a+x)c0+c1x+c2x2p(x)

ここで、4つのピアソンパラメーターは、母集団の最初の4つのモーメントで表すことができます。(a,c0,c1,c2)

ピアソンシステムを2次に基づく代わりに、高次多項式を基礎石として使用することを検討できます。したがって、たとえば、3次多項式に基づくピアソンスタイルのシステムを検討できます。これは、微分方程式の解のファミリーになります。 p x c0+c1x+c2x2p(x)

dp(x)dx=(a+x)c0+c1x+c2x2+c3x3p(x)

解が得られます:

ここに画像の説明を入力してください

私はしばらく前に(OPと同じ思考トレインを持っている)楽しみにしてこれを解決しました。導出と解決策は、本の第5章に記載されています。興味があれば、ここから無料でダウンロードできます:

http://www.mathstatica.com/book/bookcontents.html

2次(2次)ピアソンファミリーは最初の4モーメントで表すことができますが、3次(3次)ピアソンスタイルファミリーは最初の6モーメントが必要です。

方法2:グラムチャーリエ展開

グラムチャーリエ展開についても、同じ第5章(5.4節を参照)で説明されています。また、任意の大きさのモーメントに基づいて近似密度を構築することもできます。OPが示唆しているように、グラムチャーリエ展開は、エルミート多項式として知られている標準の正規pdfの一連の導関数の関数として近似pdfを表します。グラムチャーリエ係数は、母集団モーメントの関数として解かれます。そして、拡大が大きいほど、必要なモーメントが多くなります。関連するEdgeworthの拡張を確認することもできます。kth

母集団のモーメントまたはサンプルのモーメント??

ピアソンスタイルのシステムの場合:母集団のモーメントがわかっている場合、より高いモーメントを使用すると、より適切にフィットするはずです。ただし、観測されたデータが母集団から抽出されたランダムなサンプルである場合、トレードオフがあります。より高次の多項式はより高次のモーメントが必要であることを意味し、後者の推定値は信頼できない可能性があります(分散が高い)。サンプルサイズが「大きい」の場合を除きます。言い換えると、サンプルデータが与えられると、より高いモーメントを使用したフィッティングは「不安定」になり、結果が悪くなる可能性があります。同じことがグラム・チャーリエ展開にも当てはまります。余分な項を追加すると、実際には適合が悪くなる可能性があるため、注意が必要です。


@wolfies様-回答ありがとうございます。私があなたを正しく理解していれば、グラムシャルリエ展開は私が探しているものとより一致しています(ただし、より一般化されたピアソン分布は知っておくと興味深いですが)。私はあなたの本(第5章、175ページから始まる)を見て、実際に詳細な説明を提供していることを確認しました(私の場合は、推定モーメントを処理する方法についても説明しています)。唯一のことは、私があなたのコードを使用できないことです(私はRユーザーなので)。あなたの答えに感謝します(また、一般的に印象的で興味深い本もありがとう)
Tal Galili

2
:ちょうど様々な方法に対処するためのRパッケージたcran.us.r-project.org/web/packages/PDQutils/vignettes/...
タルGalili
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.