下の画像を見てください。青い線は標準の標準PDFを示します。赤いゾーンは灰色の領域の合計に等しいはずです(ひどい描画では申し訳ありません)。
グレイゾーンを通常のpdfの上部(レッドゾーン)にシフトすることで、より高いピークを持つ新しい分布を作成できるでしょうか。
そのような変換を行うことができる場合、この新しい分布の尖度についてどう思いますか?Leptokurtic?しかし、それは正規分布と同じ尾を持っています!未定義?
tail
下の画像を見てください。青い線は標準の標準PDFを示します。赤いゾーンは灰色の領域の合計に等しいはずです(ひどい描画では申し訳ありません)。
グレイゾーンを通常のpdfの上部(レッドゾーン)にシフトすることで、より高いピークを持つ新しい分布を作成できるでしょうか。
そのような変換を行うことができる場合、この新しい分布の尖度についてどう思いますか?Leptokurtic?しかし、それは正規分布と同じ尾を持っています!未定義?
tail
回答:
描画に非常によく似た分布が無数にあり、尖度の値はさまざまです。
あなたの質問の特定の条件で、クロスオーバーポイントが内側にあるか、少なくとも外側にあると考えれば、通常よりも少し大きい尖度が得られるはずです。それが発生する3つのケースを示し、次にそれが小さいケースを示し、それが発生する原因を説明します。
ことを考えるとおよび標準正規PDFファイルであり、それぞれCDFは、のは、自分自身少し機能書いてみましょうΦ (x )
いくつかの連続した対称密度(対応する累積分布関数)、平均場合、および。G 0 a=ϕ(t)−bです。g(t)
つまり、および密度が連続作るとに統合するために選択されている。b 1
例1および 1を考えます。t = 1
これはあなたの図面のように見えますが、ここでは次のRコードによって生成されます。
f <- function(x, t=1,
dg=function(x) 2*dnorm(2*x),
pg=function(x) pnorm(2*x),
b=(pnorm(t) - 0.5 - t*dnorm(t))/ (pg(t) - 0.5 - t*dg(t)),
a=dnorm(t)-b*dg(t) ) {
ifelse(abs(x)>t,dnorm(x),a+b*dg(x))
}
f1 <- function(x) f(x,t=1,dg=function(x) 3*dnorm(3*x),pg=function(x) pnorm(3*x))
curve(f1,-4,4,col=2)
lines(x,dnorm(x),col=3)
今計算。を評価する関数を作ってみましょう:
fp <- function(x,p=2) x^p*f1(x)
モーメントを評価できます。まず、分散:
integrate(fp,-Inf,Inf) # should be just smaller than 1
0.9828341 with absolute error < 1.4e-07
次に4番目の中心モーメント:
integrate(fp,-Inf,Inf,p=4) # should be just smaller than 3
2.990153 with absolute error < 8.3e-06
これらの数値の比率が必要です。これは約5桁の精度を持つ必要があります。
integrate(fp,-Inf,Inf,p=4)$value/(integrate(fp,-Inf,Inf)$value^2)
[1] 3.095515
したがって、尖度は約3.0955で、通常の場合よりもわずかに大きくなります。
もちろん、それを代数的に計算して正確な答えを得ることができますが、必要はありません。これにより、知りたいことがわかります。
例2上記で定義した関数を使用すると、あらゆる方法のそれを試すことができます。g
ここにラプラスがあります:
library(distr)
D <- DExp(rate = 1)
f2 <- function(x) f(x,t=1,dg=d(D),pg=p(D))
curve(f2,-4,4,col=2)
lines(x,dnorm(x),col=3)
fp2 <- function(x,p=2) x^p*f2(x)
integrate(fp2,-Inf,Inf) # should be just smaller than 1
0.9911295 with absolute error < 1.1e-07
integrate(fp2,-Inf,Inf,p=4) # should be just smaller than 3
2.995212 with absolute error < 5.9e-06
integrate(fp2,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 3.049065
当然のことながら、同様の結果。
例3:をコーシー分布(1 dfのスチューデントt分布)としますが、スケールは2/3(つまり、が標準コーシーの場合、、そして再びしきい値 tを設定します(ポイントを与える、その外側で通常に「切り替え」)、1に設定します。h (x )g (x )= 1.5 h (1.5 x )± t
dg <- function(x) 1.5*dt(1.5*x,df=1)
pg <- function(x) pt(1.5*x,df=1)
f3 <- function(x) f(x,t=1,dg=dg,pg=pg)
curve(f3,-4,4,col=2)
lines(x,dnorm(x),col=3)
fp3 <- function(x,p=2) x^p*f3(x)
integrate(fp3,-Inf,Inf) # should be just smaller than 1
0.9915525 with absolute error < 1.1e-07
integrate(fp3,-Inf,Inf,p=4) # should be just smaller than 3
2.995066 with absolute error < 6.2e-06
integrate(fp3,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 3.048917
そして、私たちが実際に適切な密度を得ていることを示すために:
integrate(f3,-Inf,Inf)
1 with absolute error < 9.4e-05
例4:しかし、 tを変更するとどうなりますか?
取る及び前の例として、それだけにしきい値を変更:G t = 2
f4 <- function(x) f(x,t=2,dg=dg,pg=pg)
curve(f4,-4,4,col=2)
lines(x,dnorm(x),col=3)
fp4 <- function(x,p=2) x^p*f4(x)
integrate(fp4,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 2.755231
これはどのように起こりますか?
まあ、尖度が(少しゆるく言えば)1+ 2乗分散であることを知っておくことが重要です。
3つの分布はすべて、平均と分散が同じです。
黒い曲線は標準の標準密度です。緑の曲線は、についてかなり集中した分布を示しています(つまり、についての分散は小さく、尖度が1に近づき、最小になります)。赤い曲線は、分布がから「押し出された」場合を示しています。つまり、尖度が大きいです。μ ± σ μ ± σ
このことを念頭に置いて、しきい値ポイントを外側に十分遠くに設定すると 、尖度を3未満に押し下げても、ピークが高くなります。
尖度はかなり誤解されている概念です(LT De Carloの論文「On the Meaning and Use of Kurtosis」(1997)は、関連する問題の賢明で価値のある議論と提示だと思います)。
だから私はナイーブなビューを取り、標準の通常の密度と比較して、「モードでより薄い中間およびより高い値」であるが、後者と同一の「」を持つ密度を構築します。この密度が「過剰な尖度」を示すとは主張していません。
この密度は必然的に段階的です。同じ左右の「尾部」、間隔のためにその関数形有するために、及び、ここで、標準正常に同じであるべきである密度。中間の間隔では、他の関数形式が必要です。これをと呼びます。このはゼロを中心に対称であり、
1)で、モードでの密度の値は標準法線の値よりも高くなります。
2)なので、は連続です。
さらに、は、適切な密度になるように、ドメイン全体で1に統合する必要があります。したがって、この密度は
前述の制限に加えて、
これは、区間下の確率質量が、同じ区間の下の確率質量と等しくなければならないことを要求することと同等です。
特定の値を取得するには、ゼロ平均ラプラス分布の密度を「試行」します
以前に設定したさまざまな要件を満たすには、次のものが必要です。
モードでより高い値の場合、
連続性の場合、
これは中二次です。その判別式は
(それが常にポジティブであることを簡単に確認できます)。さらに、なので、正のルートのみを保持するため、
最後に、密度を1に統合するための要件は、
簡単な統合により、
これはについて数値的に解くことができるので、密度を完全に決定できます。
もちろん、ゼロを中心に対称的な他の関数形を試すこともできます。ラプラシアンpdfは、説明のためだけのものでした。
この分布の尖度は、おそらく正規分布の尖度よりも高くなります。私はこれを大まかな図面に基づいているためだと思います。この方法で質量を移動すると常に尖度が増加することを証明することは可能かもしれませんが、私はそれについて肯定的ではありません。
正規分布と同じ裾をもつことは事実ですが、この分布は、それが導出された正規分布よりも分散が低くなります。つまり、その裾は一部の正規分布の裾と一致しますが、同じ分散の正規分布の裾とは一致しません。したがって、正規化された裾は、実際には正規分布の裾よりも太くなります。また、テールが太くても自動的に尖度が高くなるわけではありませんが、この場合、正規化された4次モーメントもおそらく大きくなります。
OPは、テールを固定し、分布をより「ピーク」にして、「ピーク度」と尖度の関係を確立しようとしているようです。ここでは尖度に影響がありますが、非常にわずかであるため、言及する価値はほとんどありません。これがその主張をサポートする定理です。
定理1:有限の4次モーメントを持つ確率分布を考えます。で質量を置き換えることによって新たな確率分布を構築範囲の質量外側維持 固定し、平均値を維持しますでの標準偏差。その場合、そのようなすべての置換におけるピアソンモーメントの尖度の最小値と最大値の差は、です。
コメント:証明は建設的です。この設定では、実際に代替尖度の最小値と最大値を特定できます。さらに、0.25は、分布に応じて、尖度の範囲の上限です。たとえば、正規分布では、範囲の上限は0.25ではなく0.141です。
一方、次の定理によって与えられるように、尖度に対する尾の大きな影響があります。
定理2:4次モーメントが有限である確率分布を考えます。範囲外の質量を置き換え、質量を固定し、平均とでの標準偏差。次に、そのようなすべての置換におけるピアソンモーメント尖度の最小値と最大値の差は無制限です。つまり、尖度が任意に大きくなるように新しい分布を選択できます。
コメント:これらの2つの定理は、ピアソンモーメントの尖度に対する尾の影響が無限であるのに対し、「尖り」の影響はます。