プラトー型の分布はありますか?


30

私は、確率密度が平均から少し離れた後に急速に減少する分布、または私自身の言葉で「プラトー型の分布」を探しています。

ガウスとユニフォームの間の何か。


8
ガウスRVと均一RVを合計できます。
-StrongBad

3
いわゆる約時々の聞こえplatykurtic分布。
JMは統計学者ではない

回答:


53

一般化された正規(バージョン1)サブボチン分布、または指数パワー分布の名前で知られている分布を探しているかもしれません。場所、スケールおよび形状\ pdfでpdfでパラメーター化されますσ βμσβ

β2σΓ(1/β)exp[(|xμ|σ)β]

お気づきのとおり、β=1場合はラプラス分布に似て収束し、β=2場合は正規分布に収束し、β=は一様分布に収束します。

ここに画像の説明を入力してください

それを実装したソフトウェアを探している場合はnormalp、Rのライブラリを確認できます(Mineo and Ruggieri、2005)。このパッケージの優れている点は、とりわけ、一般化された正規分布エラーによる回帰を実装していること、つまりノルムを最小化していること。Lp


ミネオ、AM、およびルッジェーリ、M。(2005)。指数分布のソフトウェアツール:normalpパッケージ。Journal of Statistics Software、12(4)、1-24。


20

@StrongBadのコメントは本当に良い提案です。均一なRVとガウスRVの合計は、パラメーターを適切に選択した場合に正確に探しているものを提供できます。そして、それは実際にかなり良い閉じたフォームのソリューションを持っています。

この変数のpdfは次の式で与えられます:

14a[erf(x+aσ2)erf(xaσ2)]

σaは、ゼロ平均均一RVの「半径」です。 は、ゼロ平均ガウスRVの標準偏差です。σ

PDF


3
参照:Bhattacharjee、GP、Pandit、SNN、およびMohan、R.1963。長方形および通常のエラー分布を含む次元チェーン。Technometrics、5、404〜406。
ティム

15

「プラトー型」の分布は無限にあります。

「ガウスとユニフォームの中間」よりも具体的な何かを求めていましたか?それはいくぶんあいまいです。

簡単な方法が1つあります。ユニフォームの両端に常に半法線を貼り付けることができます。

均一な中心とガウスの尾を持つ密度

法線のスケールに対するユニフォームの「幅」を制御して、プラトーを広くしたり狭くしたりすることができ、ガウス分布とユニフォームを制限ケースとして含む分布のクラス全体を提供できます。

密度は次のとおりです。

h2πσe12σ2(xμ+w/2)2Ixμw/2+h2πσIμw/2<xμ+w/2+h2πσe12σ2(xμw/2)2Ix>μ+w/2

ここで、h=11+w/(2πσ)

固定するための、我々は上に均一に近づくとして、および固定するための我々は接近。σ0w(μw/2,μ+w/2)w0σN(μ,σ2)

以下にいくつかの例を示します(それぞれの場合にを使用):μ=0

このガウス尾部のユニフォームのさまざまな例のプロット

この密度を「ガウス尾部のユニフォーム」と呼ぶこともあります。


1
ああ!私は大好きガウス尾の制服を着て、正式なボールに出席します!;)
アレクシス

7

こちらの私の「悪魔の塔」の分布をご覧ください[1]:

| x | < 0.9399 、F X = 0.2945 / X 2 0.9399 | x | < 2.3242 、F X = 0 2.3242 | x |f(x)=0.3334、 ; 場合、 ; そして、のため、。|x|<0.9399
f(x)=0.2945/x20.9399|x|<2.3242
f(x)=02.3242|x|

悪魔の塔の密度関数は、平らな上部、凸面、極端なカットオフ

「スリップドレス」分布はさらに興味深いものです。

希望する形状の分布を作成するのは簡単です。

[1]:Westfallの、PH(2014)
"尖度尖度1905年として- 2014 RIP"
アム。統計 68(3):191–195。doi:10.1080 / 00031305.2014.917055
パブリックアクセスpdf:http : //www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/pdf/nihms-599845.pdf


こんにちはピーター-私は機能を与え、画像を挿入するだけでなく、完全な参照を与える自由を取りました。(メモリが提供している場合、私はケンドールとスチュアートは、その古典的なテキストに似た暴くの詳細を与えることだと思い、私の記憶が正しければ- 。それは長い間されている-私は、彼らはまた、それが重tailednessではないことを議論すると信じて)
Glen_b -Reinstateモニカ

ありがとう、Glen_b。尖度は、テールインデックスの数値が測定するものだとは言いませんでした。むしろ、私の記事は、尖度が非常に広範な分布のクラスではE(Z ^ 4 * I(| Z |> 1))にほぼ等しいことを証明しています。したがって、尖度は「ピーク」については何も明らかにしません。これは通常、{Z:| Z |の範囲にあります <1}。むしろ、それは主に尾によって決定されます。「重尾」という用語に別の意味がある場合は、E(Z ^ 4 * I(| Z |> 1))と呼びます。
ピーターウェストフォール

また、@ Glen_bどのテールインデックスを参照していますか?無限にあります。テールの交差は、「テール」を適切に定義しません。テールの重さのいくつかのテール交差の定義によると、N(0,1)は.9999 * U(-1,1)+ .0001 * U(-1000,1000)よりも「重いテール」です。尾が有限であるにもかかわらず、明らかにより重い尾があります。ところで、後者は、N(0,1)とは異なり、尖度が非常に高くなっています。
ピーターウェストフォール

コメントのどこにも「テールインデックス」と言っているのが見つかりません。「どのテールインデックスを参照していますか」と言ったときに、あなたがそこに何を参照しているのかよくわかりません。ヘビーテイルネスについて少し言うなら、ケンダルとスチュアートが実際に言っていることを確認するのが最善です。そこでは、標準化された対称変数の密度の漸近比を実際に比較していると思いますが、おそらく生存関数であったかもしれません。ポイントは彼らではなく、鉱山だった
Glen_b -Reinstateモニカ

奇妙な。さて、いずれにしても、ケンドールとスチュアートはそれを間違えました。私の定理が証明するように、尖度は明らかに尾の重量の尺度です。
ピーターウェストフォール

5

たくさんのいい答え。ここで提供されるソリューションには、2つの機能があります。(i)特に単純な機能形式を持つこと、および(ii)結果の分布が必ずプラトー形のpdfを生成すること(特別な場合だけではありません)。これがすでに文献に名前を持っているかどうかはわかりませんが、同じ名前がない場合は、pdfしてプラトー分布と呼びましょう。f(x)

f(x)=k11+x2afor xR

ここで:

  • パラメータは正の整数であり、a
  • k = akは積分の定数です: k=aπsin(π2a)

以下は、パラメーターさまざまな値に対するpdfのプロットです。a

ここに画像の説明を入力してください

パラメーターが大きくなると、密度はUniform(-1,1)分布に向かう傾向があります。次のプロットは、標準の標準(灰色の破線)と比較しています。a

ここに画像の説明を入力してください


3

もう1(EDIT:私は今、それを簡素化。EDIT2:私は、さらにそれを単純化し、今のに絵が本当にこの正確な式を反映していません)。

f(x)=13αlog(cosh(αa)+cosh(αx)cosh(αb)+cosh(αx))

不器用なのは知っていますが、ここでは、が増加するにつれてが行に近づくという事実を利用しました。xlog(cosh(x))x

基本的に、遷移の滑らかさを制御できます()。場合および、私はそれが有効な確率密度(1合計)の保証します。他の値を選択した場合、再正規化する必要があります。a = 2 b = 1alphaa=2b=1


Rのサンプルコードを次に示します。

f = function(x, a, b, alpha){
  y = log((cosh(2*alpha*pi*a)+cosh(2*alpha*pi*x))/(cosh(2*alpha*pi*b)+cosh(2*alpha*pi*x)))
  y = y/pi/alpha/6
  return(y)
}

f私たちの分布です。のシーケンスについてプロットしましょうx

plot(0, type = "n", xlim = c(-5,5), ylim = c(0,0.4))
x = seq(-100,100,length.out = 10001L)

for(i in 1:10){
  y = f(x = x, a = 2, b = 1, alpha = seq(0.1,2, length.out = 10L)[i]); print(paste("integral =", round(sum(0.02*y), 3L)))
  lines(x, y, type = "l", col = rainbow(10, alpha = 0.5)[i], lwd = 4)
}
legend("topright", paste("alpha =", round(seq(0.1,2, length.out = 10L), 3L)), col = rainbow(10), lwd = 4)

コンソール出力:

#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = NaN" #I suspect underflow, inspecting the plots don't show divergence at all
#[1] "integral = NaN"
#[1] "integral = NaN"

そしてプロット:

ログcoshに基づく私の分布

aとをbそれぞれ傾斜の開始点と終了点に変更できますが、その後、さらに正規化が必要になり、計算しませんでした(そのため、プロットで使用a = 2b = 1ています)。


2

中央のプラトーと三角形の分布の辺を持つ非常に単純なものを探している場合、たとえば、プラトーと降下の間の望ましい比率に応じて、N個の三角形の分布を組み合わせることができます。なぜ三角形なのか、そのサンプリング関数はほとんどの言語に既に存在しているからです。それらの1つからランダムにソートします。

Rでは次のようになります。

library(triangle)
rplateau = function(n=1){
  replicate(n, switch(sample(1:3, 1), rtriangle(1, 0, 2), rtriangle(1, 1, 3), rtriangle(1, 2, 4)))
}
hist(rplateau(1E5), breaks=200)

ここに画像の説明を入力してください ここに画像の説明を入力してください


2

ここにかわいいものがあります:2つのロジスティック関数の積。

(1/B) * 1/(1+exp(A*(x-B))) * 1/(1+exp(-A*(x+B)))

これには、区分化されないという利点があります。

Bは幅を調整し、Aはドロップオフの急勾配を調整します。以下に示すのは、B = 1:6とA = 2です。注:これを適切に正規化する方法を理解するのに時間がかかりませんでした。

高原分布

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.