正常なrvの尖度と歪度を増加させる変換


20

私は、観測値が正規分布しているという事実に依存するアルゴリズムに取り組んでおり、この仮定に対するアルゴリズムの堅牢性を経験的にテストしたいと思います。Y

これを行うために、の正規性を徐々に破壊する一連の変換を探していました。たとえば、が正常である場合、歪度および尖度になり、両方を漸進的に増加させる変換シーケンスを見つけると便利です。Y Y = 0 = 3T1(),,Tn()YY=0=3

私のアイデアは、通常およそ分散されたデータをシミュレートし、そのアルゴリズムをテストすることでした。変換された各データセットT 1Y T ny )のテストアルゴリズムよりも、出力がどの程度変化しているかを確認します。YT1(Y),,Tn(y)

シミュレートされたの分布を制御していないことに注意してください。そのため、正規化を一般化する分布(歪んだ一般化誤差分布など)を使用してシミュレーションできません。Y


2
そのような一連の変換の問題は、その特定のシーケンスの効果に限定されるという結論です。でパスアウト効果トレースであなたのシーケンスの意志(あなたは「配列」と言っているので、おそらく1パラメータ)オフベースのディストリビューションの一つの家族に対応するスペースの通常の変換。生存することを与えるγ 1γ 2の領域が2Dであり、その中の任意の点が単一の曲線をトレースする単一の家族を見て異なる分布の無数があるため、多少制限されること···(CTDを)(γ1,γ2)(γ1,γ2)
Glen_b -Reinstate Monica

1
(ctd)...特に、生成する特定のファミリが、そうでなければかなり一般的な問題を明らかにしない傾向がある場合。
Glen_b -Reinstateモニカ

回答:


22

これは、次のsinh-arcsinh変換を使用して実行できます。

ジョーンズ、MCおよびピュージーA.(2009)。シン-アークシン分布Biometrika 96:761〜780。

変換は次のように定義されます

()H(x;ϵ,δ)=sinh[δsinh1(x)ϵ],

どこδ R +。この変換が通常のCDF S x ; ϵ δ = Φ [ H x ; ϵ δ ]に適用されると、パラメーターϵ δ )が歪度と尖度をそれぞれ制御する単峰分布を生成します(ジョーンズand Pewsey、2009)、van Zwet(1969)の意味で。加えて、もしε = 0δϵRδR+S(x;ϵ,δ)=Φ[H(x;ϵ,δ)](ϵ,δ)ϵ=0、元の正規分布を取得します。次のRコードを参照してください。δ=1

fs = function(x,epsilon,delta) dnorm(sinh(delta*asinh(x)-epsilon))*delta*cosh(delta*asinh(x)-epsilon)/sqrt(1+x^2)

vec = seq(-15,15,0.001)

plot(vec,fs(vec,0,1),type="l")
points(vec,fs(vec,1,1),type="l",col="red")
points(vec,fs(vec,2,1),type="l",col="blue")
points(vec,fs(vec,-1,1),type="l",col="red")
points(vec,fs(vec,-2,1),type="l",col="blue")

vec = seq(-5,5,0.001)

plot(vec,fs(vec,0,0.5),type="l",ylim=c(0,1))
points(vec,fs(vec,0,0.75),type="l",col="red")
points(vec,fs(vec,0,1),type="l",col="blue")
points(vec,fs(vec,0,1.25),type="l",col="red")
points(vec,fs(vec,0,1.5),type="l",col="blue")

したがって、パラメータの適切なシーケンスを選択して、あなたは歪度と尖度レベルの異なるディストリビューション/変換のシーケンスを生成し、それらが同様として、あるいはあなたが好きな正規分布に異なるように見えるようにすることができます。(ϵn,δn)

次のプロットは、Rコードによって生成された結果を示しています。用(I) 及びδ = 1、および(ii)はε = 0δ = 0.5 0.75 1 1.25 1.5 ϵ=(2,1,0,1,2)δ=1 ϵ=0δ=(0.5,0.75,1,1.25,1.5)

ここに画像の説明を入力してください

ここに画像の説明を入力してください

この分布のシミュレーションは簡単なあなただけの逆利用し、通常のサンプルを変換する必要が与えられている()

H1(x;ϵ,δ)=sinh[δ1(sinh1(x)+ϵ)]

2
先延ばしに感謝します!これはまさに私が探していたものです。
マッテオファシオーロ

2
そうですgamlss.dist::rSHASHo、この分布を生成することができます。
アルテムクレフツォフ

7

これは、ランバートW x F確率変数/分布を使用して実行できます。ランバートW x F確率変数(RV)は、分布Fを持つ非線形変換(RV)Xです。

α=1Gaussianize()

それらは

Lambert W x F変換には3つのフレーバーがあります。

  • type = 's'γR
  • type = 'h'δ0α
  • type = 'hh'δl,δr0

ゆがんだ太い尾に関する参考文献を参照してください(免責事項:私は著者です)。

Rでは、LambertWパッケージを使用して、いくつかのLambert W x F分布をシミュレート、推定、プロットなどできます。

library(LambertW)
library(RColorBrewer)
# several heavy-tail parameters
delta.v <- seq(0, 2, length = 11)
x.grid <- seq(-5, 5, length = 100)
col.v <- colorRampPalette(c("black", "orange"))(length(delta.v))

plot(x.grid, dnorm(x.grid), lwd = 2, type = "l", col = col.v[1],
     ylab = "")
for (ii in seq_along(delta.v)) {
  lines(x.grid, dLambertW(x.grid, "normal", 
                          theta = list(delta = delta.v[ii], beta = c(0, 1))),
        col = col.v[ii])
}
legend("topleft", paste(delta.v), col = col.v, lty = 1,
       title = "delta = ")

ここに画像の説明を入力してください

γδlδr


5

そのようなシーケンスの1つは、さまざまな程度の累乗です。例えば

library(moments)
x <- rnorm(1000) #Normal data
x2 <- 2^x #One transformation
x3 <- 2^{x^2} #A stronger transformation
test <- cbind(x, x2, x3) 
apply(test, 2, skewness) #Skewness for the three distributions
apply(test, 2, kurtosis) #Kurtosis for the three distributions

x1.1,x1.2x2


0

@ user10525と同じ答えですが、Pythonで

import numpy as np
from scipy.stats import norm
def sinh_archsinh_transformation(x,epsilon,delta):
    return norm.pdf(np.sinh(delta*np.arcsinh(x)-epsilon))*delta*np.cosh(delta*np.arcsinh(x)-epsilon)/np.sqrt(1+np.power(x,2))


vec = np.arange(start=-15,stop=15+0.001,step=0.001)

import matplotlib.pyplot as plt
plt.plot(vec,sinh_archsinh_transformation(vec,0,1))
plt.plot(vec,sinh_archsinh_transformation(vec,1,1),color='red')
plt.plot(vec,sinh_archsinh_transformation(vec,2,1),color='blue')
plt.plot(vec,sinh_archsinh_transformation(vec,-1,1),color='red')
plt.plot(vec,sinh_archsinh_transformation(vec,-2,1),color='blue')

[1]

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.