タグ付けされた質問 「kurtosis」

分布またはデータセットの正規化された4次モーメント。

1
尖度のロバストな推定?
尖度の通常の推定量であるを使用していますが、経験的分布では小さな「外れ値」でさえあることに気付きました、つまり中心から離れた小さなピークは、それを大きく影響します。より堅牢な尖度推定器はありますか?K^=μ^4σ^4K^=μ^4σ^4\hat{K}=\frac{\hat{\mu}_4}{\hat{\sigma}^4}

3
正規分布の歪度と尖度の値の範囲
データが正規分布していると見なされる歪度と尖度の値の範囲はどのくらいか知りたい。 私は多くの議論を読みました、そしてほとんど私は混同した答えを得ました。いくつかは歪度ため言うと(- 2 、2 )正規分布しているの許容範囲である尖度ため。いくつかは述べています(- 1.96 、1.96 )歪度については許容範囲です。私はここで詳細な議論を見つけました:この問題に関するデータの正規分布の歪度と尖度の許容範囲はどのくらいですか?しかし、私は決定的な発言を見つけることができませんでした。(- 1 、1 )(−1,1)(-1,1)(- 2 、2 )(−2,2)(-2,2)(- 1.96 、1.96 )(−1.96,1.96)(-1.96,1.96) そのような間隔を決定するための根拠は何ですか?これは主観的な選択ですか?または、これらの間隔の背後にある数学的説明はありますか?




1
尖度によって生成された外れ値の処理
誰かが尖度に関する情報を手伝ってくれるかどうか疑問に思っていました(つまり、データを変換して削減する方法はありますか?) 多数のケースと変数を含むアンケートデータセットがあります。いくつかの変数について、データはかなり高い尖度値(すなわち、レプトクルト分布)を示しています。これは、多くの参加者が変数に対して正確に同じスコアを与えたという事実から派生しています。私は特に大きなサンプルサイズを持っているので、中心極限定理によれば、正規性の違反はまだ問題ないはずです。 ただし、問題は、特に高レベルの尖度が私のデータセットに多くの単変量の外れ値を生成しているという事実です。そのため、データを変換したり、外れ値を削除/調整したりしても、高レベルの尖度は、次に最も極端なスコアが自動的に外れ値になることを意味します。(判別関数分析)を利用することを目指しています。DFAは、違反が外れ値ではなく歪度によって引き起こされている場合、正常からの逸脱に対して堅牢であると言われています。さらに、DFAはデータの外れ値の影響を特に受けているとも言われています(Tabachnick&Fidel)。 これを回避する方法のアイデアはありますか?(私の最初の考えは尖度を制御する何らかの方法でしたが、私のサンプルのほとんどが同様の評価を与えているのであれば、それは一種の良いことではありませんか?)

2
尖度の定義とその解釈の違い
私は最近、SPSSとStataによって提供される尖度値に違いがあることに気づきました。 http://www.ats.ucla.edu/stat/mult_pkg/faq/general/kurtosis.htmを参照してください 私の理解は、それゆえ同じものの解釈が異なるということです。 これに対処する方法に関するアドバイスはありますか?

2
巨大な尖度?
株価指数の日次リターンの説明統計を行っています。即ち、もし及びP 2は、次いで、それぞれ、1日目と2日目に指数のレベルであるL O のG E(P 2P1P1P_1P2P2P_2は、私が使用しているリターンです(文献では完全に標準です)。loge(P2P1)loge(P2P1)log_e (\frac{P_2}{P_1}) したがって、これらのいくつかでは尖度が巨大です。私は約15年分の日次データを見ている(つまり、約∗ 15時系列観測)260∗15260∗15260 * 15 means sds mins maxs skews kurts ARGENTINA -0.00031 0.00965 -0.33647 0.13976 -15.17454 499.20532 AUSTRIA 0.00003 0.00640 -0.03845 0.04621 0.19614 2.36104 CZECH.REPUBLIC 0.00008 0.00800 -0.08289 0.05236 -0.16920 5.73205 FINLAND 0.00005 0.00639 -0.03845 0.04622 0.19038 2.37008 HUNGARY -0.00019 0.00880 -0.06301 0.05208 …

3
歪度と尖度に相当する正規化されたものはありますか?
データと同じ単位を持つ歪度に正規化された同等のものは何ですか?同様に、尖度と正規化された同等物は何でしょうか?理想的には、これらの関数はデータに対して線形である必要があります。つまり、すべての観測値に係数を掛けるnと、結果として得られる正規化された歪度と尖度に同じ係数が掛けられnます。そのような正規化された同等物を持つ利点は、それらを標準的な箱ひげ図の上に重ねることができることです。

2
主軸因数分解抽出法を使用する場合、探索的因子分析に非正規データのデータ変換が必要ですか?
私は霊性を構成する4つの要素を測定するためのアンケートを作成しています。次の質問をしたいと思います。 主軸因数分解抽出法を使用する場合、探索的因子分析に非正規データのデータ変換が必要ですか? 昨日、データのスクリーニングを終了しました。20問中3問が正に歪んでいるのに対し、20問中1問が負に歪んでいることがわかりました(質問6 = 4.88、質問9 = 7.22、質問12 = 11.11、質問16 = -6.26)。また、質問の1つ(20問中)はレプトクルト(質問12 = 12.21)であることがわかりました。 主軸因数分解抽出法を選択したのは、「最重要度が通常ではないデータ」で使用され、最尤法が通常のデータで使用されることを読んだためです。 データが「非常に」非正常であるかどうかはどのようにしてわかりますか? 私のデータが「ひどく正常でない」場合、これはデータをそのままにして(変換せずに)主軸因数分解抽出法を使用して分析できることを意味しますか?または、EFAに進む前にデータを変換する必要がありますか? データを変換する必要がある場合、ポジティブスキュー、ネガティブスキュー、およびレプトクールアイテムにどの変換を使用しますか?

2
歪度、尖度、および平均からの標準偏差値の数
正規分布でよく知られているように、確率質量の68%は平均の1標準偏差以内、95%は2標準偏差以内、99.7%は3標準偏差以内です。 しかし、私はいくつかの経験的分布を持っています。それはレプトクールで負に歪んでいます。そのような状況で、平均のそれほど多くの標準偏差内にある確率質量の量を計算するために、それらの高次モーメントに基づく式はありますか? 私には測定値があり、それが中点からどのくらい離れているかについての感覚を与えたいと思います(平均または他の中心傾向の測定値)。 これはできますか?

1
歪度と尖度の偏りのない推定量
歪度および尖度のように定義される: ζ4=E[(X-μ)4]ζ3=E[(X−μ)3]E[(X−μ)2]3/2=μ3σ3ζ3=E[(X−μ)3]E[(X−μ)2]3/2=μ3σ3\zeta_3 = \frac{E[(X-\mu)^3]}{E[(X-\mu)^2]^{3/2}} = \frac{\mu_3}{\sigma^3} ζ4=E[(X−μ)4]E[(X−μ)2]2=μ4σ4ζ4=E[(X−μ)4]E[(X−μ)2]2=μ4σ4\zeta_4 = \frac{E[(X-\mu)^4]}{E[(X-\mu)^2]^2} = \frac{\mu_4}{\sigma^4} 次の式は、サンプル歪度および尖度計算するために使用され 、Z4=1をz3= 1んΣんi = 1[ (x私− x¯)3](1んΣんi = 1[ (x私− x¯)2] )3 / 2z3=1n∑i=1n[(xi−x¯)3](1n∑i=1n[(xi−x¯)2])3/2z_3 = \frac{\frac{1}{n}\sum_{i=1}^{n} [(x_i-\bar x)^3]}{(\frac{1}{n}\sum_{i=1}^{n}[(x_i-\bar x)^2])^{3/2}} z4= 1んΣんi = 1[ (x私− x¯)4](1んΣんi = 1[ (x私− x¯)2] )2z4=1n∑i=1n[(xi−x¯)4](1n∑i=1n[(xi−x¯)2])2z_4 = \frac{\frac{1}{n}\sum_{i=1}^{n} [(x_i-\bar x)^4]}{(\frac{1}{n}\sum_{i=1}^{n}[(x_i-\bar x)^2])^2} 私の質問は次のとおりです。これらの推定者は不偏ですか?偏りのない標準偏差を使用するか、分母にバイアスをかけた標準偏差を使用するかはわかりません。 我々は、機能している場合、一般的には、その変数公平推定されているが、我々は言うことができるfは、同様不偏推定量ですか?ffffff

4
構成された分布の尖度
下の画像を見てください。青い線は標準の標準PDFを示します。赤いゾーンは灰色の領域の合計に等しいはずです(ひどい描画では申し訳ありません)。 グレイゾーンを通常のpdfの上部(レッドゾーン)にシフトすることで、より高いピークを持つ新しい分布を作成できるでしょうか。 そのような変換を行うことができる場合、この新しい分布の尖度についてどう思いますか?Leptokurtic?しかし、それは正規分布と同じ尾を持っています!未定義?

2
サンプルの尖度は絶望的に偏っていますか?
かなり歪んだ確率変数の尖度のサンプルを調べていますが、結果に一貫性がないようです。問題を簡単に説明するために、対数正規RVのサンプル尖度を調べました。R(私はゆっくりと学習しています): library(moments); samp_size = 2048; n_trial = 4096; kvals <- rep(NA,1,n_trial); #preallocate for (iii in 1:n_trial) { kvals[iii] <- kurtosis(exp(rnorm(samp_size))); } print(summary(kvals)); 私が得る要約は Min. 1st Qu. Median Mean 3rd Qu. Max. 11.87 28.66 39.32 59.17 61.70 1302.00 Wikipediaによると、この対数正規RVの尖度は約114であるはずです。明らかに、サンプルの尖度は偏っています。 いくつかの調査を行ったところ、サンプルの尖度はサンプルサイズが小さいと偏っていることがわかりました。e1071CRAN のパッケージで提供される「G2」推定量を使用して、このサンプルサイズで非常に類似した結果を得ました。 質問:次のどれが起こっているのかを特徴づけます: サンプルの尖度の標準誤差は、このRVの場合は非常に大きくなります(標準的な誤差の一般的な推定値は)。または、この研究では使用したサンプルが少なすぎます(2048)。1/n−−√1/n1/\sqrt{n} サンプルの尖度のこれらの実装は、たとえば Terriberryの方法(Welfordの方法がサンプルの分散の単純な方法よりも優れた結果を与えるのとほぼ同じ方法)によって修正される可能性がある数値の問題に悩まされています。 人口尖度を誤って計算しました。(痛い) サンプルの尖度は本質的にバイアスされており、このような小さなサンプルサイズでは修正できません。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.