尖度の定義とその解釈の違い


10

私は最近、SPSSとStataによって提供される尖度値に違いがあることに気づきました。

http://www.ats.ucla.edu/stat/mult_pkg/faq/general/kurtosis.htmを参照してください

私の理解は、それゆえ同じものの解釈が異なるということです。

これに対処する方法に関するアドバイスはありますか?


最初の2つの式は知っていて、それらを区別するのは非常に簡単です。その3番目の式は見ていません。
ピーターフロム-モニカの回復

回答:


9

3つの公式

g2G2b2

g2=m4m22
mr

mr=1n(xix¯)r

ときどき、-3の補正項がこの式に追加され、正規分布の尖度が0になります。-3の項を持つ尖度の式は、過剰尖度と呼ばれます(リンクの最初の式)。

第二式は、(SAS、SPSSおよびMS Excelで使用され、これはご提供いただいたリンクで第三の式)であります

G2=k4k22=n1(n2)(n3)[(n+1)g2+6]

g2

b2=m4s43=(n1n)2m4m223

s2

s2=1n1(xix¯)2

Rkurtosise1071typeg23G2b2

これらの2つの論文は、議論し、すべての3つの式を比較:まず二を

数式間の違いの概要

  1. g2G2b2
  2. G2G2E(G2)=0
  3. 以下のために大規模なサンプルを、式の間の差はごくわずかであり、選択肢はあまり重要ではありません。
  4. mse(g2)<mse(b2)<mse(G2)g2G2G2G2Var(b2)<Var(g2)<Var(G2)
  5. bias(G2)<bias(g2)<bias(b2)mse(G2)<mse(g2)<mse(b2)G2b2 最大二乗平均誤差とバイアスがあります。
  6. n>200bias(G2)<bias(g2)<bias(b2)mse(b2)<mse(g2)<mse(G2)

尖度についてのWikipediaページMathWorldページも参照してください。


私はこれを「いつもの話」の素晴らしく明確な解釈と呼びます。加えて、レプトクルティック、メソクルティック、プラティクルティックという用語は、20世紀に残すべき手荷物にすぎないことを付け加えておきます。さらに真剣に、ピークが上を向いている対フラットトップの解釈は、すべての対称な分布であっても、可能な分布の形状の大きな変動を正当化しません。最後に、実際のバイアスは、不適切に小さいサンプルで遊んでいない限り、あまり影響しませんが、分散は実際に影響します。
Nick Cox

G2γ2g2

G2γ2g2

G2=0

7

問題のリンクはSASについても話します。しかし、実際には、この質問では、おそらくポスター自体の焦点を除いて、特定の名前付きプログラムに限定されません。

ここではかなり異なる種類の問題を区別する必要があると思います。それらのいくつかは幻想であり、いくつかは本物です。

  1. 一部のプログラムは3を減算しますが、減算しないプログラムもあるため、報告される尖度測定値は、減算なしのガウス/正規変数では3、減算ありでは0になります。私はこれに戸惑う人々を見てきました。しばしば、違いが正確に3ではなく2.999であることが判明したときです。

  2. n

したがって、数式の小さな問題があります。#1は#2よりもはるかに大きな取引ですが、理解すればどちらもマイナーです。アドバイスは明らかに、使用しているプログラムのドキュメントを見て、そのような詳細を説明するドキュメントがない場合は、そのプログラムをすぐに中止することです。ただし、変数(1、2)と同じくらい単純なテストケースでは、#1に応じて(補正係数なしで)1または4の尖度が得られます。

次に質問は解釈について尋ねますが、これはよりオープンで論争の的となる問題です。

議論の主な領域に入る前に、しばしば報告されますがほとんど知られていない困難は、尖度の推定値がサンプルサイズの関数として制限されることです。2010年、ニュージャージー州コックスにレビューを書きました。サンプルの歪度と尖度の限界。Stata Journal 10(3):482-495。http://www.stata-journal.com/article.html?article=st0204

要約:サンプルの歪度と尖度は、サンプルサイズの関数によって制限されます。制限、またはそれらの近似値は、過去数十年にわたって繰り返し再発見されていますが、それでもまだよく知られていないようです。制限は推定にバイアスを与え、極端な場合には、親の分布を正確に証明できるサンプルがないことを意味します。主な結果はチュートリアルレビューで説明されており、StataとMataを使用して結果を確認および調査する方法が示されています。

さて、問題の核心と一般的に見なされているものに:

多くの人々は尖度を尖ったものとして解釈しますが、それはしばしば尾部重量の尺度として役立つことを強調します。実際、2つの解釈はどちらも、一部のディストリビューションでは妥当な表現になる場合があります。尖度の単純な言葉による解釈がないことはほぼ必然です。私たちの言語は、平均からの偏差の4乗の和と同じ2乗の和の比較に十分なほど豊かではありません。

Irving Kaplansky(1945a)は、マイナーで見過ごされがちな古典で、尖度の値が異なる分布の4つの例と、尖度のいくつかの議論と一致しない動作に注目を集めました。

分布はすべて平均0と分散1で対称であり、変数に対して密度関数を持っています。xc=π

(1)   (1/3c)(9/4+x4)exp(x2)

(2)   (3/(c8))exp(x2/2)(1/6c)(9/4+x4)exp(x2)

(3)   (1/6c)(exp(x2/4)+4exp(x2))

(4)   (33/16c)(2+x2)exp(3x2/4)

これらの密度をプロットすることは有益です。StataユーザーはkaplanskySSCから私のプログラムをダウンロードできます。密度に対数目盛を使用すると役立つ場合があります。

これらの例は、完全な詳細を明記せずに、尖度が低い、または実際には他の単一のコントラストに関して、尖度が低いまたは高い場合に明確な解釈があるという単純なストーリーを損なうものです。

アーヴィング・カプランスキーという名前がベルを鳴らす場合、それはおそらく現代代数学における彼の作品を知っているためです。彼(1917-2006)はカナダ(後期アメリカ人)の数学者であり、ハーバード大学、シカゴ大学、バークレー大学で教鞭をとり、戦時中はコロンビア大学国防評議会の応用数学グループで学んだ。カプランスキーは、グループ理論、リング理論、演算子代数の理論、および場の理論に大きく貢献しました。彼は熟練したピアニストであり作詞家であり、熱狂的で明快な数学の説明者でした。カプランスキー(1943、1945b)およびカプランスキーとリオーダン(1945)による確率と統計へのその他の貢献にも注意してください。

Kaplansky、I.1943。正規分布の特徴。 Annals of Mathematical Statistics 14:197-198。

カプランスキー、I。1945a。尖度に関する一般的なエラー。 Journal、American Statistical Association 40:259のみ。

カプランスキー、I。1945b。連続する要素の実行の漸近分布。 Annals of Mathematical Statistics 16:200-203。

Kaplansky、I.とRiordan、J.1945。複数のマッチングとシンボリックメソッドによる実行。Annals of Mathematical Statistics 16:272-277。


1
+1カプランスキーに関する興味深いコメント。
whuber

ニック、あなたのコメント「実際には、2つの解釈(ピークとテール)は、一部のディストリビューションでは妥当な表現になる可能性があります。」尖度はあなたに「尖り」について何も教えないので、それは役に立たないので、役に立ちません。真剣に、あなたは「ピーク」が何を意味するかさえ定義できますか?そして、もし私が可能であれば、フォローアップ:「ピーク度」の定義を考えると(それを思い付くことができると仮定して)、それは数学的に尖度にどのように関係しますか?
Peter Westfall 2017年

@Peterウェストフォール我々は尖度が対策を尖度何で合意できるならば、私の引数は高い尖度があることだけすなわち、具体的な曲線と数値結果に基づいていますKaplanskyの引数、ではなく、口頭でスパーリングであり、時にはより高いピーク密度と移行し、逆に用尖度を下げます。私は尖頭という用語にまったく不満がなく、口頭で単純化する義務がある場合、実際には尖度は主に尾の重さの物語であると主張する傾向があります。ここの式はすべての作業を行い、すべての統計的重みを持ち、口頭の論争はあまり役に立たないと思います。
Nick Cox

さらに、完全に対称な分布を除いて、尖度の簡単な特徴付けはあり得ないと思います。私は誰もがピークを定義する義務を負っているとは思いません。存在する定義は尖度の定義であり、実際的な問題はそれについてどのように考えるか、それがどれだけ役立つかです。
Nick Cox

「尖度が尖頂について何も教えていないからといって単に」という文自体は根拠のないものです。欠落している参照には、TASにあなたの論文が必ず含まれます。TASは、関心のある人々があなた自身のより長い議論を検討するためにアクセスできます。
Nick Cox
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.