私は最近、SPSSとStataによって提供される尖度値に違いがあることに気づきました。
http://www.ats.ucla.edu/stat/mult_pkg/faq/general/kurtosis.htmを参照してください
私の理解は、それゆえ同じものの解釈が異なるということです。
これに対処する方法に関するアドバイスはありますか?
私は最近、SPSSとStataによって提供される尖度値に違いがあることに気づきました。
http://www.ats.ucla.edu/stat/mult_pkg/faq/general/kurtosis.htmを参照してください
私の理解は、それゆえ同じものの解釈が異なるということです。
これに対処する方法に関するアドバイスはありますか?
回答:
ときどき、-3の補正項がこの式に追加され、正規分布の尖度が0になります。-3の項を持つ尖度の式は、過剰尖度と呼ばれます(リンクの最初の式)。
第二式は、(SAS、SPSSおよびMS Excelで使用され、これはご提供いただいたリンクで第三の式)であります
これらの2つの論文は、議論し、すべての3つの式を比較:まず、二を。
尖度についてのWikipediaページとMathWorldページも参照してください。
問題のリンクはSASについても話します。しかし、実際には、この質問では、おそらくポスター自体の焦点を除いて、特定の名前付きプログラムに限定されません。
ここではかなり異なる種類の問題を区別する必要があると思います。それらのいくつかは幻想であり、いくつかは本物です。
一部のプログラムは3を減算しますが、減算しないプログラムもあるため、報告される尖度測定値は、減算なしのガウス/正規変数では3、減算ありでは0になります。私はこれに戸惑う人々を見てきました。しばしば、違いが正確に3ではなく2.999であることが判明したときです。
したがって、数式の小さな問題があります。#1は#2よりもはるかに大きな取引ですが、理解すればどちらもマイナーです。アドバイスは明らかに、使用しているプログラムのドキュメントを見て、そのような詳細を説明するドキュメントがない場合は、そのプログラムをすぐに中止することです。ただし、変数(1、2)と同じくらい単純なテストケースでは、#1に応じて(補正係数なしで)1または4の尖度が得られます。
次に質問は解釈について尋ねますが、これはよりオープンで論争の的となる問題です。
議論の主な領域に入る前に、しばしば報告されますがほとんど知られていない困難は、尖度の推定値がサンプルサイズの関数として制限されることです。2010年、ニュージャージー州コックスにレビューを書きました。サンプルの歪度と尖度の限界。Stata Journal 10(3):482-495。http://www.stata-journal.com/article.html?article=st0204
要約:サンプルの歪度と尖度は、サンプルサイズの関数によって制限されます。制限、またはそれらの近似値は、過去数十年にわたって繰り返し再発見されていますが、それでもまだよく知られていないようです。制限は推定にバイアスを与え、極端な場合には、親の分布を正確に証明できるサンプルがないことを意味します。主な結果はチュートリアルレビューで説明されており、StataとMataを使用して結果を確認および調査する方法が示されています。
さて、問題の核心と一般的に見なされているものに:
多くの人々は尖度を尖ったものとして解釈しますが、それはしばしば尾部重量の尺度として役立つことを強調します。実際、2つの解釈はどちらも、一部のディストリビューションでは妥当な表現になる場合があります。尖度の単純な言葉による解釈がないことはほぼ必然です。私たちの言語は、平均からの偏差の4乗の和と同じ2乗の和の比較に十分なほど豊かではありません。
Irving Kaplansky(1945a)は、マイナーで見過ごされがちな古典で、尖度の値が異なる分布の4つの例と、尖度のいくつかの議論と一致しない動作に注目を集めました。
分布はすべて平均0と分散1で対称であり、変数に対して密度関数を持っています。
これらの密度をプロットすることは有益です。Stataユーザーはkaplansky
SSCから私のプログラムをダウンロードできます。密度に対数目盛を使用すると役立つ場合があります。
これらの例は、完全な詳細を明記せずに、尖度が低い、または実際には他の単一のコントラストに関して、尖度が低いまたは高い場合に明確な解釈があるという単純なストーリーを損なうものです。
アーヴィング・カプランスキーという名前がベルを鳴らす場合、それはおそらく現代代数学における彼の作品を知っているためです。彼(1917-2006)はカナダ(後期アメリカ人)の数学者であり、ハーバード大学、シカゴ大学、バークレー大学で教鞭をとり、戦時中はコロンビア大学国防評議会の応用数学グループで学んだ。カプランスキーは、グループ理論、リング理論、演算子代数の理論、および場の理論に大きく貢献しました。彼は熟練したピアニストであり作詞家であり、熱狂的で明快な数学の説明者でした。カプランスキー(1943、1945b)およびカプランスキーとリオーダン(1945)による確率と統計へのその他の貢献にも注意してください。
Kaplansky、I.1943。正規分布の特徴。 Annals of Mathematical Statistics 14:197-198。
カプランスキー、I。1945a。尖度に関する一般的なエラー。 Journal、American Statistical Association 40:259のみ。
カプランスキー、I。1945b。連続する要素の実行の漸近分布。 Annals of Mathematical Statistics 16:200-203。
Kaplansky、I.とRiordan、J.1945。複数のマッチングとシンボリックメソッドによる実行。Annals of Mathematical Statistics 16:272-277。