分布の平均についての瞬間の直感?


11

なぜp(x)、3番目と4番目のモーメントのような確率分布のより高いモーメントが、それぞれ歪度と尖度に対応するのかについて、誰かが直感を提供できますか?

特に、平均の3乗または4乗の偏差は、なぜ歪度と尖度の測定値に変換されるのですか?これを関数の3次または4次導関数に関連付ける方法はありますか?

尖度のこの定義を考えてみましょう:

Kurtosis(X)=E[(xμX)4]/σ4

繰り返しますが、なぜを上げると「凸凹」が生じるのか、またはが歪むのはなぜかは明らかではありません。魔法のようで神秘的です。X - μ 3(xμ)4(xμ)3

編集:クイックフォローアップ。尖度のような指標の中央値ではなく、平均についてモーメントを定義することの利点は何ですか?次のような推定量のプロパティは何ですか?

MedianKurtosis(X)=E[(xx~)4]/σ4

ここで、は中央値です。これはおそらく、平均を捨てる分布の外れ値の影響をあまり受けず、おそらくピーク度のより公平な尺度になるでしょうか?x~


4
スキューに関する私の直感は、3番目のパワーがネガを保持することに注意することです。そのため、平均からの負の偏差が正の値よりも大きい場合(非常に単純に計算)、負の歪んだ分布になります。尖度に対する私の直感は、4乗が平均からの大きな偏差を2乗よりも大幅に増幅するということです。これが、尖度を分布の裾の太さの尺度として考える理由です。平均muからのxの非常に大きな可能性は4乗になるため、増幅されますが符号は無視されます。
wolfsatthedoor 2014年


1
4乗は1乗よりも外れ値の影響を大きく受けるため、中央値についての4番目の瞬間を見ても、少なくとも堅牢性が目的であれば、ほとんど利益が得られないでしょう。
Glen_b-モニカを復元する

1
最初に、これらの高いモーメントは必ずしも非対称性/ピークの良い/信頼できる尺度ではないことに注意してください。それは私がビームは例えば、最初の3つの瞬間のために良好な物理的直感を与える=意味だと思う、と述べたビームバランス/スケール、分散= カンチレバーの撓み、歪度= シーソーを
GeoMatt22

1
あなたは正しいです、「尖り」を測定するように尖度の解釈がある魔法と神秘的。それはまったく真実ではないからです。尖度はピークについて絶対に何も教えてくれません。テール(外れ値)のみを測定します。ピークがフラット、スパイク、バイモーダル、正弦波、またはベル型であるかどうかに関係なく、ピーク近くの観測値が尖度測定に微小量をもたらすことを数学的に証明するのは簡単です。
Peter Westfall 2017年

回答:


5

これらの定義には正当な理由があります。これは、標準化された確率変数のモーメントの一般的な形式を見ると明らかになります。この質問に答えるには、まずn番目の標準化された中心モーメントの一般形を考えます

ϕn=E[(XE[X]S[X])n ].

ϕ1=0ϕ2=1n3

ϕn+=E[|XE[X]S[X]|n |X>E[X]]P(X>E[X]),ϕn=E[|XE[X]S[X]|n |X<E[X]]P(X<E[X]).

これらは、期待値より上または下であることを条件として、標準化された確率変数の番目の絶対パワーを与える非負の量です。ここで、標準化された中心モーメントをこれらの部分に分解します。n


奇数値尾にスキューを測定する:n任意の奇数値に対して我々は瞬間式に奇数のパワーを持ち、我々は標準化中心モーメントを書き込むことができるように。この形式から、標準化された中心モーメントは、それぞれ平均より上または下であることを条件として、標準化された確率変数の番目の絶対パワーの差を与えることがわかります。n3ϕn=ϕn+ϕnn

したがって、任意の奇数の累乗場合、標準化された確率変数の期待される絶対累乗が平均を下回る値よりも平均を上回る値の場合に正の値を、期待される場合は負の値をメジャーを取得します絶対パワーは、平均を下回る値よりも、平均を上回る値の方が低くなります。これらの量はいずれも、一種の「歪度」の尺度と見なすことができ、指数が高いほど、平均から離れた値に対して相対的な重みが大きくなります。n3

この現象はすべての奇数乗で発生するので、「歪度」の典型的な尺度の自然な選択は、としてを定義することです。これは高次のべき乗よりも標準化された中心モーメントが低く、高次モーメントを考慮する前に低次モーメントを探索するのが自然です。統計では、この標準化された中心モーメントを分布のこの側面を測定する最も低い標準化された中心モーメントであるため、歪度と呼ぶ慣例を採用しています。(奇数の累乗が高いほど歪度のタイプも測定されますが、平均から離れた値にますます重点が置かれます。)n3ϕ3


偶数の値は、尾の太さを測定しnます任意の偶数の値の、モーメント方程式には偶数乗があるため、標準化された中心モーメントをとして記述できます。この形式から、標準化された中心モーメントは、それぞれ平均より上または下であることを条件として、標準化された確率変数の番目の絶対パワーの合計を与えることがわかります。n3ϕn=ϕn++ϕnn

したがって、任意のべき乗場合、非負の値を与える測定値が得られ、標準化された確率変数の分布の裾が太い場合に、より高い値が発生します。これは標準化された確率変数に関する結果であり、スケールの変更(分散の変更)はこのメジャーに影響しないことに注意してください。むしろ、分布の分散を標準化した後、尾の太さの効果的な尺度になります。これらの量のいずれかは、「尖度」のタイプの測定値として合理的に見なすことができ、より高い累乗は、平均から離れた値により大きな相対的重みを与えます。n3

この現象はすべての偶数乗で発生するため、尖度の典型的な測度の自然な選択は、を尖度として定義することです。これは、高次のべき乗よりも標準化された中心モーメントが低く、高次モーメントを考慮する前に低次モーメントを探索するのが自然です。統計では、この標準化された中心モーメントを「尖度」と呼ぶ慣習を採用しています。これは、分布のこの側面を測定する最も低い標準化された中心モーメントであるためです。(偶数乗が高いほど、尖度の種類も測定されますが、平均から離れた値にますます重点が置かれます。)n3φ 4ϕ4


この方程式は、最初の2つのモーメントが存在し、分散がゼロでない分布に対して適切に定義されます。残りの分析では、関心のある分布がこのクラスに含まれると想定します。


2

同様の質問確率分布の「瞬間」について、それほど「瞬間」は何ですか?私は瞬間に対処したものに物理的な答えを出しました。

「角加速度は角速度の導関数であり、時間に対する角度の導関数です。つまり、番目のモーメントは、円運動に適用されるトルクに類似している、またはその円運動(つまり、角度、)の加速/減速(2次導関数も)である場合を考えてください。同様に、3番目のモーメントはトルクの変化率など、さらに高いモーメントの変化率を変化率の変化率の変化率、つまり円運動の逐次微分...dωdt=α,dθdt=ωθ

これは物理的な例で視覚化する方がおそらく簡単なので、リンクを参照してください

歪度は尖度よりも理解しやすいです。負の歪度は、右よりも左の裾が大きく(またはさらに負の方向の外れ値)、正の歪度はその反対です。

ウィキペディアはWestfall(2014)を引用しており、データまたは密度の中心傾向が尖度値に比較的ほとんど影響しないと主張しながら、遠い外れ値を持つ確率変数または1つまたは2つの重い裾を持つ密度関数のいずれかに高い尖度が生じることを示唆しています。尖度の値が低い場合は、その逆、つまり、軸の外れ値がなく、両方の尾の相対的な明度が低いことを意味します。x


歪度は pdfのバランスポイントであり、尖度は pdfのバランスポイントです。どちらの変換も、尾を「伸ばし」、尖度をさらに伸ばします。支点を0に配置したときに pdfが右に落ちる場合、元の分布に正のスキューがあります。支点が3.0に配置されているときに pdfが右に落ちる場合、元の分布は正規分布よりも裾が重いです。ここで、「尾の重さ」とは、質量よりもてこの作用をより正確に指します。ムーアズの解釈は、どちらも「集中」について言及しているため、まったく正しくありません。Z 4 Z 3 Z 4Z3Z4Z3Z4
Peter Westfall、

@PeterWestfall私はムーア人の解釈が不完全であることに同意します。正確な言語は、混乱することなくして簡単に達成することはできません。たとえば「レバレッジ」を考えてみましょう。レバレッジとは最初の瞬間を意味し、2番目の瞬間には「レバレッジレバレッジ」のようなものを考案する必要があります。あなたのアプローチは、新しい概念、つまり「ストレッチレバレッジ」を発明しているようです。幾何学的変換を示唆しているため、議論の余地があり、他者にとっては非物理的であるというリスクにおいて、一貫性があると主張する支持者もいます。 。
カール・

「レバレッジ」とは、変数最初の瞬間を指します。ここで、です。それはロケット科学ではありません。U = Z 4UU=Z4
Peter Westfall、

@PeterWestfall面白すぎることはありませんが、レバレッジを活用しています。もちろん、この単語を引き続き使用できますが4次元のオブジェクトではない場合、1次元の距離と比較すると、それが役立つこともあります。ここでのコンテキストは、瞬間のコンテキストであり、瞬間の物理モデルを作成します。実行できる方法はいくつかあります。たとえば、それについての私の回答をここで参照してください。つまり、物理的な状況に瞬間を置くためには、手を振って4次元を呼び出す以上のことを行う必要があります。 ZZ4Z
カール

@PeterWestfall円運動のコンテキストでは、レバレッジではなく、二次モーメントトルクと呼びます。後者は、不正確ではありませんが、物理的には何の影響もありません。Z2
カール
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.