なぜ分散の平方根をとって標準偏差を作成するのですか?


26

これが他の場所で回答されている場合は申し訳ありませんが、私はそれを見つけることができませんでした。

標準偏差を作成するために、特に分散の平方根を使用する理由を疑問に思っていますか?有用な値を生成する平方根を取ることについてはどうですか?



2
標準偏差をユークリッドベクトルのノルム、分散を平方として考えてください。この分散と標準偏差の定義には、有用な分析特性があることがわかりました。
theideasmith

回答:


44

ある意味ではこれは些細な質問ですが、別の場合、実際には非常に深いです!

  • 他は述べたように、平方根を取ることを意味同じ単位持つ。Stdev(X)X

  • 平方根を取ることはあなたに与えられる絶対的な均質性別名絶対スケーラビリティを。スカラーおよびランダム変数場合、次のようになります。 絶対均質性である必要性規範。標準偏差は、が3次元の標準ユークリッドノルムであるのと同様の方法で、ノルム(平均ゼロ確率変数のベクトル空間上)として解釈できます。スペース。標準偏差は、ランダム変数とその平均との間の距離の尺度です。αX

    Stdev[αX]=|α|Stdev[X]
    x2+y2+z2

標準偏差とノルムL2

有限次元の場合:

で次元ベクトル空間、別名標準ユークリッドノルムノルムは次のように定義されます。nL2

x2=ixi2

より広く言えば、 -normは、番目のルートを絶対パスに取得します。同質性:。p xp=(i|xi|p)1ppαxp=(i|αxi|p)1p=|α|(i|xi|p)1p=|α|xp

重み場合、重み付き和も有効なノルムです。さらに、が確率を表し、場合、標準偏差ですqiixi2qiqiE[x]ixiqi=0

無限次元の場合:

無限次元ヒルベルト空間では、同様にノルムを定義できます。L2

X2=ωX(ω)2dP(ω)

場合平均ゼロ確率変数であり、確率測度である、標準偏差は何ですか?同じです:。XPωX(ω)2dP(ω)

概要:

平方根をとることは、標準偏差が絶対均質性、つまりノルムの必須特性を満たすことを意味します

ランダム変数の空間に、ある内積その内積によって誘発される規範。したがって、標準偏差は、意味のないランダム変数の標準です。 これは、平均から。X,Y=E[XY]X2=E[X2]

Stdev[X]=XE[X]2
E[X]X

(技術的ポイント:は標準ですが、標準偏差の要件ので、一般にランダム変数上ノルムないノルム線型空間である場合にのみ 0 doesnの標準偏差」。 tは、確率変数がゼロ要素であることを意味します。)E[X2]E[(XE[X])2]x=0x=0


1
この答えは本当に問題の中心になり、現在受け入れられているものよりも有益なものになります。
-00prometheus

26

分散はとして定義されているため、Xとその期待値の差の2乗の期待値です。XV(X)=E(XE(X))2

が秒単位の時間である場合、は秒単位ですが、はあり、は再び秒単位です。XXE(X)V(X)seconds2V(X)


ああ、それは分散の計算で違いを二乗した結果として生じたスケールの変化を元に戻しているだけですか?
デイブ

11
正しいが、規模ではなく寸法が変化する。
ジャンフランソワコルベット

しかし、そこに単一の用語があるようなものではありません。パワー2の場合、それぞれが他の用語よりも多かれ少なかれ持っています。しかし、平方根をとると、その違いを無視しますよね?最初の分子は取得せず、そのようにすべての差を合計します。個々の用語の平方根を取る方が良いと思いませんか?
パーサー

サンプルに基づいた推定について考えているようです。その場合、そうすると、差はゼロになります:。V^i=1n(xix¯)=i=1nxii=1nxi=0
HStamper

その除き@EricMittman、ないあなたが取得したい、その場合には、平均絶対誤差をa2=|a|a
ドゥガル

6

簡単な答えは、単位が平均と同じスケールであるということです。例:中学生の平均は160cmで、標準偏差(SD)は20cmと推定しています。SDの変動を400 cm ^ 2の分散よりも直感的に把握する方が直感的に簡単です。


0

もっと簡単に言えば、標準偏差は、平均に関するデータの広がりについて何かを示す正の数を与えるように設計されています。

平均からのすべてのポイントの距離を合計すると、正と負の方向のポイントは平均に引き戻される傾向があり、スプレッドに関する情報が失われます。これが分散を最初に測定する理由です。そのため、すべての距離は2乗によって正の量として保持され、互いに相殺されません。最終的には、開始時の単位を表す正の値が必要です-これは既に上記でコメントされています-したがって、正の平方根を取ります。


-3

それは歴史的な愚かさであり、知的怠lazのために私たちは続けています。彼らは、マイナス記号を取り除くために、平均との差を二乗することを選びました。次に、彼らは平方根を取り、平均と同様の尺度にした。

誰かが新しい統計を生成し、平均からの偏差の絶対値またはモジュラスを使用して分散とSDを計算する必要があります。これは、この二乗全体を取り除き、平方根ビジネスを取ります。


1
すでに、平均(または中央値)絶対偏差、L1ノルムなどの形でそれがあります。しかし、伝統的なアプローチの主な利点は、絶対値とは異なり、それはあなたが解析的に物事を最小化し、最大化することを可能にする、微分可能だ、ということです。
マットクラウス

1
あなたはあなたのスタンスの実質的な正当性を提供することに失敗しました、明確にレイアウトされた数学的議論を提供してください。絶対値の合計は、平方和の平方根とは大きく異なります。後者は、有用なプロパティである極値の寄与を強調しています。また、SSQは最小二乗分析法の中心です。読者があなたの視点を理解できるように、SDの問題と代替案の比較について時間をかけてください。。
ReneBt

(-1)「歴史的な愚かさ」や「知的怠laz」のようなフレーズは、自己言及的であると読むのは非常に簡単です。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.