分散と標準偏差の違いは何ですか?


127

分散と標準偏差の違いは何だろうと思っていました。

2つの値を計算すると、分散から標準偏差が得られることは明らかですが、観察している分布に関してはどういう意味ですか?

さらに、なぜ標準偏差が本当に必要なのですか?



12
あなたはおそらく今までに答えを得ました。それでも、このリンクには最も簡単で最良の説明があります。mathsisfun.com/data/standard-deviation.html

2
標準偏差は、値が計算元のデータと同じスケールであるため便利です。メートルを測定する場合、標準偏差はメートルになります。対照的に、分散は二乗されます。
ヴラディスラフドブガレス

1
標準偏差は不偏にできますが、平方根関数は非線形であるため、標準偏差にはできません。
Daksh Gargas

回答:


85

標準偏差は、分散の平方根です。

標準偏差は平均と同じ単位で表されますが、分散は2乗単位で表されますが、分布を調べるには、使用していることが明確である限りいずれかを使用できます。たとえば、平均= 10およびsd = 3の正規分布は、平均= 10および分散= 9の正規分布とまったく同じです。


58
ええ、それはこれら2つのパラメーターを説明する数学的な方法ですが、論理的な説明は何ですか?同じことを示すために2つのパラメーターを実際に調整したのはなぜですか(算術平均の偏差)...
Le Max

5
本当に両方は必要ありません。一方を報告する場合、もう一方を報告する必要はありません
Peter Flom

8
両方が必要です。標準偏差は解釈、報告に適しています。理論を発展させるには、分散の方が優れています。
kjetil bハルヴォルセン

4
標準偏差を報告することの利点は、データの規模にとどまることです。大人の身長のサンプルはメートル単位で、標準偏差もメートル単位であるとします。
ヴラディスラフドヴガレス

5
@RushatRaiランダム変数の合計を処理する場合、分散が加算されます。独立した確率変数については、。同様の式が、独立性のない一般的な場合(共分散項を使用した補正付き)に存在します。一般に、平方根変換は物事を複雑にし、標準偏差を分析的に扱うのをより難しくします。Var(Xi)=Var(Xi)
knrumsey

49

両方は必要ありません。それぞれ異なる目的があります。通常、SDはデータの変動性を記述するのに便利ですが、分散は通常数学的にはるかに役立ちます。たとえば、非相関分布(ランダム変数)の合計には、それらの分布の分散の合計である分散もあります。これはSDには当てはまりません。一方、SDには、元の変数の単位で表現できるという便利さがあります。


24

ジョンが「無関係な分布」と言うときに独立したランダム変数を参照する場合、彼の応答は正しいです。ただし、質問に答えるために、追加できるポイントがいくつかあります。

  1. 平均と分散は、正規分布を決定する2つのパラメーターです。

  2. チェビシェフ不等式は、観測された確率変数が平均の標準偏差内にある確率を制限します。k

  3. 標準偏差は、統計検定の統計を正規化するために使用されます(たとえば、既知の標準偏差は、平均がと異なる検定のサンプル平均を正規化するために使用されます。偏差は不明であり、検定になります)。0 tz0t

  4. 正規分布の場合、分布のが標準偏差以内です。標準偏差内で標準偏差内でます。1 95.4 2 99 368%195.4%299%3

  5. 誤差範囲は、推定値の標準偏差の倍数として表されます。

  6. 分散とバイアスは、ランダムな量の不確実性の尺度です。推定の平均二乗誤差は、分散+二乗バイアスに等しくなります。


4
:あなたは、おそらく分散で割った分散で割った平均値である「自然のパラメータ」、および1言うべきではありませんen.wikipedia.org/wiki/Natural_parameter
ニール・G

σ

ポイント3では、正規化するのではなく「標準偏差を使用して統計を標準化する」べきではないでしょうか。
ハリー

15

データセットの分散は、平均に対するデータの数学的分散を測定します。ただし、この値は理論的には正しいものの、計算に使用される値が二乗されているため、現実世界の意味で適用することは困難です。分散の平方根が元の値と同じ単位の値を与えるため、標準偏差は、標準曲線の概念と連携して作業しやすく、解釈しやすくなります。


これは、簡単な用語で理由を説明する素晴らしい仕事をします。
gwg

3
別の良い点は、各メトリックsdおよびvarが平均に関する変数の広がりを測定することです。分散の平方根を取得して標準偏差を取得することは、メトリックを変数の単位に戻すために適用されるスケーリング係数と見なすことができます。
マットL.

6

分布に関しては、それらは同等ですが(明らかに明らかに互換性はありません)、推定量に関してはそうではないことに注意してください:分散の推定値の平方根は、標準偏差の(不偏)推定量ではありません。適度に多数のサンプル(および推定量に依存)の場合のみ、2つは互いに接近します。サンプルサイズが小さい場合、2つの間で変換する分布のパラメトリック形式を知る必要があります。


4

分散の計算中に、偏差を二乗しました。これは、与えられたデータ(観測値)がメートル単位の場合、メートル平方になることを意味します。偏差についての正しい表現ではないことを願っています。そのため、再び平方根(SD)になります。これはSDに他なりません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.