標準偏差式のサンプル数「N」に対して平方根が使用されるのはなぜですか?


9

標準偏差の非常に基本的な概念を理解しようとしています。

式からσ=i=1n(xiμ)2N

なぜ人口 "N"を半分にする必要があるのか​​理解できません。つまり、行わなかったのに、なぜを取りたいのですか?それは私たちが検討している人口を歪めていませんか?NN2

の式であってはなりませんσ=i=1n(xiμ)2N

回答:


10

平均からの「典型的な」偏差を見つけようとしています。

分散は、「平均からの平均二乗距離」です。

標準偏差はその平方根です。

これにより、平均からの二乗平均平方根偏差になります。

  1. なぜ平均二乗偏差を使用するのですか?分散が興味深いのは何ですか?とりわけ、分散に関する基本的な事実のため -非相関変数の合計の分散は、個々の分散の合計です。(これについては 、CrossValidatedなどのいくつかの質問で説明されています。この便利な機能は、たとえば、平均絶対偏差では共有されません。
  2. なぜその平方根を取るのですか?それは、元の観測と同じ単位であるためです。これは、平均値(前述のRMS距離)から特定の種類の「典型的な距離」を測定しますが、上記の分散特性があるため、いくつかの優れた特徴があります。

7

標準偏差は、の平方根である分散

分散は、平均からのデータの平均二乗距離です。平均は合計を合計した項目数で割ったものであるため、分散の式は次のとおりです。 繰り返しますが、標準偏差は単にこれの平方根であるため、標準偏差の式は次のとおりです: 何も追加または変更されていませんここでの仮定または分散は、分散の平方根をとっただけです。なぜなら、それが標準偏差だからです
S.D. X=

Var(X)=E[(Xμ)2]=i=1N(xiμ)2N

S.D.(X)=Var(X)=i=1N(xiμ)2N

たぶん、この分散式は離散的なユニフォームにのみ当てはまることを言及する必要があります。それ以外の場合は、サンプルと母集団分散の区別を混乱させる可能性がある
テイラー

@テイラー、私はあなたの意味がわかりません。分散の式は分布とは無関係です。
ガン-モニカの回復

(サンプル)分散のための式は、分布(とは無関係であるen.wikipedia.org/wiki/Expected_value#Definition
テイラー

@テイラー、私はまだあなたの意味がわかりません。分散の式は分布とは無関係です。ウィキペディアのページから引用すると、「確率変数の分散Xは、Xの平均からの偏差の2乗の期待値です...。この定義には、離散、連続、どちらでもない、または混合しているプロセスによって生成される確率変数が含まれます。 " この公式は離散的なユニフォームだけに当てはまるわけではありません。Var(X)=E[(Xμ)2]
ガン-モニカの復活

はい、そうです。をとりますが、は必ずしもランダム変数と等しくない場合、。1つは、1つ目は定数で、2つ目はランダムです。実際、合計がのサポートを超えているのか、サンプル数を超えているのかは明らかではありません。後者の場合、を知っているのは奇妙です。これは実際にはまれです。前者の場合、そうです、それは離散的(合計であるため)均一(重みがすべて均一であるため)にのみ当てはまります。μ=EXE[(Xμ)2]X1Ni(xiμ)2Xμ
テイラー

1

最初に理解することは、標準偏差(std)が平均絶対偏差とは異なることです。これら2つは、データに関する異なる数学的特性を定義します。

平均絶対偏差とは異なり、標準偏差(std)は、平均値から離れた値に重きを置きます。これは、差分値を二乗することによって行われます。

たとえば、次の4つのデータポイントの場合:

Data(x)|xmean|(xmean)222422466366636x=0(|xmean|)=16(xmean)2=80

平均絶対偏差(aad)、および=16/4=4.0

標準偏差(std)=80/4=20=4.47

データには、平均から6の距離にある2つのポイントと、平均から2の距離にある2つのポイントがあります。したがって、4.47の偏差は4よりも意味があります。

総観察が常にあるので、 STDを計算するために、我々はによってダイビングない、、代わりに我々は、総分散を分割、元のデータと同じ単位にそれをもたらすために、その平方根を取ります。NNN


0

@Mahesh Subramaniya-これは数学的なひねりです。ような元の値が場合。これらの2つの方程式およびを使用して同じ値を取得できます。a/b=()da2b=ccb=d

たとえば、 =ます。しかし、私たちはマイナスではなく価値だけを望んでいます。522.5

ここで、です。そして、522=12.512.52=2.5

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.