最も明らかな理由は、値に時系列がないことが多いことです。したがって、データをごちゃ混ぜにしても、データによって伝えられる情報に違いはありません。あなたの方法に従えば、データをごちゃ混ぜにするたびに、異なるサンプル分散が得られます。
より理論的な答えは、サンプル分散が確率変数の真の分散を推定することです。確率変数の真の分散は
E [(X − E X )2 ]です。X
E[(X−EX)2].
ここで、は期待値または「平均値」を表します。したがって、分散の定義は、その平均値からの変数間の平均平方距離です。この定義を見ると、データがないため、ここには「時間順序」はありません。これは、ランダム変数の単なる属性です。E
この分布からiidデータを収集すると、実現ます。期待値を推定する最良の方法は、サンプルの平均を取ることです。ここで重要なのは、iidデータを取得したため、データに順序付けがないことです。サンプルx 1、x 2、… 、x nはサンプルx 2と同じです。x1,x2,…,xnx1,x2,…,xnx2,x5,x1,xn..
編集
サンプル分散は、サンプルの特定の種類の分散を測定します。分散は、平均からの平均距離を測定します。データの範囲、分位間範囲など、他の種類の分散があります。
値を昇順で並べ替えても、サンプルの特性は変わりません。取得するサンプル(データ)は、変数からの実現です。サンプルの分散を計算することは、変数の分散がどの程度あるかを理解することに似ています。たとえば、20人をサンプリングして身長を計算すると、それらはランダム変数人の身長から20の「認識」になります。サンプルの分散は、一般的に個人の身長のばらつきを測定することになっています。データを注文する場合
X=
100,110,123,124,…,
サンプルの情報は変更されません。
もう1つの例を見てみましょう。あなたはこのように命じたランダム変数から100回の観測を持って言うことができますその後の平均距離は1単位なので、メソッドでは分散は1になります。
1,2,3,4,5,6,7,8,9,10,11,12,13,14,...100.
「分散」または「分散」を解釈する方法は、データの値の範囲がどのようなものかを理解することです。この場合、.99単位の範囲が得られますが、これはもちろん変動をうまく表していません。
99