私はそこにある理由を取得していないN
とN-1
母分散を計算しながら。我々は、使用している場合N
、我々は、使用している場合N-1
?
人口が非常に大きい場合、NとN-1の間に違いはないが、最初にN-1がある理由はわかりません。
編集:と混同しないでくださいn
とn-1
推定で使用されています。
編集2:私は人口推定について話していません。
私はそこにある理由を取得していないN
とN-1
母分散を計算しながら。我々は、使用している場合N
、我々は、使用している場合N-1
?
人口が非常に大きい場合、NとN-1の間に違いはないが、最初にN-1がある理由はわかりません。
編集:と混同しないでくださいn
とn-1
推定で使用されています。
編集2:私は人口推定について話していません。
回答:
数学に入る代わりに、わかりやすい言葉で説明します。自由に母集団全体を使用できる場合、その分散(母集団分散)は分母で計算されますN
。同様に、サンプルのみがあり、このサンプルの分散を計算する場合は、分母N
(この場合はサンプルのn)を使用します。どちらの場合も、何も推定しないことに注意してください。測定した平均は真の平均であり、その平均から計算した分散は真の分散です。
ここで、サンプルのみがあり、母集団の未知の平均と分散について推測したいと考えています。つまり、推定値が必要です。母平均の推定のためにサンプル平均を使用します(サンプルが代表的であるため)。母集団の分散の推定値を取得するには、その平均が実際に母集団の平均であると仮定する必要があります。したがって、計算したときからサンプルに依存しなくなります。現在、それが固定されていることを「示す」ために、平均値を「サポート」するためにサンプルから1つの(任意の)観測値を予約します。偶発的なサンプリングに対して鈍感であると信じている。予約済みの観測の1つは「-1」ですN-1
分散推定の計算。
どういうわけか真の母平均を知っているが、サンプルから分散を推定したいと考えてください。次に、その真の平均を分散の式に代入し、分母を適用しますN
。真の平均を知っているため、ここでは「-1」は必要ありません。同じサンプルから推定しませんでした。
N
は、Nとnの両方に使用しました。N
人口またはサンプルのいずれかの手元の全体のサイズです。母集団の分散を計算するには、自由に母集団を用意する必要があります。サンプルのみがある場合は、このサンプルの分散を計算するか、母集団推定分散を計算できます。他の方法はありません。
一般的に、母集団の一部、つまりサンプルしかない場合、n-1で除算する必要があります。そうする正当な理由があり、サンプル平均からの平均二乗偏差に(n-1)/ nを掛けるサンプル分散が、母分散の不偏推定量であることを知っています。
サンプル分散の推定量が不偏であることの証拠は、https://economictheoryblog.com/2012/06/28/latexlatexs2/で見つけることができます。
さらに、母集団の代わりに、母集団の分散の推定量、つまり、nで除算する分散推定量のバージョンをサンプルに適用すると、得られた推定にバイアスがかかります。
過去には、非推論的な分散にNを使用する必要があるという議論がありましたが、私はそれを推奨しません。常にN-1を使用する必要があります。サンプルサイズが小さくなると、N-1はサンプル分散が低くなるという事実をかなり良く補正します(分布のピーク近くでサンプリングする可能性が高くなります---図を参照)。サンプルサイズが非常に大きい場合、意味のある量は重要ではありません。
別の説明として、人口は理論的な構成要素であり、達成することは不可能です。したがって、常にN-1を使用してください。何をしていても、せいぜい母集団の分散を推定するだけです。
また、今後は分散の推定値としてN-1が表示されます。この問題に遭遇することはほとんどないでしょう。ただし、教師が推論と非推論分散測定。その場合、whuberの回答または私の回答を使用しないでください。ttnphnsの回答を参照してください。
この図では、分散は1に近いはずです。Nを使用して分散を推定する場合、サンプルサイズによってどれだけ変化するかを確認してください。(これは他の場所で参照される「バイアス」です)
母集団分散は、母集団内のすべての値の偏差の二乗和を母集団内の値の数で割ったものです。ただし、サンプルから母集団の分散を推定するとき、サンプルの平均からのサンプル値の偏差は、平均して、(不明)真の母集団平均。その結果、サンプルから計算される分散は、真の母集団分散よりもわずかに小さくなります。nの代わりにn-1除数を使用すると、その過小評価が修正されます。