「実際に」プールされた分散とはどういう意味ですか?
私は統計の初心者なので、ここで私を助けてください。 私の質問は次のとおりです。プールされた分散は実際に何を意味しますか? インターネットでプールされた分散の式を探すと、次の式を使用して多くの文献が見つかります(たとえば、http://math.tntech.edu/ISR/Mathematical_Statistics/Introduction_to_Statistical_Tests/thispage/newnode19.html): S2p=S21(n1−1)+S22(n2−1)n1+n2−2Sp2=S12(n1−1)+S22(n2−1)n1+n2−2\begin{equation} \label{eq:stupidpooledvar} \displaystyle S^2_p = \frac{S_1^2 (n_1-1) + S_2^2 (n_2-1)}{n_1 + n_2 - 2} \end{equation} しかし、実際には何を計算しますか?プールされた分散を計算するためにこの式を使用すると、間違った答えが得られるためです。 たとえば、これらの「親サンプル」を考えてみましょう。 2,2,2,2,2,8,8,8,8,82,2,2,2,2,8,8,8,8,8\begin{equation} \label{eq:parentsample} 2,2,2,2,2,8,8,8,8,8 \end{equation} この親サンプルの分散である、その平均であるˉ X P = 5。S2p=10Sp2=10S^2_p=10x¯p=5x¯p=5\bar{x}_p=5 ここで、この親サンプルを2つのサブサンプルに分割するとします。 最初のサブサンプルは、平均と2,2,2,2,2である、分散S 2 1 = 0。x¯1=2x¯1=2\bar{x}_1=2S21=0S12=0S^2_1=0 第2のサブサンプルは、平均と8,8,8,8,8である及び分散S 2 2 = 0。x¯2=8x¯2=8\bar{x}_2=8S22=0S22=0S^2_2=0 ここで、およびS 2 = 0であるため、上記の式を使用してこれら2つのサブサンプルのプール/親分散を計算すると、ゼロが生成されます。それでは、この式は実際に何を計算しますか?S1=0S1=0S_1=0S2=0S2=0S_2=0 一方、長い時間をかけて導出した後、正しいプール/親の分散を生成する式は次のとおりです。 S2p=S21(n1−1)+n1d21+S22(n2−1)+n2d22n1+n2−1Sp2=S12(n1−1)+n1d12+S22(n2−1)+n2d22n1+n2−1\begin{equation} \label{eq:smartpooledvar} \displaystyle S^2_p = …