t分布の背後にある考え方を理解しようとします。これまでに理解した手順は次のとおりです。
- N要素のサンプルを使用して、母平均を推定します。詳細には、母平均の推定値としてサンプル平均を使用します。
- 見積もりが実際の値にどれだけ近いかを知りたいのです。または、より具体的には、母平均が特定の確率でこの間隔内にあると言えるように、サンプル平均の周囲の間隔をどのくらい大きくする必要があるかを知りたいです。
- この質問に答えるために、母集団の値は、既知の平均と標準偏差をもつ正規分布に従って分布していると仮定します。
- 母集団内の値の分布のパラメータがあれば、母集団の分布と標本のサイズの関数として、標本平均の分布を計算できます。
- 標本平均の分布も、次の数式で与えられる母集団分布と標準偏差と同じ平均の正規分布であることを示すことができます。ここで、は標本のサイズです。 N
- サンプル平均の分布があれば、サンプル平均が実際の平均からXだけ離れている確率を簡単に計算できます。つまり、母平均がサンプル平均の周りの特定の間隔内にある確率を計算できます。 。
- ほぼ必要なものです。唯一の問題は、実際の設定では、母集団の分布の標準偏差がわからないことが多いことです(これは、母集団の平均値の周囲に標本平均がどのように分布するかを決定するパラメーターです)。
- 私たちにできることは、母集団標準偏差を標本標準偏差で置き換えることです。言い換えると、正確な未知のパラメータを、その概算で置き換えます。
だから、これが今のところです。母集団STDを標本STDで置き換えることにより、標本平均の分布の推定をさらに悪くします。そして、分布のパラメーターのこの「誤った」値を「補正」するために、分布の形状を変更します(これは正規分布ではなくなったと言います。これはt分布です)。しかし、t分布に従って正確に何が分布されるのでしょうか。母集団STDがわかっている場合、標本平均が母集団平均の周囲にどのように分布しているかがわかります。これで、母集団のSTDはわかりませんが、母集団の平均値の周りの標本平均の分布は変わりません。
X_n
)の代わりに、「標準化された平均」について話しています。標準化された平均の分布は、平均がゼロでSTDが1の正規分布と言えます。いいえ、集団STDをサンプルSTDで置き換えることにより別の変数を定義し、この新しい変数はt分布に従って分布されていると言います。OK。私が理解していない最後のことは、母平均を標本平均に置き換えない理由です。シグマがわからない場合は、ムーもわからないでしょう。