素早い回答
その理由は、データがIIDとされていると仮定されるからXi∼N(μ,σ2)、及び規定
X¯S2==∑NXiN∑N(X¯−Xi)2N−1
形成信頼区間、標本分散に関連付けられた標本分布(
S2、ランダム変数を覚えている!)カイ二乗分布である(
S2(N−1)/σ2∼χ2n−1)、サンプル平均値に関連付けられたサンプリング分布は標準正規分布であると同じように(
(X¯−μ)n−−√/σ∼Z(0,1))あなたは分散を知っている、としたときにはないT-学生と(
(X¯−μ)n−−√/S∼Tn−1)。
長い答え
まず第一に、私たちは、ことを証明しますのカイ二乗分布は以下のN - 1自由度を。その後、分散の信頼区間を導出する際にこの証明がどのように役立つか、カイ二乗分布がどのように現れるか(そしてなぜそれがそんなに役立つのか!)さぁ、始めよう。S2(N−1)/σ2N−1
の証拠
このためには、このウィキペディアの記事のカイ二乗分布に慣れる必要があります。この分布は、唯一つのパラメータがあります自由度、、によって与えられた瞬間生成関数(MGF)を有することを起こる:
M χ 2 ν(T )= (1 - 2 T )- ν / 2。
我々は、分布することを示すことができればS 2(N - 1 )/ σ 2を有するが、このような瞬間生成機能を有し、ν =ν
mχ2ν(t )= (1 − 2 t )- ν/ 2。
S2(N− 1 )/ σ2、
S 2(N − 1ν= N− 1S2(N− 1 )/ σ2有するカイ二乗分布以下の
自由度を。これを示すために、2つの事実に注意してください。
N− 1
我々が定義する場合、
ここで、ZI〜N(0、1)、すなわち、標準正規確率変数の積率母関数Yは、で与えられる
M Y(T)
Y= ∑ (X私− X¯)2σ2= ∑ Z2私、
Z私〜N(0 、1 )YZ2
のMGFは、
m Z 2(t )mY(t )===E [ et Y]E [ et Z21] × E [ et Z22] × 。。。E [ et Z2N]mZ2私(t)×mZ22(t)×...mZ2N(t).
Z2
Iは標準正規のPDF用いたF(Z)=E- Z 2 / 2/√をmZ2(t)==∫∞−∞f(z)exp(tz2)dz(1−2t)−1/2,
及び、従って、
MY(T)=(1-2T) - N / 2、ことを意味し、Yはでカイ二乗分布に従うN個の自由度。f(z)=e−z2/2/2π−−√mY(t)=(1−2t)−N/2,
YN
場合およびY 2は独立しており、それぞれは、カイ二乗分布としてではなくと共に配布ν 1およびν 2次に、自由度W = Y 1 + Y 2つのカイ二乗分布を有するが配信ν 1 + ν 2度自由の(これはWのMGFを取得した結果です;これを実行してください!)Y1Y2ν1ν2W=Y1+Y2ν1+ν2W
上記の事実、あなたが乗算することにより、サンプル分散場合ことに注意して、あなたが(いくつかの代数の後)を取得、
(N - 1 )S 2 = - N (ˉ X - μ )+ Σ(X I - μ )2、
で割ると、したがって、σ 2、
(N - 1 )S 2N−1
(N−1)S2=−n(X¯−μ)+∑(Xi−μ)2,
σ2(N−1)S2σ2+(X¯−μ)2σ2/N=∑(Xi−μ)2σ2.
NS2(N−1)/σ2N−1
分散の信頼区間の計算。
分散の信頼区間を探すとき、限界を知りたいL1 そして L2 に
P (L1≤ σ2≤ L2) =1-α。
括弧内の不等式で遊んでみましょう。まず、除算
S2(N− 1 )、
L1S2(N− 1 )≤ σ2S2(N− 1 )≤ L2S2(N− 1 )。
そして、2つのことを覚えておいてください:(1)統計
S2(N− 1 )/ σ2 has a chi-squared distribution with
N−1 degrees of freedom and (2) the variances is always greather than zero, which implies that you can invert the inequalities, because
L1S2(N−1)≤σ2S2(N−1)σ2S2(N−1)≤L2S2(N−1)⇒⇒S2(N−1)σ2≤S2(N−1)L1,S2(N−1)L2≤S2(N−1)σ2,
hence, the probability we are looking for is:
P(S2(N−1)L2≤S2(N−1)σ2≤S2(N−1)L1)=1−α.
Note that
S2(N−1)/σ2∼χ2(N−1). We want then,
∫N−1S2(N−1)L2pχ2(x)dx∫S2(N−1)L1N−1pχ2(x)dx==(1−α)/2 ,(1−α)/2
(we integrate up to
N−1 because the expected value of a chi-squared random variable with
N−1 degrees of freedom is
N−1) or, equivalently,
∫S2(N−1)L20pχ2(x)dx=α/2,∫∞S2(N−1)L1pχ2(x)dx=α/2.
Calling
χ2α/2=S2(N−1)L2 and
χ21−α/2=S2(N−1)L1, where the values
χ2α/2 and
χ21−α/2 can be found in chi-square tables (in computers mainly!) and solving for
L1 and
L2,
L1L2==S2(N−1)χ21−α/2,S2(N−1)χ2α/2.
Hence, your confidence interval for the variance is
C.I.=(S2(N−1)χ21−α/2,S2(N−1)χ2α/2).