おそらく、2つのサンプルのt検定を考えているのは、それがt分布が最初に現れる場所であることが多いからです。しかし、実際には、すべてのt検定は、検定統計量の参照分布がt分布であることです。もしZ∼N(0,1)とS2∼χ2dとZとS2の独立した、次いで
ZS2/d−−−−√∼td
の定義によります。私はことを強調するために、このアウトを書いている
tそれは多くのことをアップしますので、分布は、この比率の分布に与えられた名前だけであり、この形式のものがあります
t分布を。2つのサンプルt検定のために、この比は、帰無仮説の下では平均の差はゼロ平均ガウスであり、独立したガウス分布の分散推定値が独立しているため、表示され
χ2(独立性を介して示すことができる
Basuさんの定理 これは、ガウス標本の標準分散推定値が母平均に付随するという事実を使用しますが、標本平均はその同じ量に対して完全で十分です。
線形回帰では、基本的に同じものが得られます。ベクトル形式で。ましょS 2 jは = (X T X )- 1 J Jと予測子と仮定Xが非ランダムであるが。私たちは知っていた場合はσ 2、私たちは持っていると思い
ββ^∼N(β,σ2(XTX)−1)S2j=(XTX)−1jjXσ2
ヌルの下でH0:βJ=0、我々は実際にZテストを持っていると思いますので。しかし、我々は推定たらσ2我々はで終わるχ2、当社の正規性の仮定の下で、私たちの統計とは独立であることが判明、という確率変数 βの J
β^j−0σSj∼N(0,1)
H0:βj=0σ2χ2β^jとし、我々が得る
分布を。
t
ここではその詳細です:仮定。まかせH = X (X T X )- 1 X Tハット行列で我々は
‖ E ‖ 2 = ‖ (I - H )Y ‖ 2 = Y T(I - H )yは。Hはi等であるため、本当に素晴らしい結果が得られます。
y∼N(Xβ,σ2I)H=X(XTX)−1XT
∥e∥2=∥(I−H)y∥2=yT(I−H)y.
H
を有する非中心性パラメーター
δ = β T X T(I - H )X β = β T(X T X - X T X )β = 0、そう実際に、これは中心である
χ 2と
N - PyT(I−H)y/σ2∼χ2n−p(δ)
δ=βTXT(I−H)Xβ=βT(XTX−XTX)β=0χ2n−p自由度(これは
コクランの定理の特殊なケースです)。私が使用している
列の数を示すために
Xを 1列の場合はそう、
Xがインターセプトを与え、その後、我々は持っているだろうと
のp - 1非インターセプト予測因子を。一部の著者は、インターセプトではない予測子の数として
pを使用しているため、そこの自由度で
n − p − 1のようなものが表示されることがありますが、それはすべて同じです。
pXXp−1pn−p−1
この結果は、そのので、σ 2:= 1E(eTe/σ2)=n−pの推定として素晴らしい作品σ2。σ^2:=1n−peTeσ2
この手段その
β J
カイ標準ガウスの比は自由その度で割った二乗されます。これを完了するには、独立性を示す必要があり、次の結果を使用できます。
β^jσ^Sj=β^jSjeTe/(n−p)−−−−−−−−−−√=β^jσSjeTeσ2(n−p)−−−−−−√
結果:のためのと行列AとBでのR L × K及びRをM × Kそれぞれ、A ZおよびB Zはである場合にのみ独立A Σ Bは、T = 0(これは運動であります58(b)Jun ShaoのMathematical Statisticsの第1章にあります)。Z∼Nk(μ,Σ)ABRl×kRm×kAZBZAΣBT=0
我々はβ = (X T Xを)- 1 X T YとE = (I - H )Y Y 〜N(Xのβ 、σ 2 Iを)。この手段
(X T X )- 1 X T ⋅ σ 2 I ⋅ (I - H )T = σ 2β^=(XTX)−1XTye=(I−H)yy∼N(Xβ,σ2I)
(XTX)−1XT⋅σ2I⋅(I−H)T=σ2((XTX)−1XT−(XTX)−1XTX(XTX)−1XT)=0
β^⊥eβ^⊥eTe
β^jσ^Sj∼tn−p
as desired (under all of the above assumptions).
Here's the proof of that result. Let C=(AB) be the (l+m)×k matrix formed by stacking A on top of B. Then
CZ=(AZBZ)∼N((AμBμ),CΣCT)
where
CΣCT=(AB)Σ(ATBT)=(AΣATBΣATAΣBTBΣBT).
CZ is a multivariate Gaussian and it is a well-known result that two components of a multivariate Gaussian are independent if and only if they are uncorrelated, so the condition
AΣBT=0 turns out to be exactly equivalent to the components
AZ and
BZ in
CZ being uncorrelated.
□