本当に古い質問に答えるようなものはありませんが、ここに行きます...
p値はほぼ有効な仮説検定です。これは、Jaynesの2003年確率理論の本(反復実験:確率と頻度)から抜粋したわずかに適合した抜粋です。検定する帰無仮説あるとします。データDと事前情報Iがあります。H 0をテストする不特定の仮説H Aがあると仮定します。事後オッズ比H Aに対するH 0は次いで次式で与えられます。H0D私HAH0HAH0
P(HA| DI)P(H0| DI)= P(HA| 私)P(H0| 私)× P(D | HA私)P(D | H0私)
右側の最初の項はデータに依存しないため、データは2番目の項を介してのみ結果に影響を与えることができます。今、私たちは常に対立仮説発明することができますようにP (D | H A I )= 1 "完璧なフィット感"という仮説を- 。したがって、1を使用できますHAP(D | HA私)= 1は、データがヌルに関する対立仮説をどれだけうまくサポートできるかの尺度として。データが1より大きいH0をサポートできるという対立仮説はありません1P(D | H0私)H0。代替のクラスを制限することもできます。変更は、1がそのクラス内の最大化された尤度(正規化定数を含む)に置き換えられることです。場合はP(D|H0私は)小さすぎなり始めるとの間に多数の代替ので、我々は、ヌルを疑うし始めH0とHAは、(無視できない事前確率といくつか含む)成長します。しかし、これはp値で行われる処理に非常に近いものですが、1つの例外を除いて、tの確率を計算しません(1P(D | H0私)1P(D | H0私)H0HA統計値 t (D )および統計値の「不良」領域の t 0。Dの確率を計算します。これは、サブセット(t (D ))ではなく、実際に持っている情報です。t (D )> t0t (D )Dt (D )
人々がp値を使用するもう1つの理由は、それらがしばしば「適切な」仮説検定に相当するが、計算が簡単になる可能性があることです。これは、既知の分散で正規平均をテストする非常に簡単な例で示すことができます。我々は、データ持っ仮定モデルでxはI〜NをoをR 、M L (μ 、σ 2)(事前情報の一部I)。私たちは、テストしたいH 0:μ = μ 0D≡{x1,…,xN}xi∼Normal(μ,σ2)IH0:μ=μ0。次に、少し計算した後、次のようにします。
P(D|H0I)=(2πσ2)−N2exp(−N[s2+(x¯¯¯−μ0)2]2σ2)
ここで、およびs2=1x¯¯¯=1N∑Ni=1xi。この表示されていることの最大値P(D|H0I)が達成される場合μ0= ¯ X。最大化された値は次のとおりです。s2=1N∑Ni=1(xi−x¯¯¯)2P(D|H0I)μ0=x¯¯¯
P(D|HAI)=(2πσ2)−N2exp(−Ns22σ2)
したがって、これら2つの比率を取得すると、次のようになります。
P(D|HAI)P(D|H0I)=(2πσ2)−N2exp(−Ns22σ2)(2πσ2)−N2exp(−Ns2+N(x¯¯¯−μ0)22σ2)=exp(z22)
z=N−−√x¯¯¯−μ0σ|z|x¯¯¯
x¯¯¯X¯¯¯¯∼Normal(μ,σ2N)X¯¯¯¯x¯¯¯|X¯¯¯¯−μ0||X¯¯¯¯−μ0|≥|x¯¯¯−μ0|
p-value=P(|X¯¯¯¯−μ0|≥|x¯¯¯−μ0||H0)
=1−P[−N−−√|x¯¯¯−μ0|σ≤N−−√X¯¯¯¯−μ0σ≤N−−√|x¯¯¯−μ0|σ|H0]
=1−P(−|z|≤Z≤|z||H0)=2[1−Φ(|z|)]
|z|
この例では両方とも簡単に実行できますが、より複雑なケースでは必ずしもそれほど簡単ではありません。場合によっては、使用する適切な統計を選択し、そのサンプリング分布を計算する方が簡単な場合があります。その他では、代替のクラスを定義し、そのクラスを最大化する方が簡単な場合があります。
この単純な例は、非常に多くの仮説検定が「近似正常」なものであるため、大量のp値ベースの検定を説明しています。また、コインの問題に対する近似的な回答を提供します(二項式への通常の近似を使用して)。また、この場合のp値は、少なくとも1つの仮説をテストするという点で、あなたを迷わせることはありません。この場合、p値は帰無仮説に対する証拠の尺度であると言えます。
0.193.870.05196.830.12.330.052.78