(1)統計は、サンプルから計算できる数値です。それはあなたが持っているかもしれないすべてのサンプルを整頓するのに使用されます(仮定されたモデルの下で、コインが彼らの端に着かないとあなたが持っているもの)。場合あなたが実際に得たサンプルから計算するものであり、・、対応する確率変数であり、その後、p値は次式で与えられ
帰無仮説下。「より大きい」と「より極端な」は原則的に重要ではありません。正規平均の両側検定では、
を使用できますが、
適切なテーブルがあるため。(倍増に注意してください。)TtTPr(T≥t)H0Pr(|Z|≥|z|)2min[Pr(Z≥z),Pr(Z≤z)]
帰無仮説の下で確率の順序でサンプルを配置するための検定統計量の要件はありません。(Zagの例のように)他の方法が逆に見える場合もあります(何を測定するか、とのどのような不一致が最も重要であるか、などに関する詳細情報なしで)。しかし、しばしば他の基準が使用されます。したがって、テスト統計用のバイモーダルPDFをし、上記の式を使用してをテストます。rH0H0
(2)はい、それらは下を意味し。H0
(3)「頭の頻度が0.5ではない」のような帰無仮説は、あなたがそれを決して拒否することができないので、役に立たない。「ヘッドの頻度は0.49999999」を含む、または好きなだけ近い複合ヌルです。事前にコインが公正であるかどうかに関係なく、問題に関係する有用な帰無仮説を選択します。おそらく、実験後、頭の頻度の信頼区間を計算して、明らかに公平なコインではないか、公正に近いか、または調べるためにさらに試行する必要があることを示す方が便利です。
(1)の図:
10回のトスでコインの公平性をテストしているとします。結果はます。それらの3つは次のとおりです。210
HHHHHHHHHHHTHTHTHTHTHHTHHHTTTH
おそらく最初の2つは少し疑わしいと思うでしょう。ただし、nullの下の確率は等しくなります。
Pr(HHHHHHHHHH)=11024Pr(HTHTHTHTHT)=11024Pr(HHTHHHTTTH)=11024
どこにでも到達するには、テストするヌルの代替のタイプを検討する必要があります。ヌルとオルタナティブの両方で各トスの独立性を仮定する準備ができている場合(&実際の状況では、これは実験トライアルが独立していることを確認するために非常に懸命に働くことを意味することが多い)、情報を失うことなくテスト統計としてヘッドの総数を使用できます。(この方法でサンプル空間を分割することは、統計が行うもう1つの重要な仕事です。)
したがって、カウントは0〜10です。
t<-c(0:10)
ヌルの下での分布は
p.null<-dbinom(t,10,0.5)
データに最適な代替のバージョンでは、(たとえば)10頭中3頭が表示される場合、頭の確率はであるため、310
p.alt<-dbinom(t,10,t/10)
ヌルの下の確率と代替の下の確率の比(尤度比と呼ばれる)を取得します。
lr<-p.alt/p.null
と比べて
plot(log(lr),p.null)
したがって、このnullの場合、2つの統計順序は同じ方法でサンプリングします。0.85のnullで繰り返した場合(つまり、ヘッドの長期的な頻度が85%であることをテストした場合)、繰り返されません。
p.null<-dbinom(t,10,0.85)
plot(log(lr),p.null)
理由を見るために
plot(t,p.alt)
一部の値は代替案では確率が低く、尤度比検定の統計ではこれが考慮されます。注意:この検定統計量は極端ではありませんt
HTHTHTHTHT
そして、それは問題ありません-すべてのサンプルは、ある観点から極端であると考えることができます。検出できるようにするNULLとの矛盾の種類に応じて、テスト統計を選択します。
...この一連の思考を続けて、1つのコインが次のコインに影響を与える代替案に対して同じヌルをテストするために、サンプル空間を異なる方法で分割する統計を定義できます。実行回数呼び出しように、r
HHTHHHTTTH
持っています:r=6
HH T HHH TTT H
疑わしいシーケンス
HTHTHTHTHT
有し。だからr=10
THTHTHTHTH
一方、極端な
HHHHHHHHHHTTTTTTTTTT
持っています。ヌルの下の確率を検定統計量(好きな方法)として使用すると、サンプルのp値r=1
HTHTHTHTHT
したがって、です。このテストを以前のテストと比較すると、注目に値するのは、nullの下で確率によって与えられた順序に厳密に従う場合でも、サンプル空間を分割するためにテスト統計を定義する方法は、代替案の検討に依存することです。41024=1256