250ユニットのサンプルがあります。分布は非対称です。母集団の中央値が3.5とは異なるという仮説を検証したいので、1標本検定が適切だと思います。分布が対称的でないため、ウィルコクソン順位検定は適切ではないことを知っています。サインテストは使用に適していますか?それができない場合、誰もが他のテストを推奨できますか?
250ユニットのサンプルがあります。分布は非対称です。母集団の中央値が3.5とは異なるという仮説を検証したいので、1標本検定が適切だと思います。分布が対称的でないため、ウィルコクソン順位検定は適切ではないことを知っています。サインテストは使用に適していますか?それができない場合、誰もが他のテストを推奨できますか?
回答:
を超えるデータのカウントには、未知の確率二項分布があります。これを使用して、代替のに対して二項検定を実行します。
この投稿の残りの部分では、基礎となるモデルについて説明し、計算の実行方法を示します。R
それらを実行するための作業コードを提供します。基礎となる仮説検定理論の拡張された説明は、「統計検定におけるp値とt値の意味は何ですか?」に対する私の回答に記載されています。。
値がかなり多様であると仮定すると(タイはほとんどありません)、帰無仮説の下では、ランダムにサンプリングされた値は、を超える確率が1/2です(は母集団の中央値として特徴付けられるため)。 。すべての値がランダムに独立してサンプリングされたとすると、を超える値の数は二項分布になります。この数を「カウント」と呼びましょう。
人口の中央値が異なる場合一方、超えランダムにサンプリングされた値のチャンス異なります。これは対立仮説です。
nullの状況を代替案から区別する最良の方法は、nullの可能性が最も高く、代替案の可能性が低いの値を調べることです。これらはに等しいに近い値です。このように、クリティカル領域テストのためには、比較的遠くからの値で構成さ:近くにまたはそれに近い。しかし、が母集団の中央値ではないという重要な証拠を構成するには、からどれくらい離れている必要がありますか?
重要度の基準によって異なります。これはテストサイズと呼ばれ、多くの場合と呼ばれます。帰無仮説の下では、が臨界領域になる確率は近いはずです。
通常、どの代替案が適用されるかについての先入観がない場合(中央値がより大きいかまたは小さい場合)、重要な領域を構築して、その可能性の半分であるあり、が低く、他の半分、、そのは高いです。帰無仮説のもとでの分布がわかっているので、この情報は臨界領域を決定するのに十分です。
技術的には、計算を実行する2つの一般的な方法があります。二項確率を計算するか、正規分布で近似します。
パーセントポイント(分位)関数を使用します。ではR
、たとえば、これが呼び出され、qbinom
そして同じように呼び出されます
alpha <- 0.05 # Test size
c(qbinom(alpha/2, 250, 1/2)-1, qbinom(1-alpha/2, 250, 1/2)+1)
の出力は
109 141
これは重要な領域は、すべての低い値を含むことを意味しとの間の(および含む)と一緒にすべての高い値と、との間の(および含む)及び。チェックとして、nullがtrueの場合にその領域に存在する可能性を計算するように要求できます。0 109 K 141 250R
k
pbinom(109, 250, 1/2) + (1-pbinom(141-1, 250, 1/2))
出力は、自体に非常に近いですが、それより大きくはありません。クリティカル領域は整数で終了する必要があるため、通常、この実際のテストサイズを公称テストサイズと正確に一致させることはできませんが、この場合、2つの値は非常に近いです。α α
二項分布の平均はあり、その分散はであり、標準偏差になります等しい。二項分布を正規分布に置き換えます。標準正規分布は、次のコマンドで計算されるように、確率のが未満です。250 × 1 / 2 = 125 250 × 1 / 2 × (1 - 1 / 2 )= 250 / 4 √α/2=0.05/2-1.95996R
qnorm(alpha/2)
正規分布は対称的であるため、確率のがよりも大きくなり。したがって、クリティカル領域はから標準偏差以上離れたの値で構成されます。これらのしきい値を計算します。これらはに等しくなります。計算は次のように一度に実行できます。+ 1.95996 K 1.95996 125 125 ± 7.9 × 1.96 ≈ 109.5 、140.5
250*1/2 + sqrt(250*1/2*(1-1/2)) * qnorm(alpha/2) * c(1,-1)
以来整数である必要があり、我々はそれがあるとき、それは重要な地域に分類されます参照以下または以上です。この答えは、正確な二項計算を使用して得られた答えと同じです。これは通常、がまたはに比べて近く、サンプルサイズが中程度から大規模(数十以上)で、が非常に小さい(数パーセント)場合です。109 141 P 1 / 2 0 1 α
この検定は、母集団について何も仮定しないため(中央値に焦点を当てた確率があまりないことを除いて)、母集団について特定の仮定を行う他の検定ほど強力ではありません。それでもテストがnullを拒否する場合、電力不足を心配する必要はありません。それ以外の場合は、想定することと、人口について結論を下せることの間で、微妙なトレードオフを行う必要があります。