母集団の中央値をテストする方法は?


9

250ユニットのサンプルがあります。分布は非対称です。母集団の中央値が3.5とは異なるという仮説を検証したいので、1標本検定が適切だと思います。分布が対称的でないため、ウィルコクソン順位検定は適切ではないことを知っています。サインテストは使用に適していますか?それができない場合、誰もが他のテストを推奨できますか?


3
いくつかの理由で、あなたは最初の行で私を失いました。(1)サンプルはガウス分布を持つことはできません(ただし、ガウス分布は可能です)。(2)すべてのガウス分布の(したがって、それらの近似の)特性の1つは、対称性です。あなたは自分と矛盾しています。統計的な専門用語ではなく、独自の用語でデータを説明することで、自分が持っているものをよりよく伝えることができます。また、データを使用して本当に達成したいことを、できるだけわかりやすく説明してもらえますか?「中央値に基づくサンプル検定」とはどのような情報を提供することを意図していますか?
whuber

1
サンプルの中央値は、それが何であってもです。それをテストする必要はないでしょう。おそらく、(サンプルが取得される)母集団の中央値が等しいかどうかをテストする必要がありますか?その場合、の値がどのように開発されたかを知ることが重要です。それはおそらく他のデータセットの要約ですか?それとも、品質基準などの所定の数ですか?3.53.53.5
whuber

1
これは事前に
定義された

2
分布が非対称であるため、母集団の中央値が3.5と異なる場合に仮説を検定したい ...」-サンプルの非対称性がどの仮説に興味深い影響を与えるのでしょうか?「使用するのに適切な符号テストですか?」-確かに、しかし(少なくとも元の形式では)連続性に依存します-変数が離散的である場合は、それを適合させる必要があります(データの内容がわからない場合)の)。
Glen_b-2015

データは継続的です
LeonRupnik 2015年

回答:


8

あらすじ

を超えるデータのカウントには、未知の確率二項分布があります。これを使用して、代替のに対して二項検定を実行します。3.5pp=1/2p1/2

この投稿の残りの部分では、基礎となるモデルについて説明し、計算の実行方法を示します。Rそれらを実行するための作業コードを提供します。基礎となる仮説検定理論の拡張された説明は、「統計検定におけるp値とt値の意味は何ですか?」に対する私の回答に記載されています。

統計モデル

値がかなり多様であると仮定すると(タイはほとんどありません)、帰無仮説の下では、ランダムにサンプリングされた値は、を超える確率が1/2です(は母集団の中央値として特徴付けられるため)。 。すべての値がランダムに独立してサンプリングされたとすると、を超える値の数は二項分布になります。この数を「カウント」と呼びましょう。3.51/2=50%3.53.52503.5(250,1/2)k

人口の中央値が異なる場合一方、超えランダムにサンプリングされた値のチャンス異なります。これは対立仮説です。3.53.51/2

適切なテストを見つける

nullの状況を代替案から区別する最良の方法は、nullの可能性が最も高く、代替案の可能性が低いの値を調べることです。これらはに等しいに近い値です。このように、クリティカル領域テストのためには、比較的遠くからの値で構成さ:近くにまたはそれに近い。しかし、が母集団の中央値ではないという重要な証拠を構成するには、からどれくらい離れている必要がありますか?k1/225012512502501253.5

重要度の基準によって異なります。これはテストサイズと呼ばれ、多くの場合と呼ばれます。帰無仮説の下では、が臨界領域になる確率は近いはずです。ααk

通常、どの代替案が適用されるかについての先入観がない場合(中央値がより大きいかまたは小さい場合)、重要な領域を構築して、その可能性の半分であるあり、が低く、他の半分、、そのは高いです。帰無仮説のもとでの分布がわかっているので、この情報は臨界領域を決定するのに十分です。3.5α/2kα/2kk

技術的には、計算を実行する2つの一般的な方法があります。二項確率を計算するか、正規分布で近似します。

二項確率を使用した計算

パーセントポイント(分位)関数を使用します。ではR、たとえば、これが呼び出され、qbinomそして同じように呼び出されます

alpha <- 0.05 # Test size
c(qbinom(alpha/2, 250, 1/2)-1, qbinom(1-alpha/2, 250, 1/2)+1)

の出力はα=0.05

109 141

これは重要な領域は、すべての低い値を含むことを意味しとの間の(および含む)と一緒にすべての高い値と、との間の(および含む)及び。チェックとして、nullがtrueの場合にその領域に存在する可能性を計算するように要求できます。0 109 K 141 250k0109k141250Rk

pbinom(109, 250, 1/2) + (1-pbinom(141-1, 250, 1/2))

出力は、自体に非常に近いですが、それより大きくはありません。クリティカル領域は整数で終了する必要があるため、通常、この実際のテストサイズを公称テストサイズと正確に一致させることはできませんが、この場合、2つの値は非常に近いです。α α0.0497αα

通常の近似による計算

二項分布の平均はあり、その分散はであり、標準偏差になります等しい。二項分布を正規分布に置き換えます。標準正規分布は、次のコマンドで計算されるように、確率のが未満です。250 × 1 / 2 = 125 250 × 1 / 2 × 1 - 1 / 2 = 250 / 4 (250,1/2)250×1/2=125250×1/2×(11/2)=250/4α/2=0.05/2-1.95996250/47.9α/2=0.05/21.95996R

qnorm(alpha/2)

正規分布は対称的であるため、確率のがよりも大きくなり。したがって、クリティカル領域はから標準偏差以上離れたの値で構成されます。これらのしきい値を計算します。これらはに等しくなります。計算は次のように一度に実行できます。+ 1.95996 K 1.95996 125 125 ± 7.9 × 1.96 109.5 140.50.05/2+1.95996k1.95996125125±7.9×1.96109.5,140.5

250*1/2 + sqrt(250*1/2*(1-1/2)) * qnorm(alpha/2) * c(1,-1)

以来整数である必要があり、我々はそれがあるとき、それは重要な地域に分類されます参照以下または以上です。この答えは、正確な二項計算を使用して得られた答えと同じです。これは通常、がまたはに比べて近く、サンプルサイズが中程度から大規模(数十以上)で、が非常に小さい(数パーセント)場合です。109 141 P 1 / 2 0 1 αk109141p1/201α


この検定は、母集団について何も仮定しないため(中央値に焦点を当てた確率があまりないことを除いて)、母集団について特定の仮定を行う他の検定ほど強力ではありません。それでもテストがnullを拒否する場合、電力不足を心配する必要はありません。それ以外の場合は、想定することと、人口について結論を下せることの間で、微妙なトレードオフを行う必要があります。


2
これは実際には、同じ哲学を支持するだけでなく、あなたの回答が構造化されている方法においても、より抽象的な「p値の意味」の回答の実際に使用された例であるため、リンクする必要があると思います(「これが実際にどのように適用されるかは、私の回答で... ")にあります。
Silverfish、2015年

2
@シルバーありがとうございます。それは確かに私の心を超えていました。ちょっと待ってみようかな。とりわけ、進取的なコミュニティメンバーが重複したスレッドを掘り起こしたとしても、私は驚かないでしょう。結局のところ、これは基本的な資料です。二項検定について多くの質問が行われています。これが新しいものであることの唯一の主張は、それが中央値の検定の必要性としてここに到着したということです-それは当初明らかに二項検定ではなかった-そして私の唯一の主張は価値あるものでなければならない読書はすべてのステップを説明する努力にあります。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.