3つのサンプルの比率が等しいかどうかの仮説検定


9

2列の携帯電話顧客情報データのデータセットがあります。最初の列にはアカウントが該当する特定のカテゴリ(A、B、またはC)が含まれ、2番目の列にはそのアカウントがキャンセルされたかどうかのバイナリ値が含まれます。例えば

A | cancelled
C | active
B | active
A | cancelled

私がやりたいのは、アクティブなアカウントとキャンセルされたアカウントでタイプA、B、Cのアカウントの比率が異なるかどうかをテストするためのある種の仮説検定を考え出すことです。帰無仮説はそれらが同じであるというものです。つまり、3つの値に対してこれを行う方法がわからないことを除いて、比率の仮説検定のようなものです。


6
テストを使用して、3つのグループ間の比率が等しいかどうかをテストできます。χ2

また、私は3つの仮説はそれらが異なる場合はB、C対B、およびC対A、対Aを見るためにテストを行うことができます思ってい
user1893354

5
できますが、複数比較の問題を修正する必要があることに注意してください。

お返事ありがとうございます。多重比較の問題であなたが何を意味しているのか知りたいのですが?または、より具体的には、3つの仮説検定法が不利な理由。ありがとう!
user1893354 2013

3
これらは、3つの仮説検定の使用に関する2つの問題です。まず、各ペアが一部のデータを再利用するため、相互依存しています。第2にそれらが実際に独立している場合、nullがtrueの場合でも少なくとも1つが重要である可能性、つまりfalse positiveエラーの可能性は、目的のfalseのほぼ3倍になります。正の率。2番目の問題は、テストを調整する必要があることを示していますが、最初の問題は、適切な調整を見つけることが問題になる可能性があることを示しています。のアプローチは、これらの問題を回避することができます。χ2
whuber

回答:


13

私は一般的に私の回答に基づいて、問題がテストフレームワークにどのように適合するかについてコメントを挿入します。一般に、検定を使用して比率の等価性をテストできます。ここで、典型的な帰無仮説は次のとおりです。χ2H0

H0:p1=p2=...=pk

つまり、すべての比率が互いに等しい。あなたの場合、あなたの帰無仮説は次のとおりです:

H0:p1=p2=p3
あり、仮説は
HA: at leat one pi is different for i=1,2,3

次に、検定を実行するために、次の検定統計量を計算する必要があります。検定統計量の値はχ2

χ2=i=1n(OiEi)2Ei

どこ

  • χ2 =ピアソンの累積検定統計量。分布に漸近しますχ2
  • Oi =観測された頻度
  • Ei =帰無仮説によって主張される期待される(理論上の)頻度
  • n =テーブル内のセルの数

この問題は次の表のように考えることができるので、あなたのケースではです: n=6ここに画像の説明を入力してください

これで検定統計が得られたら、仮説検定を完了するための進め方について2つのオプションがあります。

オプション1)帰無仮説のもとで、テスト静的を適切な臨界値と比較できます。つまり、がtrueの場合、行と列を持つ分割表の統計は、度の分布になるはずです。自由。臨界値計算した後、その場合、帰無仮説を棄却します。明らかに場合、帰無仮説を棄却できません。 χ2H0χ2RCχ2(R1)×(C1)χχ2>χχ2χ

グラフィカルに(すべての数値が構成されています)、これは次のとおりです。 ここに画像の説明を入力してください

グラフから、テスト統計が青色のテスト統計に対応する場合、このテスト統計は臨界領域(つまり、含まれないため、帰無仮説を棄却できません。)。または、緑の検定統計量は臨界領域内にあるため、緑の検定統計量を計算した場合、帰無仮説は棄却されます。χ2χ2<χ

あなたの例では、自由度は

df=(R1)×(C1)=(21)×(31)=1×2=2

オプション2)帰無仮説のもとで検定統計量に関連付けられたp値を計算できます。このp値が特定の -level よりも小さい場合、帰無仮説を棄却できます。p値が -level より大きい場合、帰無仮説を棄却できません。p値は、分布が検定統計量より大きい確率であることに注意してください。α χ 2 R - 1 × C - 1 ααχ(R1)×(C1)2

グラフィック的には ここに画像の説明を入力してください

ここで、p値は、テスト統計よりも大きい領域として計算されます(例では青色の網掛け領域)。

したがって、場合、帰無仮説を棄却できません。H 0α>p-valueH0

もし拒否帰無仮説H 0αp-valueH0

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.