成功の2つの比率の差が統計的に有意であるかどうかを判断しようとしている実験に必要なサンプルサイズを知りたいとしましょう。これが私の現在のプロセスです:
- 履歴データを見て、ベースライン予測を確立します。過去に、行動を起こすと10%の成功率になり、行動しないと9%の成功率になると言います。これらの結論は統計的に検証されていませんが、比較的大量のデータ(10,000以上の観測)に基づいていると仮定します。
これらの仮定をpower.prop.testにプラグインして、以下を取得します。
power.prop.test(p1=.1,p2=.11,power=.9) Two-sample comparison of proportions power calculation n = 19746.62 p1 = 0.1 p2 = 0.11 sig.level = 0.05 power = 0.9 alternative = two.sided
したがって、これは、比率間の有意差を検出するために、A / Bテストの各グループで最大20000のサンプルサイズが必要になることを示しています。
次のステップは、各グループで20,000の観測値を使用して実験を実行することです。グループB(アクションなし)は20,000回の観測のうち2300回の成功を収めていますが、グループA(アクションを実行)は20,000回の観測のうち2200回の成功を収めています。
prop.testを実行する
prop.test(c(2300,2100),c(20000,20000)) 2-sample test for equality of proportions with continuity correction data: c(2300, 2100) out of c(20000, 20000) X-squared = 10.1126, df = 1, p-value = 0.001473 alternative hypothesis: two.sided 95 percent confidence interval: 0.003818257 0.016181743 sample estimates: prop 1 prop 2 0.115 0.105
したがって、比率が等しいという帰無仮説を棄却できると言います。
ご質問
- この方法は正しいですか、それとも少なくとも正しい方向に進んでいますか?
alt="greater"
power.prop.testが両側テストであったとしても、prop.testで指定してp値を信頼できますか?- prop.testのp値が.05より大きい場合はどうなりますか?統計的に有意なサンプルがあると仮定する必要がありますが、2つの比率の間に統計的に有意な差はありませんか?さらに、統計的有意性は、prop.testのp値に固有のものですか?つまり、power.prop.testも必要ですか?
- 50/50に分割できず、たとえば95/5に分割する必要がある場合はどうなりますか?この場合のサンプルサイズを計算する方法はありますか?
- プロポーションのベースライン予測がどうあるべきかわからない場合はどうなりますか?私が推測し、実際の比率がかなりずれている場合、それは私の分析を無効にしますか?
あなたが埋めることができる他のギャップがあれば大いに感謝されます-この投稿の複雑な性質に対する私の謝罪 ありがとうございました!
>
は、単に太字にするのではなく、(引用されたブロックの先頭にある)ブロック引用を示すためのマークアップを使用することを検討します。