2つの異なる最小nを生成する不等サイズグループのt検定電力分析を実行できますか?


9

通常、Power Analysisを計算するためにaを実行するのは簡単ですminimum sample size。特に私のお気に入りの統計計算環境であるRでは、簡単です。

ただし、私が行ったものやオンラインで参照できるものとは少し異なる電力分析を実施するように求められています。私が求められていることがさらに可能/有効かどうか疑問に思っています。

プロジェクトには基本的に2つunequal groupsの状態があり、これらの2つのグループは結果変数(顧客への電話の継続時間)に関して大幅に異なるという仮説があります。「コントロール」グループは40の州で構成され、約2,500の観測を生成しました。「テスト」グループには、約10の州と500の観測があります。

最初に、を計算するために使用したグループmeans+ を見つけましpooled standard deviationEffect Size。それから私はと呼ばれるパッケージを使用pwr中にR、私は0.05意義と0.8パワー与えられたグループごとに約135の観測の最小サンプルサイズを、必要なことがわかりました。

ただし、現在のように1つのグループを他のグループよりも大きくしたいため、グループごとに2つの異なる観測値の最小数または状態数の観点からの人口の最小%または「テスト」グループに入らなければならない観察。

2つのサンプルt検定(R関数pwr.t2n.test)のパワー分析が表示されますが、少なくとも1つのサンプルサイズを指定する必要がありますが、両方のグループの最小サンプルサイズを(数値またはパーセンテージ)とこの関数は、2つのグループの標準偏差の違いを反映していません。

これは可能ですか、それとも機能しないことを伝えますか?

回答:


7

異なるサンプルサイズのサンプルサイズ計算を実行できます。

たとえば、nをある比率で(たとえば、母集団に比例するように)決定できます。

その後、パワー計算を行うことができます(少なくとも、代数を実行できるかどうかに関係なく、特定の状況でパワーを取得するためにシミュレートできます)。

問題は、同じサンプルサイズで同じ総数の観測値と比較すると、差を見つけるのが比較的効率が悪いことです。

合計サンプルがあり、母集団の分散が等しく、サンプルの分散がほぼ同じであり、50-50分割と90-10分割の間で選択したとします( vs)。n 1 = 0.5 n n 1 = 0.9 nn=n1+n2n1=0.5nn1=0.9n

2標本のt統計は次のとおりです。

t=X¯1X¯2spooled1n1+1n2

サンプルサイズの影響は、ます。1/1n1+1n2

50対50の分割がある場合、標準偏差が40%小さいようなものです。与えられたで、偶数分割でかなり小さい効果を拾うことができます。n1+n2

結合されたサンプルサイズが効果的な制約ではない場合、この計算は無意味な場合があります。すべての観測値が同じ限界コストを持つ場合に重要ですが、常に関連しているわけではありません。


ありがとう!したがって、これを実際に実行するには、Rでpwr.t2n.test()のようなものを単純に使用して、サンプルサイズを組み合わせた基本的に可能なすべての組み合わせを使用するのが最善の策でしょうか?別の言語/パッケージを使用している場合、私はあなたの答えをRに変換する方法を理解できます。どちらの場合も、解決策に感謝します。
Hack-R 14

ここで何が表示されているのかわかりません。私が知る限り、好きな比率で分割する機能はありません。私の例は、不均一な分割の影響を説明することでした。合計サンプルサイズが固定されている場合は、受け入れられるように、50から50近くに分割します。合計サンプルサイズが固定されていない場合は、コストと制約に基づいて最適化を行います。
Glen_b-モニカを復活させる14

私の情報の範囲は、彼らが現在それらの2つの本当に不平等なグループを持っているということです、それらは50の米国の州全体で3,000の観察に合計します。彼らは、データから得た平均値と標準偏差に基づいて、グループごとの観測の最小数や各グループに入る必要がある%を求めます。彼らがデータを50-50または好きな方法で分割できるかどうかはわかりませんが、グループ1のnの値ごとにグループ2の最小nを表示し、50以外の分割のコストも表示します-50、おそらく力の面で。おおよその提案だと思いましたか?
Hack-R 14

そうですか。確かにそのようなものを計算できますが、必ずしもごとに計算する必要はありません。これらは非常にスムーズに進行します。n
Glen_b-モニカを復活させる14

1
@グレン:それが私が持続時間分析におけるatテストの(役に立たない)有用性についての私のコメントを素早く削除しようとした理由です。しかし、あなたはさらに速かった。もう1つの問題は、データのグループ化された構造です。しかし、あなたの答えは質問に正確に適合します。
マイケルM

2

まず、2つのグループの分散が等しいと仮定するのはなぜですか。「便利だから」と言わないでください。標本の大きさが等しい場合は重要ではありませんが、グループの分散が等しいことを真剣に疑っています。あなたの自由度はオフになりますが、あなたはあなたが少なくとも130を持っていることを知っています、それで誰が気にしますか?対処すべきもっと大きな質問があります。

n1n2ϕn1=10n2


分散が等しいとどうやって仮定したのですか?パワー分析を行う通常の方法は、プールされた標準偏差を使用することですが、1を超える場合は、グループごとに異なる標準偏差を使用して計算を行う可能性について尋ねていました...グループ。
Hack-R 14

n1=n2\n112(n11)
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.