指数関数的なスケールシフトの選択肢に対する力を見つけることは、かなり簡単です。
ただし、データから計算された値を使用して、パワーが何であったかを計算する必要があることはわかりません。この種の事後の電力計算は、直感に反する(そしておそらく誤解を招く)結論をもたらす傾向があります。
パワーは、有意水準と同様に、事実の前に対処する現象です。先験的な理解(理論、推論、以前の研究を含む)を使用して、検討すべき合理的な代替案のセットと望ましい効果のサイズを決定する
他のさまざまな代替案を検討することもできます(たとえば、ガンマファミリ内に指数関数を埋め込んで、スキューケースの影響を検討することができます)。
電力分析で回答しようとする可能性のある通常の質問は次のとおりです。
1)特定のサンプルサイズについて、いくつかの効果サイズまたは効果サイズのセットでの威力は何ですか?*
2)サンプルサイズと検出力を与えられた場合、影響はどのくらい検出できますか?
3)特定のエフェクトサイズに望ましいパワーが与えられた場合、どのサンプルサイズが必要になりますか?
*(ここで「効果サイズ」は一般的に意図されており、たとえば、必ずしも標準化されているわけではない、特定の平均比率または平均の差異である場合があります)。
明らかに、すでにサンプルサイズがあるので、ケース(3)にはありません。ケース(2)またはケース(1)を合理的に検討できます。
ケース(1)をお勧めします(ケース(2)を処理する方法も提供します)。
ケース(1)へのアプローチを説明し、それがケース(2)にどのように関連するかを確認するために、次のような具体的な例を考えてみましょう。
スケールシフトの選択肢
指数関数的集団
64と54の2つのサンプルのサンプルサイズ
サンプルサイズが異なるため、サンプルの1つの相対的な広がりが1よりも小さい場合と大きい場合の両方を考慮する必要があります(同じサイズの場合、対称性の考慮により片側のみを考慮することができます)。ただし、同じサイズに非常に近いため、効果は非常に小さいです。いずれの場合も、一方のサンプルのパラメーターを修正し、もう一方のサンプルを変更します。
だから何をするかです:
予め:
choose a set of scale multipliers representing different alternatives
select an nsim (say 1000)
set mu1=1
計算を行うには:
for each possible scale multiplier, kappa
repeat nsim times
generate a sample of size n1 from Exp(mu1) and n2 from Exp(kappa*mu1)
perform the test
compute the rejection rate across nsim tests at this kappa
Rでは、私はこれをしました:
alpha = 0.05
n1 = 54
n2 = 64
nsim = 10000
s = c(1.1,1.2,1.5,2,2.5,3) # set up grid for kappa
s = c(1/rev(s),1,s) # also below and at 1
rr = array(NA,length(s)) # to hold rejection rates
for(i in seq_along(s)) rr[i]=mean(replicate(nsim,
ks.test(rexp(n1,1),rexp(n2,s[i]))$p.value)<alpha
)
plot(rr~s,log="x",ylim=c(0,1),type="n") #set up plot
points(rr~rev(s),col=3) # plot the reversed case to show the (tiny) asymmetry+noise
points(rr~s,col=1) # plot the "real" case last
abline(h=alpha,col=8,lty=2) # draw in alpha
これは次の力「カーブ」を与えます
x軸は対数目盛、y軸は棄却率です。
ここではわかりにくいですが、黒い点は右側よりも左側の方がわずかに高くなっています(つまり、サンプルが大きいほどスケールが小さくなりますが、電力はわずかに多くなります)。
棄却率の変換として逆正規累積分布関数を使用すると、変換された棄却率と対数カッパ(カッパはs
プロット内にありますが、x軸は対数スケール)の間の関係をほぼ線形にできます(0付近を除く) )、シミュレーションの数が多すぎてノイズが非常に少なくなっています。現在の目的では、シミュレーションを無視することができます。
したがって、線形補間を使用できます。以下に、サンプルサイズでの50%と80%の電力のおおよその効果サイズを示します。
反対側のエフェクトサイズ(大きいグループは小さいスケール)はわずかにシフトされています(わずかに小さいエフェクトサイズを取得できます)が、違いはほとんどないので、要点は説明しません。
そのため、テストでは(スケールの比率が1から)大幅な違いが検出されますが、小さな違いは検出されません。
ここでいくつかのコメントについて:仮説テストは根底にある関心のある質問に特に関連があるとは思われません(それらは非常に類似していますか?)。
運用上、「本質的に同じ」とは実際に何を意味するのかを事前に指定することで、より有用な質問に対処すると思います。これは、合理的に統計的活動を追求したものであり、データの有意義な分析につながるはずです。