あなたが持っている非常に限られた情報は確かに厳しい制約です!しかし、物事は完全に絶望的ではありません。
漸近につながる同じ仮定の下で 同じ名前の適合度検定の検定統計の配布、対立仮説の下で検定統計量は、漸近的に、非心てい χ 2分布を。私たちは同じ効果を持っている)は、2つの刺激が)重要であり、bあると仮定した場合、関連する検定統計量は同じ漸近非心なります χ 2分布を。非心パラメータ推定することにより、基本的に-私たちは、テストを構築するためにこれを使用することができ λをし、検定統計量がはるかに非心の尾にあるかどうかを見て χ 2(18 、λ)χ2χ2χ2λχ2(18 、λ^)分布。(ただし、このテストが多くの力を持つと言っているわけではありません。)
2つの検定統計量が与えられれば、それらの平均を取り、自由度(モーメント推定法)を差し引いて44の推定値を与えるか、最尤法により、非心度パラメーターを推定できます。
x <- c(45, 79)
n <- 18
ll <- function(ncp, n, x) sum(dchisq(x, n, ncp, log=TRUE))
foo <- optimize(ll, c(30,60), n=n, x=x, maximum=TRUE)
> foo$maximum
[1] 43.67619
2つのデータポイントと18の自由度を考えると、2つの推定値はよく一致しています。次に、p値を計算します。
> pchisq(x, n, foo$maximum)
[1] 0.1190264 0.8798421
したがって、p値は0.12であり、2つの刺激が同じであるという帰無仮説を棄却するには不十分です。
非心度パラメーターが同じである場合、このテストは実際には(およそ)5%の拒否率を持っていますか?力はありますか?これらの質問に答えるには、次のようにパワーカーブを作成します。まず、平均を推定値43.68 に固定します。2つのテスト統計のための代替のディストリビューションは、非心になりますχ 2λχ2(λ − δ、λ + δ)δ= 1 、2 、... 、15δ たとえば、テストが90%と95%の信頼度でどのくらいの頻度で拒否されるかを確認します。
nreject05 <- nreject10 <- rep(0,16)
delta <- 0:15
lambda <- foo$maximum
for (d in delta)
{
for (i in 1:10000)
{
x <- rchisq(2, n, ncp=c(lambda+d,lambda-d))
lhat <- optimize(ll, c(5,95), n=n, x=x, maximum=TRUE)$maximum
pval <- pchisq(min(x), n, lhat)
nreject05[d+1] <- nreject05[d+1] + (pval < 0.05)
nreject10[d+1] <- nreject10[d+1] + (pval < 0.10)
}
}
preject05 <- nreject05 / 10000
preject10 <- nreject10 / 10000
plot(preject05~delta, type='l', lty=1, lwd=2,
ylim = c(0, 0.4),
xlab = "1/2 difference between NCPs",
ylab = "Simulated rejection rates",
main = "")
lines(preject10~delta, type='l', lty=2, lwd=2)
legend("topleft",legend=c(expression(paste(alpha, " = 0.05")),
expression(paste(alpha, " = 0.10"))),
lty=c(1,2), lwd=2)
次のようになります。
真の帰無仮説ポイント(x軸の値= 0)を見ると、レベルが示すほど頻繁に拒否されるようには見えないが、圧倒的にそうではないという点で、テストは保守的であることがわかります。予想通り、パワーはあまりありませんが、何もないよりはましです。入手できる情報の量が非常に限られていることを考えると、もっと良いテストがあるのではないでしょうか。