カイ二乗の信頼区間


10

2つの「適合度のカイ2乗」検定を比較するための解決策を見つけようとしています。より正確には、2つの独立した実験の結果を比較します。これらの実験では、著者らは適合度のカイ2乗を使用して、ランダムな推測(期待される周波数)と観測される周波数を比較しました。2つの実験は同じ数の参加者を獲得し、実験手順は同じですが、刺激のみが変更されました。2つの実験結果は、有意なカイ2乗を示しました(式1:X²(18)= 45; p <.0005および式2:X²(18)= 79; p <.0001)。

さて、私がやりたいのは、これらの2つの結果に違いがあるかどうかをテストすることです。信頼区間の使用が解決策になると思いますが、これらの結果だけでこれらの信頼区間を計算する方法がわかりません。あるいは、効果の大きさを比較するテスト(コーエンのw)?

誰かが解決策を持っていますか?

どうもありがとう!

FD


1
こんにちはフロリアン。カイ二乗間の差に順列検定を使用しないのはなぜですか?
Tal Galili

こんにちは、あなたの答えをありがとう!単に順列検定を本当に知らないからです。2つのカイ2乗値のみで置換を実行することは可能ですか(生データはなく、結果のみ)。再びありがとう:)
フロリアン

回答:


8

あなたが持っている非常に限られた情報は確かに厳しい制約です!しかし、物事は完全に絶望的ではありません。

漸近につながる同じ仮定の下で 同じ名前の適合度検定の検定統計の配布、対立仮説の下で検定統計量は、漸近的に、非心てい χ 2分布を。私たちは同じ効果を持っている)は、2つの刺激が)重要であり、bあると仮定した場合、関連する検定統計量は同じ漸近非心なります χ 2分布を。非心パラメータ推定することにより、基本的に-私たちは、テストを構築するためにこれを使用することができ λをし、検定統計量がはるかに非心の尾にあるかどうかを見て χ 218 λχ2χ2χ2λχ2(18,λ^)分布。(ただし、このテストが多くの力を持つと言っているわけではありません。)

2つの検定統計量が与えられれば、それらの平均を取り、自由度(モーメント推定法)を差し引いて44の推定値を与えるか、最尤法により、非心度パラメーターを推定できます。

x <- c(45, 79)
n <- 18

ll <- function(ncp, n, x) sum(dchisq(x, n, ncp, log=TRUE))
foo <- optimize(ll, c(30,60), n=n, x=x, maximum=TRUE)
> foo$maximum
[1] 43.67619

2つのデータポイントと18の自由度を考えると、2つの推定値はよく一致しています。次に、p値を計算します。

> pchisq(x, n, foo$maximum)
[1] 0.1190264 0.8798421

したがって、p値は0.12であり、2つの刺激が同じであるという帰無仮説を棄却するには不十分です。

非心度パラメーターが同じである場合、このテストは実際には(およそ)5%の拒否率を持っていますか?力はありますか?これらの質問に答えるには、次のようにパワーカーブを作成します。まず、平均を推定値43.68 に固定します。2つのテスト統計のための代替のディストリビューションは、非心になりますχ 2λχ2(λδ,λ+δ)δ=1215δ たとえば、テストが90%と95%の信頼度でどのくらいの頻度で拒否されるかを確認します。

nreject05 <- nreject10 <- rep(0,16)
delta <- 0:15
lambda <- foo$maximum
for (d in delta)
{
  for (i in 1:10000)
  {
    x <- rchisq(2, n, ncp=c(lambda+d,lambda-d))
    lhat <- optimize(ll, c(5,95), n=n, x=x, maximum=TRUE)$maximum
    pval <- pchisq(min(x), n, lhat)
    nreject05[d+1] <- nreject05[d+1] + (pval < 0.05)
    nreject10[d+1] <- nreject10[d+1] + (pval < 0.10)
  }
}
preject05 <- nreject05 / 10000
preject10 <- nreject10 / 10000

plot(preject05~delta, type='l', lty=1, lwd=2,
     ylim = c(0, 0.4),
     xlab = "1/2 difference between NCPs",
     ylab = "Simulated rejection rates",
     main = "")
lines(preject10~delta, type='l', lty=2, lwd=2)
legend("topleft",legend=c(expression(paste(alpha, " = 0.05")),
                          expression(paste(alpha, " = 0.10"))),
       lty=c(1,2), lwd=2)

次のようになります。

ここに画像の説明を入力してください

真の帰無仮説ポイント(x軸の値= 0)を見ると、レベルが示すほど頻繁に拒否されるようには見えないが、圧倒的にそうではないという点で、テストは保守的であることがわかります。予想通り、パワーはあまりありませんが、何もないよりはましです。入手できる情報の量が非常に限られていることを考えると、もっと良いテストがあるのではないでしょうか。


私はこのようなものの初心者です。jbowmanの回答からスクリプト(スクリプトの場合)を実行する方法を尋ねてもらえますか。私の場合、90%CIからORを取得しようとします。私はあなたの1人が私にそれを説明できて本当に感謝しています。PASW17を使用しています

こんにちはash6。実際、これはRソフトウェア用スクリプト(詳細:r-project.org)であり、PASW17の構文ではありません。したがって、このスクリプトはRコンソールで直接実行できます。このスクリプトは信頼区間を計算しませんが、2つの実験の差の検定に対応するp値(正確には> pchisq(x、n、foo $ maximum ==> [1] p-value = 0.1190264)を提供します) (ここでは2つの刺激の間で、対立仮説の場合)、そしてここで我々は二つの実験は同じ結果が得られたことを帰無仮説を棄却することはできません。
フロリアン

3

相関として解釈可能なCramerのVを取得し、それをフィッシャーのZに変換すると、その信頼区間は簡単になります(SE = 1 / sqrt(n-3):Z±se * 1.96)。CIの両端を取得したら、それらをrに戻すことができます。

すべてのカウントを、さらなる次元の実験で分割表に入れることを検討しましたか?


私は、ピアソンの適合度がカイ二乗(1変数)のファイを使用することは不可能だと考えました。だから私はコーエンのwについて話しましたが、式は本当に似ています(phi =X²/ nおよびw = sqrt(X²/ n))!しかし、このテストでphiを計算し、rからzへの変換を適用することが可能である場合、引用するための参照を提供することに同意しますか?私たちはこのテストを記事で使用したいと思っています。それは私たちにとってとても大きな助けになるでしょう!あなたの質問について:公開された記事からのX²値、df、pのみの生データはありません。あなたの助けをありがとう!
フローリアン

申し訳ありません...ファイではなくクラマーのVを置くことを意味しました。Cramer's Vはファイのように使用できます。
ジョン

いいえ、引用はありません。効果が大きい場合は、この測定値に多少の偏りがあってもかまいません。大きな効果がない場合は、テストの「重要性」から大きな骨を作らないようにしてください。
ジョン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.