このカイ二乗検定結果を再現できますか?


7

時が経つにつれてSkeptics.StackExchange、答えは電磁過敏症への研究を引用しています:

使用されている統計の一部について疑わしいので、それらが適切に使用されていることを再確認する専門知識に感謝します。

図5aは、電磁場発生器がオンになったときに被験者が検出を試みた結果を示しています。

簡略版は次のとおりです。

 Actual:   Yes  No
Detected:
  Yes       32  19
  No       261 274

彼らはカイ二乗検定を使用したと主張し、有意性を見出した(pが何であるかを述べずにp <0.05)。

フィールドの存在下と不在下での体性反応と行動反応の頻度は、カイ2乗検定(2×2テーブル)またはフィッシャーの正確確率検定のフリーマンハルトン拡張(2×3テーブル;フリーマン&ハルトン、1951年)。

いくつか問題があります。

  • 彼らは一部のデータを除外しました-表5bを参照-長期間デバイスをオフにした。そのデータを分離することの正当性がわかりません。

  • 彼らは、実際のデバイスがオンの場合は結果が統計的に有意であると主張しているようですが、そうでない場合はそうではありません。(私はこれを誤解しているかもしれませんが、はっきりしていません。)カイ2乗検定で得られる結果ではありませんか。

  • このテストをオンラインの計算機で再現しようとしたところ、統計的に重要ではないことがわかりました。

これが私の本当の質問です。私はこれを正しいと思いますか?:フィッシャーの正確確率検定を使用した両側カイ2乗検定は、このデータを分析する正しい方法であり、統計的に有意ではありません。


「検出された」変数と「実際の」変数は同じユニットで観察されますか?もしそうなら、私はこれが対称性の問題だと思います。
モモ

@モモ:答えはイエスだと思います。600件のトライアルがありました。300では、デバイスは実際にオンでした、そして他の300ではデバイスは実際にオフでした。被験者は、電磁放射を検出できるかどうかを尋ねられ、はいまたはいいえと答えました。14のケースでは、彼女は答えられず、それらは除外されました。535件のケースで、彼女は「いいえ」と答えました。これは、彼女の感度が低いことを意味します(存在する場合)。それがどのように対称性の問題を引き起こすのかわからない-詳細を学ぶために読むことができるリンクはありますか?
11:09の奇妙な

わかりました。対称性の問題は英語では使われていない表現だと気づいたので、申し訳ありません。つまり、相互分類は独立したユニットから導出されたのではなく、同じユニットが繰り返し尋ねられたため、ペアまたは繰り返しの測定設定です。
モモ

2
記録のために:この論文に関して編集者への手紙がありました。表3a(実験1および2)で使用されている重大度の(事後?)分類のいくつかに異議を唱え、公開バイアスのリスクと再現の必要性について警告しました。表5のデータに不満はありませんでした
奇妙なことに、

2
また、この表が「有意」と表示されるマージンにあることも注目に値します。単一の検出が誤って分類された場合、フィッシャーテスト(使用するのに適切なテスト)は10.9%のp値を返します。主張が異常または論争の的である場合、人は肯定的な関連の結論を受け入れるためにこれよりはるかに強力な証拠を必要とするでしょう。
whuber

回答:


3

結論には三つの誤りがあるように私には思えます。

まず、@ caracalが言ったように:彼らはそうしていることは言うまでもなく、片側検定を使用して「有意性」を報告しています。ほとんどの人は、両側検定を使用することをお勧めします。もちろん、言わずに片側検定を使用することはできません。

第二に、効果はごくわずかです。信号があったとき、被験者(1つしかありませんでした)がそれを11%の時間(32/293)で検出しました。信号がない場合、彼女は6.5%の時間に信号を検出しました。その差はかなり小さいようです。そして、被験者は89%の時間、信号を検出できませんでした!

3番目に、@ oddthinkingが指摘したように、適切に説明または正当化されていない選択的なデータレポートがありました(この論文を注意深く読んでいないため、元の投稿の内容を繰り返します)。


0

与えられたテーブルのフィッシャー正確検定は、このコードに従って、

actual <- c(rep("Y", 32), rep("N", 19), rep("Y", 261), rep("N", 274))
det <- c(rep("Y", 51), rep("N", 535))
table(det,actual) 
fisher.test(det,actual)

ap = 0.08


3
この分割表にはフィッシャー検定が適切だと思いますか?
モモ

2
p"はい"|はい>p"はい"|番号

@カラカル:あなたの推論を詳しく説明し、これを答えに変えたいですか?
奇妙な

@Oddthinking申し訳ありませんが、私は現在、紙を読み飛ばして、質問に関連するサンプリング/実験デザインの問題について考える時間はありません。
カラカル
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.