p <.05での公開されたp値の分布の不連続の原因は何ですか?


27

最近の論文で、Masicampo and Lalande(ML)は、多くの異なる研究で発表された多数のp値を収集しました。彼らは、正準臨界レベル5%でp値のヒストグラムに奇妙なジャンプを観察しました。

Wasserman教授のブログで、このML現象についての素晴らしい議論があります。

http://normaldeviate.wordpress.com/2012/08/16/p-values-gone-wild-and-multiscale-madness/

彼のブログには、ヒストグラムがあります。

公開されたp値のヒストグラム

5%レベルは自然法則であり、自然法則ではないため、公開されたp値の経験的分布のこの動作の原因何ですか?

選択バイアス、正準臨界レベルのすぐ上のp値の体系的な「調整」、または何?


11
少なくとも2種類の説明があります。1)「ファイルドロワーの問題」-p <.05の研究は公開されますが、上記の研究はそうではないので、2つの分布が混在しています、p <.05を取得するには
ピーター・フロム-モニカの復職

3
こんにちは@Zen。はい、まさにそのようなことです。このようなことをする傾向が強い。理論が確認されれば、そうでない場合よりも統計的な問題を探す可能性は低くなります。これは私たちの性質の一部であるように見えますが、警戒を試みるものです。
ピーターフロム-モニカの復職

@Zenあなたは、Andrew Gelmanのブログのこの投稿に興味があるかもしれません。それは、出版バイアスに関する研究に出版バイアスがないことを発見したいくつかの研究に言及しています...!andrewgelman.com/2012/04/...
smillig

1
興味深いのは、かつて疫学のように(ある意味ではまだそうです)p値ベースの論文を明示的に拒否する雑誌の論文からp値を逆算することです。ジャーナルが気にしないと断言しているのか、レビュアー/著者が信頼区間に基づいてメンタルアドホックテストをまだ行っているのか、それが変わるのだろうか。
Fomite

4
Larryのブログで説明されているように、これはWorld of p-valuesからサンプリングされたランダムなp値のサンプルではなく、公開されたp値のコレクションです。したがって、Larryの投稿でモデル化された混合物の一部であっても、写真に均一な分布が表示される理由はありません。
西安

回答:


14

(1)@PeterFlomで既に述べたように、1つの説明は「ファイルドロワー」問題に関連している可能性があります。(2)@Zenも(例えば、著者(s)はデータ又はモデル(単数または複数)を操作する場合を述べたデータは、浚渫)。(3)ただし、仮説を純粋にランダムにテストするわけではありません。つまり、仮説は偶然に選択されるのではなく、理論的な仮定が(多かれ少なかれ)あります。

また、いわゆる「キャリパーテスト」を適用して最近その分野で研究を行ったガーバーとマルホトラの作品にも興味があるかもしれません。

また、Andreas Diekmannが編集したこの特別な問題にも興味があるかもしれません。


10

これまで欠けている議論の1つは、研究者の自由度として知られるデータ分析の柔軟性です。すべての分析では、多くの決定が行われ、外れ値の基準を設定する場所、データを変換する方法、および...

これは最近、シモンズ、ネルソン、サイモンソンの有力な記事で取り上げられました。

シモンズ、JP、ネルソン、LD、およびサイモンソン、U。(2011)。偽陽性心理学:データの収集と分析における非公開の柔軟性により、あらゆるものを重要なものとして提示できます。 心理学、22(11)、1359 – 1366。doi:10.1177 / 0956797611417632

(これは、社会心理学で最近検出されたデータ詐欺のいくつかのケースを担当しているのと同じサイモンソンであることに注意してください。例えば、インタビューブログ投稿


8

すでに言われたことはすべての組み合わせだと思います。これは非常に興味深いデータであり、これまでこのようなp値の分布を見ることは考えていませんでした。帰無仮説が真の場合、p値は均一になります。しかし、当然のことながら、公開された結果では、多くの理由で均一性は見られません。

  1. 帰無仮説が偽であると予想されるため、調査を行います。したがって、重要な結果を頻繁に取得する必要があります。

  2. 帰無仮説が偽の場合、半分の時間でp値の均一な分布が得られません。

  3. ファイルドロワーの問題:前述のように、p値が重要でない場合(たとえば0.05以下)に論文を提出することを恐れます。

  4. 出版社は、たとえ私たちがそれを提出することを選んだとしても、重要でない結果のために論文を拒否します。

  5. 結果が境界線上にあるとき、重要性を得るために(おそらく悪意を持ってではない)ことを行います。(a)p値が0.053の場合は0.05に切り捨て、(b)外れ値と思われる観測値を見つけ、それらをrmovした後、p値は0.05未満に低下します。

これが、合理的に理解できる方法で言われたすべてを要約することを望みます。

興味があると思うのは、p値が0.05から0.1の間であるということです。公開ルールがp値が0.05を超えるものを拒否する場合、右テールは0.05で切り捨てられます。実際に0.10でカットオフになりましたか?もしそうなら、多分何人かの著者といくつかの雑誌は0.10の有意水準を受け入れますが、それ以上はありません。

多くの論文には複数のp値が含まれており(複数に調整されているかどうかは調整されていない)、主要なテストが重要だったために論​​文が受け入れられているため、重要でないp値がリストに含まれている可能性があります。これにより、「論文で報告されたすべてのp値がヒストグラムに含まれていましたか?」という疑問が生じます。

さらに、p値が0.05をはるかに下回ると、発表された論文の頻度が大幅に増加するという観察結果があります。多分、それは著者がp値が0.0001よりもはるかに公表に値すると考えるp値を過剰解釈していることを示している。著者は、p値が効果サイズの大きさに依存するのと同じくらいサンプルサイズに依存することを無視するか、または気付かないと思います。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.