結局のところ、論文を書くのに何年もかかり、厳格な査読を経たなら、統計は確かに堅実になるでしょうか?
さまざまな分野(政治学、経済学、心理学、医学、生物学、金融、保険数理科学、会計、光学、天文学、その他多くの多くの分野)に統計を適用しようとする論文を読んだ私の経験は、統計分析は、優れた、よくできたものからひどいナンセンスまで、スペクトル上のどこでも可能です。私が言及したすべての分野で優れた分析を見てきましたが、ほとんどすべての分野でかなり不十分な分析をしました。
一部のジャーナルは一般的にかなり優れており、一部は目隠しでダーツを弾くようなものです。それらのほとんどはターゲットからそれほど遠くない位置に置くことができますが、壁、床、天井にはいくつかあります。そして多分猫。
私は犯人に名前を付けるつもりはありませんが、統計の誤った使用に基づいて学問的なキャリアを見てきました(つまり、同じ間違いや誤解が10年以上にわたって紙で繰り返された)。
それで、私のアドバイスは読者に注意させてください。編集者や査読者が何をしているのかを知っているとは信じないでください。時間が経つにつれて、どの著者が一般に頼りにして衝撃を与えすぎないか、そしてどの著者が特に慎重に扱われるべきかについての良い感覚を得るかもしれません。一部のジャーナルは、通常、統計の基準が非常に高いと感じるかもしれません。
しかし、一般的に優れた著者であっても間違いを犯したり、レフリーや編集者が通常見つけるエラーを見つけられないことがあります。一般的に良いジャーナルは、ハウラーを発行できます。
[時には、本当に悪い論文が賞や賞を獲得することさえあるでしょう...これは、賞を判断する人々の質についてもあまり語っていません。]
私が見た「悪い」統計の割合を推測したくはありません(さまざまな装いで、質問、研究の設計、データ収集、データ管理、...分析と結論)、しかし、それは私が快適に感じるのに十分小さいほどではありません。
例を挙げることはできますが、これを行うのに適切なフォーラムだとは思いません。(そのための良いフォーラムがあればいいのですが、実際には、再び非常に急速に高度に「政治化」され、すぐにその目的を果たすことができなくなるでしょう。)
PLOS ONEを探し回るのにしばらく時間を費やしましたが、特定の論文を指すことはしませんでした。私が気づいたこと:論文の大部分が統計を持っているようで、おそらく半分以上が仮説検定を持っているようです。主な危険は多くのテストで、それぞれに0.05のような高いようです(偶然に非常に小さな効果がかなり現れることがわかっている限り、これは自動的には問題になりません)。低いパワーを与える傾向がある、低い個々の有意水準。私はまた、約半ダースの異なるテストのケースを見ましたα明らかに同じ質問の解決に適用されたようです。これは、一般的に悪い考えだと思います。全体として、数十の論文で標準はかなり良好でしたが、過去に私は絶対に恐ろしい論文を見ました。
[おそらく、間接的に1つの例にふけることができます。この質問は、かなり疑わしいことをしている人について尋ねます。私が見た最悪のものとは程遠い。]
一方で、私はまた、分析を受け入れさせるために、あらゆる種類の不必要なフープを飛び越えざるを得ないケースを(さらに頻繁に)見ています。レビュアー、エディター、スーパーバイザー、または特定の地域の暗黙の文化によって物事を行う「正しい」方法があるため、完全に合理的なことは受け入れられません。