これはp値問題の解決策ですか?


67

2016年2月、米国統計協会は、統計的有意性とp値に関する公式声明を発表しました。それに関する私たちのスレッドは、これらの問題について広範囲議論しています。しかし、今まで、広く認められた効果的な代替手段を提供する権限はありません。アメリカ統計学会(ASS)は、その応答、p値を発表しました:次は何ですか?

「p値はあまり良くありません。」

ASAは十分に機能しなかったと思います。p値の時代が終わったことを認める時です。統計学者はそれらを使用して大学生を困惑させ、科学者をだまし、編集者をだまして成功させましたが、世界はこの策略を見始めています。意思決定を制御するための統計学者によるこの20世紀初頭の試みを放棄する必要があります。実際に機能するもの戻る必要があります。

公式のASS提案は次のとおりです。

p値の代わりに、ASSはSTOP (SeaT-Of-Pantsプロシージャ)を提唱します。ロナルド・フィッシャーが来て物事を台無しにするまで、この昔からの方法とテストされた方法は、古代ギリシア人、ルネサンスの男性、およびすべての科学者によって使用されました。STOPは、シンプルで直接的な、データ駆動型で信頼できるものです。それを実行するために、権威のある人物(好みにより年上の男性)がデータをレビューし、彼らが彼の意見に同意するかどうかを決定します。彼が決定すると、結果は「重要」になります。それ以外の場合はそうではなく、すべてのことを忘れる必要があります。

原則

応答は、ASAの6つの原則のそれぞれに対応しています。

  1. STOPは、データが指定された統計モデルとどれだけ互換性がないかを示すことができます。

    このフレーズが気に入ったのは、STOPがyesまたはnoの質問に答えると言うのはとてもおしゃれな方法だからです。p値または他の統計的手順とは異なり、疑いの余地はありません。これは、「スティンキンの帰無仮説は必要ありません!」と言う人への完璧な反応です。とにかく*?!@とは何ですか?誰がそれがどうなっているかを理解することはできませんでした。」

  2. STOPは、仮説が真である確率を測定しません。実際に、真かどうかを判断します。

    誰もが確率に混乱しています。写真から確率をとることにより、STOPは長年の学部および大学院での研究の必要性を排除します。今では誰でも(十分に年をとっており、男性でも)統計分析を行うことができます。1回の統計講義を聴いたり、わかりにくい出力を吐き出す難解なソフトウェアを実行したりする苦痛や苦痛はありません。

  3. 科学的結論とビジネスまたは政策決定は、常識と実際の権威の数字に基づいて行うことができます。

    とにかく、当局は常に重要な決定を下してきたので、それを認めて仲介人を排除しましょう。STOPを使用すると、統計学者は自分に最適なことを行うことができます。数値を使用して真実を難読化し、権力者の選好を聖別します。

  4. 適切な推論には、完全なレポートと透明性が必要です。

    STOPは、これまでに発明された中で最も透過的で自明の統計手順です。データを見て決定します。データの意味がわからないという事実を隠すために人々が使用する、すべての混乱するz検定、t検定、カイ2乗検定、アルファベットスープ手順(ANOVA!GLM!MLE!)を排除します。

  5. STOPは結果の重要性を測定します。

    これは自明です。権限のある人がSTOPを使用する場合、結果は重要でなければなりません。

  6. STOP自体は、モデルまたは仮説に関する証拠の適切な尺度を提供します。

    私たちは権威に挑戦したくないでしょうか?研究者と意思決定者は、STOPが知る必要があるすべての情報を提供することを認識します。これらの理由により、データ分析はSTOPで終了する可能性があります。p値、機械学習、占星術などの代替アプローチの必要はありません。

その他のアプローチ

一部の統計学者は、いわゆる「ベイジアン」法を好みます。この方法では、18世紀の聖職者によって死後に公表された不明瞭な定理が、あらゆる問題を解決するために無意識に適用されます。最も有名な支持者は、これらの方法が「主観的」であることを自由に認めています。主観的方法を使用する場合、意思決定者の権威があり知識があるほど、結果は良くなります。これにより、STOPはすべてのBayesメソッドの論理的な制限として現れます。担当者にデータを見せて、彼の意見を尋ねるだけでいいのに、なぜこれらのひどい計算をし、コンピューターの時間を無駄にする努力をするのでしょうか?物語の終わり。

統計学者の神権に挑戦するために、最近別のコミュニティが生まれました。彼らは自分たちを「機械学習者」および「データ科学者」と呼んでいますが、彼らは本当に高い地位を探しているハッカーです。ASSの公式の立場は、人々が彼らを真剣に受けとめたいなら、これらの人たちが彼ら自身の専門組織を形成すべきだということです。


質問

これは、ASAがp値と帰無仮説検定で特定した問題に対する答えですか?(応答で暗黙的に主張されているように)ベイジアンとフリークエンティストのパラダイムを本当に結び付けることができますか?


11
「最高のSTOP ASSジャッジのためのドナルドトランプ:統計を再び素晴らしいものにしましょう!」
アレックスR.

14
明らかにSTOPは最適ではない手順です。これが、ASSのような尊敬される学者の組織を逃れたことに驚いています。つまり、なぜデータ見るのに時間を無駄にするのでしょうか?はい/いいえで答えてください。この方法論は、現在非常に効果的に既に使用されています。特に米国では、4で割り切れる年の間にケーススタディがたくさんあります。–
枢機

4
企業は、データを分析するために人を雇うという大きな費用を負担する必要がなくなったため、これらの方法を採用することで大きな恩恵を受けることもできると思います。
dsaxton

4
@henry [april-1]タグがそれを教えてくれなかったかのように?
Glen_b

9
@ヘンリー真剣に?あなたは私たちに示すことができる任意のあなたは、その名前をGoogleに25万本のヒットを乗り越える偽組織を?
whuberの

回答:


18

:私はRADDと呼ばれる統計的意思決定に自分の新しいアプローチを提唱してきたR OLL A D AMN Dすなわち。また、すべての重要なポイントに対処します。

1)RADDは、指定された統計モデルとデータの互換性を示すことができます。

数字を大きくすると、明らかに証拠がモデルに有利になります!さらなる利点は、さらに自信があれば、より多くのサイドでダイスを振ることができるということです。十分に検索すれば、100個のサイコロを見つけることさえできます!

2)RADDは、仮説が真であるかどうかを判断できます。

両面ダイスを振る、つまりコインを投げるだけです。

3)RADDは、ビジネスまたはポリシーの決定に使用できます。

部屋にたくさんの政策立案者を集めて、彼ら全員にサイコロを振らせる!最高の勝利!

4)RADDは透明です。

結果を記録し、ダイ自体をさらなる研究のために保管することができます*

5)RADDは結果の重要性を測定します。

明らかに、高く転がることは、非常に重要なイベントが発生したことを意味します。

6)RADDは証拠の適切な尺度を提供します。

ロールが高いほど良いとは言いませんでしたか?

したがって、いいえ、STOPは答えではありません。答えはRADDです。


7
忘れないでください、それは達成するために最大数の100面のサイコロを持つ5つの面の1つが現れたときに帰無仮説を拒否するだけで、タイプIのエラー制御(十分に両面のサイコロが与えられた任意のレベル)を保証できます5%タイプIエラー率。
ビョルン


17

p値と他の頻度、またはベイジアン法。ビジネスの観点から、STOPは、不確実な「確率的」方法よりも信頼性を高める単純で決定的な答えを提供します。さらに、ほとんどの場合、他の方法よりも実装が簡単で、変化する現実に簡単に適応できます。はい/いいえの決定は、中間および上級管理職にとってより説得力があります。ほとんどの場合、「STOPレポート」は、データベースベースのレポートよりも短く、読みやすくなっています。さらに、この方法を採用すると、雇用主はデータサイエンティストとSASライセンスのコストを削減できます。STOPの唯一の問題は、STOP結果を表示するPowerPointプレゼンテーションを作成するのが難しいことですが、これは動的に発展している分野であるため、将来的にはより良い視覚化方法が提案される可能性があります。


6
結論が記載されたPowerPointスライドの概要を説明したら、変更するには遅すぎます。そのため、2つの選択肢があります。分析を結論に合わせるか、まったく分析を行わないかです。
マークL.ストーン

12
@ MarkL.Stone確かに!私は個人的なアイデアは、ベイズ的な思考に根ざしているデータを見る前に、プレゼンテーションのためのプロットを作るというアイデアなどと私は先験的プロットそれらを呼び出す:)私は、このアプローチは、最初にここでの印刷に登場したと思います:dilbert.com/strip/ 2008-05-08
ティム

15

興味深いが、私の意見では幾分古い、p値の議論に対するこの素晴らしい補助は、数年前に英国医学雑誌(BMJ)のクリスマス号で発行されたユニークな論文を思い出させます。記事。特に、IsaacsとFitzgeraldによるこの研究は、エビデンスに基づいた医学(すなわち、実際の臨床的および統計的エビデンスに基づく医学の実践)に対する7つの重要な代替案を強調しました。

  • 卓越した医学
  • Vehemenceベースの医学
  • 雄弁に基づく医学
  • プロビデンスベースの薬
  • 信頼度ベースの薬
  • 神経系薬
  • 信頼に基づく医学

最も興味深いのは、上記の項目の測定デバイスと測定単位を強調表示する列を確認する必要があることです(例:聴力計と、乱用に基づく医療のデシベル!)。


4
+1。完全に質問の精神で、素晴らしい貢献をありがとう。(1)明確にするために:それは、「古い」または単にこの質問を見つけるp値の議論ですか?(2)参考文献(6)、「J Exponential Salaries」の入手先を知っていますか?もっとよく知られていれば、多くの熱心な読者がいるはずです。
whuberの

5
(1)あなたの貢献は「rottentomatoes.comを引用して」「認定された新鮮な」ものです。逆に、p値の制限に関するこの強調はやや古くなっています。機械学習、ビッグデータ、一般市民の間での不十分な科学的リテラシーの時代に、ASAのスタンスは少しマゾヒストに見えるかもしれません。(2)この記事は、この他のBMJクリスマス作品bmj.com/content/327/7429/1459で推奨されているランダム化試験を公開したのと同じジャーナルにあると思います。
Joe_74

Dunning-Krugerベースの推論を使用するConfidence Based Medicineですか?
アレクシス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.