なぜp値は発見が偶然によるものである確率であると学生に教えるのが悪いのですか？

34

誰かにp値が確率であることを生徒に教えるのが良い考えではない理由を簡潔に説明してもらえますか（彼らの発見は[偶然]チャンスによる）。私の理解では、p値は確率です（より極端なデータを取得する|帰無仮説は真です）。

私の本当の関心は、それが前者であることを彼らに伝えることの害である（それはそうではないという事実は別として）。

p-value randomness teaching

— パトリック
ソース

43

間違っているから？

— whuber

6

たぶんあなたが望むのは、それが間違っているだけでなく悪いことを示す簡単な例ですか？

— カール

2

いくつかのものは、単に事実の、パトリックはなく、意見の問題である：Piは（にもかかわらず、3に等しいされていないので、それを法制化しようとする試み例えば、）。しかし、あなたのコメントは確かに便利明確である：それはあなたが間違ったことを教えるの害について尋ねていないが、実際に人との違いを説明するための理由を求めている示唆しています。

— whuber

2

これらの問題の良い議論がでありますstats.stackexchange.com/questions/5591/...でも低投票回答（私見）の中で、。

— whuber

1

はい、カール、実世界の例を探していると思います。観察ベースの研究（環境科学、生態学、野生生物科学など）を扱う人は素晴らしいでしょう。これを投稿する前に、いくつかのパブと一緒にそのスレッド（whuber）を読みました。でもありがとう。

— パトリック

25

間違ったステートメントの意味の解釈は、@ Karlとは異なります。これは、nullではなく、データに関するステートメントだと思います。私はそれが偶然にあなたの見積もりを得る確率を求めることとして理解しています。私はそれが何を意味するのか分からない---それは明確に指定された主張ではない。

しかし、私はおそらく本当の推定値が特定の値に等しいことを与えられたチャンスで、私の推定値を得る確率が何を意味するかを理解してください。例えば、私はそれが彼らの平均の高さは実際には同じであることを与えられた男性と女性の間の平均の高さに非常に大きな差を得ることの意味を理解することができます。それは明確に指定されています。そして、それはp値が与えるものです。間違ったステートメントに欠けているのは、nullがtrueであるという条件です。

今、私たちは、この文の完璧な（推定のための正確な値を取得するチャンスが、例えば、0である）ではないことをオブジェクトかもしれません。しかし、ほとんどの場合p値を解釈する方法よりもはるかに優れています。

仮説検定を教える際に何度も言う重要な点は、「ステップ1は帰無仮説が真であると仮定することです。この仮定を前提にすべてが計算されます」です。人々はそれを覚えていれば、それはかなり良いです。

— チャーリー
ソース

ああ、それは私には良さそうです。私は気付かずに同じポイントを作ってきた参照[ため息]（1）

— conjugateprior

しかし、どのような「害は何ですか？」

— rolando2

15

私は（おそらくより頻繁に正しいものよりも）この解釈をたくさん見てきました。私は「彼らの発見は[偶然]偶然によるもの」を「が真である」と解釈するので、実際に彼らが言っているのは [実際にはべきです。（あなたが割り当て事前分布に喜んでいるとベイズをすれば）これは意味の文にすることができます]「？唯一のチャンスが動作している確率が何であるか、（データ）我々が見てきたものを与えられた」、と言う、しかしそれは、pではありません-値。 $\text{H}_0$ $\Pr(\text{H}_0)$ $\Pr(\text{H}_0 | \text{data})$

p値よりもかなり異なることができ、そのためそのようにp値を解釈することは真剣に誤解を招くことができます。 $\Pr(\text{H}_0 | \text{data})$

最も単純な例：前の例では、は非常に小さいが、データはかなり少ないため、p値は大きく（0.3など）ですが、後のはまだかなり小さいでしょう。[しかし、この例はそれほど面白くないかもしれません。] $\Pr(H_0)$ $\Pr(\text{H}_0|\text{data})$

— カール
ソース

Pr（H0 | data）== prob（それらの発見は[ランダム]チャンスによる）

— パトリック・

@Patrick -はい。

— カール・

1

Pr (H_{0} | anything)

$\Pr(H_0|\text{anything})$

Pr (H_{0})

$\Pr(H_0)$

Pr (H_{0} | data)

$\Pr(H_0 | \text{data})$

2

H_{0}

$H_0$

14

（元）学生の観点からの遅い答えを追加します：私見は、害が間違っていることから分離することはできません。

この種の間違った「教授的近似/ショートカット」は、文を論理的に理解できないことに気づく学生に多くの混乱を引き起こす可能性がありますが、彼らに教えられたことが正しいと仮定すると、彼らはそれを理解できないことに気付かないなぜなら、それは右ではありません。

これはちょうどそれらに提示されたルールを覚えるの学生には影響を与えません。しかし、それは良いのに十分であることを理解することによって学ぶ学生が必要です

自分で正しい解に到達し、
彼らは、彼らが正しいことを確認することができますので、十分に良いこと
そして、彼らは（一部の容疑者教訓的な理由で）でたらめを教えていると結論付けています。

有効な教訓的なショートカットがないと言っているのではありません。しかし、私見では、そのようなショートカットが取られるとき、これは言及されるべきです（例えば、「議論を簡単にするために、我々はそれを仮定/概算する...」）。
この特定のケースでは、しかし、私はあまりにも任意の使用であると誤解されると思います。

— cbeleitesはMonicaをサポートしています
ソース

1

1これは非常に良い点であるあなたは、学生に間違っている何かを教えるならば、あなたは故障しているかの統計作業のモデルを構築することを奨励し、ウェル（それらはシラバスにある統計情報の他の要素を誤解する可能性があり例えばどのような信頼区間-あなたは）frequentist確率は、なぜそれが特定の間隔での真の値の嘘という仮説に適用することができない、という仮説に取り付けることができると思うし、学生を奨励する場合。理解は教育の真の目的であり、これには正確さが必要です。

— ディクラン有袋類

8

質問を直接参照：害はどこにありますか？

私の意見では、この質問に対する答えは、「p値は発見が偶然の偶然によるものである確率である」という声明の逆にあります。これを信じるなら、おそらく次のことも信じているでしょう：「[1-（p-value）]は、発見が偶然によるものではない確率です。」

なぜなら、ほとんどの人の脳の働き方を考えると、この声明は、推定されたパラメーターの特定の値にどれだけ自信があるべきかを大きく過大評価しているからです。

— DLダリー
ソース

6

私が使用する簡単な例を次に示します。

帰無仮説は、2頭のコインを反転していると仮定します（したがって、prob（heads）= 1）。コインを1回ひっくり返し、頭を取得します。これのp値は1です。つまり、2枚のコインを持つ可能性は100％です。

トリッキーなことは、テールをフリップした場合、p値が0になり、2ヘッドコインが発生する確率が0になるため、この場合は一致しますが、上記では一致しません。上記の1のp値は、観察したことが2頭のコインの仮説と完全に一致することを意味しますが、コインが2頭であることを証明しません。

さらに、頻出統計を行っている場合、帰無仮説はTrueまたはFalseのいずれか（どちらかだけはわかりません）であり、帰無仮説に関する（頻度論）確率ステートメントを作成しても意味がありません。仮説の確率について話したい場合は、適切なベイジアン統計を行い、確率のベイジアン定義を使用し、事前確率から始めて、仮説が真である事後確率を計算します。ただ、ベイズ事後でp値を混同しないでください。

— グレッグ・スノー
ソース

3

この上の別の、わずかに異なるテイクをOK：

最初の基本的な問題は、「[ランダム]偶然による」フレーズです。不特定の「チャンス」の考えは学生に自然に伝わりますが、不確実性について明確に考えることは危険であり、賢明な統計を行うことは壊滅的です。コインフリップのシーケンスのようなものでは、「チャンス」は0.5の確率で二項式のセットアップによって記述されると簡単に推測できます。それには確かに一定の自然さがありますが、統計的な観点からは、0.6などを仮定するよりも自然ではありません。そして、他のそれほど明白ではない例、例えば実際のパラメータを含む場合、「チャンス」がどのように見えるかについて考えることは全く役に立たない。

質問に関して、重要なアイデアは、H0によってどのような「チャンス」が記述されているか、つまり実際の尤度/ DGP H0の名前を理解することです。その概念が整ったら、学生はついに「偶然」に起こっていることについて話すのをやめ、H0が実際に何であるかを尋ね始めます。（彼らは、物事がかなり多様なHと一致する可能性があることも理解しているので、逆のテストを介して、信頼区間で有利なスタートを切ることができます）。

2番目の問題は、フィッシャーのp値の定義に向かっている場合、pのポイントはそれを解釈することではなく、見ることであるため、H0とのデータの一貫性の観点から常に（imho）説明する必要があることですある種の「チャンス」活動としての尾部（または率直に言ってそれを解釈するため）。これは明らかに修辞的な強調の問題ですが、助けになるようです。

要するに、害は、物事を説明するこの方法は、彼らがその後を考えるしようとする可能性があり、任意の非自明なモデルに一般化しないことです。最悪の場合にはそれだけで、統計の研究はすでに、このようなbowdlerised説明が狙っている人々の種類に生成する謎の感覚に追加することができます。

— 共役
ソース

1

「p値は、効果が偶然によるものである確率」を分解すると、効果が偶然によって引き起こされていることを暗示しているようです。しかし、すべての効果は偶然によって部分的に引き起こされます。ランダムな変動性を見通そうとする必要性を説明している統計のレッスンでは、これは非常に魔法的で広範囲にわたるステートメントです。p値に、所有していないべき乗を吹き込みます。

特定のケースで確率を帰無仮説と定義すると、観測された効果が帰無仮説によって引き起こされる確率がp値から得られると述べることになります。それは正しい声明に非常に近いように思えますが、確率の条件がその確率の原因であると主張することは再び行き過ぎです。帰無仮説が真である場合、p値が効果の確率であるという正しい記述は、原因をヌル効果に帰するものではありません。原因は、真の効果、効果の周りの変動性、ランダムな偶然など、さまざまです。p値は、これらの確率を測定しません。

— ジョン
ソース