タイプIIエラーが統計文献でそれほど強調されていないのはなぜですか?


10

さまざまな研究記事で、タイプIのエラー(アルファ値で示される)が説明される多くのケースを見てきました。私は、研究者が力、またはタイプIIエラーを考慮することはまれであることに気づきました。

タイプIIのエラーは大きな問題になる可能性がありますか?対立仮説が実際に偽であった場合、それを誤って却下しました。なぜベータ値ではなくアルファ値がそれほど強調されるのですか?

初年度の統計をとったとき、ベータは教えられなかった-アルファのみ。私はこれら2つのエラーは同等に扱われるべきだと感じています。しかし、アルファのみが強調されているようです。


1
+1その理由は、従来、タイプIエラー(別名、または有意水準)が最初に修正され、次にタイプIIエラーを最小化する(同等に、電力を最大化するなど)ようにテストが構築されるためです。この問題を理解するのに役立つウィキペディアの記事は、Uniformly Most Powerful(UMP)テストに関する記事en.wikipedia.org/wiki/Uniformly_most_powerful_testα
Jeremias K

3
「帰無仮説を受け入れた」というのは間違っています。決して受け入れません。「null hypを拒否する」または「null hypを拒否できない」のいずれかですが、null hypは決して受け入れません。
穴居人

ブラスト-それは私をすくい取りました。ご指摘いただきありがとうございます。

1
あなた自身の経験を統計文献の分野全体と混同しないように注意してください。読んでいない資料の内容はほとんど推測できません。
Glen_b-2016

@glen右。精力的なタイトルはより多くの反応を得ます。

回答:


5

これは良い質問です。いくつかの説明から始めましょう:


パワーとタイプIIのエラーにあまり注意が払われていないのは(残念ながら)正しいと思います。生物医学研究では状況が改善していると思いますが(たとえば、現在、資金提供機関やIRBは電力分析を要求していることが多い)、これにはいくつかの理由があると思います。

  1. 単純な意味よりも、人が理解する力は難しいと思います。(これは、一部は未知数、特に効果サイズに依存しているためですが、他にもあります)。
  2. 0
  3. 科学者たちは伝統的にタイプIのエラーはタイプIIのエラーよりも悪いと想定してきました。

1
いつものように、啓発-特に数学を使っていない人のために:-) ...私はこの表現が大好きです... 3つ目のポイントを少し拡大してみませんか...このバイアスの根拠はありますか?私はそれが本当であることを知っていますが、なぜこれが事実だと思いますか?それはそれがp値のトロフィーに関するものであり、他に何も問題ではないのですか?
Antoni Parellada 2016年

ありがとう、@ AntoniParellada。何を追加できるか考えます。
ガン-モニカの復活

2
ポイント3)を明確にします。科学者がタイプIのエラーのほうが悪いと考える理由。帰無仮説は通常、ある種の「現状維持」です。たとえば、この新薬の効果は0です。現状維持が好きであり、そうでなければ証明する責任は研究者にあります。したがって、タイプIのエラーを制限する必要があります。つまり、現状を誤って拒否します。IMO、現状へのこの愛着は哲学にすぎません。私の意見を変えたい場合は、それを証明する必要があります。
ハイゼンベルク

1
実際には、タイプIIエラーの方がはるかに重要である場合、つまりnullを拒否しないことのコストが高い場合を簡単に考えることができます。たとえば、人類がゾンビの蔓延に直面している場合、「使用する前に機能することを証明する必要がある」ではなく、「機能しなくても薬を試してみる」という態度になると私は確信しています。
ハイゼンベルク

@Heisenbergへの追加:タイプIIエラーが最も重要な場合は、点仮説検定と同等性検定の切り替えを検討する必要があります。あなたの例では、提案されたウスターソースが少なくともゾンビの流行を悪化させないことを証明する必要があります。次に、エラー率がその役割を変更し、最も重要なエラー率が設計によって再び修正されます。また、誤った決定のコスト見積もりがある場合は、リスクを最小限に抑え、特定のタイプIのエラー率を(必ずしも)修正しない決定ルールを検討する必要があります。
HorstGrünbusch2016年

2

その理由は、実際のタイプIIエラー率がわからないだけで、わからないためです。通常はわからないパラメータに依存します。次に、このパラメーターがわかっていれば、統計的検定を行う必要はありません。

ただし、いくつかの代替案が当てはまる場合は、特定のタイプIIエラー率が満たされるように実験を計画することができます。このようにして、リソースを無駄にしないサンプルサイズを選択します。つまり、テストが最終的に拒否されないため、またはすでにはるかに小さいサンプルサイズで仮説を拒否するのに十分であったためです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.