「帰無仮説統計検定」と他の検定の違いは何ですか?


9

最近の話題の話題は、ジャーナルに投稿された記事からの「帰無仮説統計検定手順(NHSTP)」の使用を禁止するジャーナルに関するものです。一部の作家はこの用語を使用していますが、彼らがどのような区別をしようとしているのか理解できません。NHSTPは、「仮説の検定」または「有意性検定」とは異なるものですか?


1
やや頻繁に使用される頭字語はNHST(最後にPなし)です。両方の頭字語は、(そのような論争の文脈で)それを嫌う作家によって使用される軽蔑的な用語のようです。NHST + nullのGoogle学者検索(1670件の結果、NHSTP + nullの場合は145件のみ)を一目で見ることができます-それはすべて、問題とトラブルに関するものです。もう1つの関連する軽蔑的な用語は「ヌルリチュアル」です。それはあなたがそれが何を意味すると思うかを意味しますが、強い嫌悪感で発音されます!
amoeba 2015年

2
機械的に(ただし当然のことながら)密接に関連するフレームワークを使用しますが、同等性テストなど、より一般的なNHSTとは概念的にまったく異なるテストがあります。しかし、問題のジャーナルの編集者もおそらく反対するだろうと私は想像します。
Glen_b-モニカを2015

1
関連(重複ではない):「仮説のテスト」と「有意性のテスト」の違いは何ですか?また、私はこのジャーナルの編集者が明らかにそれらのいずれかを区別しようとしないことを指摘しなければなりませ!彼らは、フィッシャー、ネイマン・ピアソン、ハイブリッドのいずれであろうと、あらゆる種類の仮説/有意性/あらゆるテストを禁止します。区別は、フィッシャー対ネイマン・ピアソン(対ハイブリッド)の聖戦の文脈でのみ行われます。これは、この特定のジャーナルの禁止が目的としたものではありません。
amoeba

1
つまり、@ Livid、「NHST」はフィッシャーパラダイムとNPパラダイムの両方から区別される、統計的検定が実際に通常使用される方法を指すと言っていますか?それが今度は日常的で思いがけないクランクの回転を意味するのであれば、私はそれが軽蔑的な言葉であることに同意するでしょう。
Russ Lenth、2015年

1
@rvlこれが私が以前に考えていた論文(+解説)です:統計的有意性の
Livid

回答:


1

背景:問題の社説は、このある1から基本と応用社会心理学、すなわち、1.168の2015年インパクトファクターを持つ雑誌、非常にquotableありません。

Re:OPの質問、つまり、NHSTPは「仮説のテスト」または「有意性テスト」とは何か違うのですか?該当する社説は次のとおりです。

1) "...the null hypothesis significance testing procedure (NHSTP)  is invalid..." [Sic, with alpha = 0.05]
2) "...authors will have to remove all vestiges of the NHSTP (p-values, t-values, F-values, statements about ‘‘significant’’ differences or lack thereof, and so on)."
3) "...confidence intervals [Sic, 95%] also are banned from BASP."
4) "...Bayesian procedures are neither required nor banned from BASP." [Sic, depends on which ones, they are either banned or not.]
5) "Are any inferential statistical procedures required?...No..."

p<.05

OPへの回答:これらの編集者はおそらく、有意性のテストはしばしば仮説の不適切なテストであると主張します。たとえば、彼らは、「... ラプラシアンの仮定を少なくともある程度回避するベイジアンの提案[Sic、私は先験的に何も知らない] ... [そのように]数字は実際にそこにあります...」これは、@ Lividによって上で指摘された、フィッシャー対ネイマンおよびピアソンの議論に一部関連し、社説はフィッシャーの側にあります。

ディスカッション:私は、科学的方法の基本的かつ不可欠な教義として、知的謙虚さを固く信じています。もし私が研究者として、すべての先行理論が信じられない仮定のない最初の前提から進むことが許されないなら、私は創造的でオープンな心でデータを検査する私の能力をすべて失うでしょう。すべての数値処理は絶対的な真実でなければならないという前提は、崇高なキューピディの説明です。唯一の真実はデータであり、私は謙虚にBoxを言い換えますすべてのモデルが偽であると述べることによって、特にそして最も確かに、真実はデータ自体と同一ではないものから生じると推定するものです。それは、私がフィッシャーとネイマン/ピアソンのどちらかを選択する必要があることを意味するのではなく、どちらか一方の前提が単独で取られることを固く信じるのではなく、仮説が支持され、かつ/または集団の自己無矛盾性が否定されるまで徹底的に調べます。絶対的な真実を明らかにできる分析はないため、基準として使用できるのは自己無矛盾のみです。

私のやり方はみんなのためではありません。多くの人が、私が「トップダウン」と呼ぶ厳密な制御実験計画でテストを計画することを好みます。ただし、制御された実験は、データマイニング、パターン認識、仮説の生成には非効率的です。それらは狭い質問をテストするのに役立ちます、そしてそれはNHSTPについての論争が起こり得るときです。根拠となる証拠がない場合、たとえば、信頼できる自己無矛盾性の全体的な構造がなければ、いずれのテストも批判にさらされます。これは逆にボンフェローニと見なされるかもしれません。複数のテストが不可避の自己矛盾のないアンサンブルにつながる場合、アンサンブルが偶然だけで発生する可能性は減少します。心理学の実験計画では、を使用しないことのナンセンスp<0.050.050.001 ジャーナルのコンテンツは改善されません。


「... 科学的方法の基本的かつ不可欠なテナントとして ...」- テナントというよりテネットを意味すると思います。
Glen_b-モニカを復元する

@Glen_b Je tiensàvous remercier。私はもっ​​とよく知っているべきでしたが、とにかくそれがすべて間違っていると思います。エルゴ、残りのために、何か考えはありますか?
Carl
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.