非劣性テストでnullを受け入れることはできますか?


11

通常のt検定では、通常の仮説検定法を使用して、nullを拒否するか、nullを拒否できませんが、nullを受け入れません。その理由の1つは、より多くの証拠を得た場合、同じ効果サイズが重要になることです。

しかし、非劣性テストではどうなりますか?

あれは:

H0:μ1μ0x

H1:μ1μ0>x

ここで、は、基本的に同じと見なす量です。我々はヌルを拒否するのであれば、我々はと言うより大きくなる少なくともによって。証拠が不十分な場合、ヌルを拒否できません。 μ 1 μ 0のxxμ1μ0x

効果サイズが以上の場合、これは通常のt検定に類似しています。しかし、サンプルのエフェクトサイズがより小さい場合はどうなりますか?次に、サンプルサイズを増やして同じ効果を維持した場合、それは重要ではありません。したがって、この場合はnullを受け入れることができますか?xxx


1
あなたの仮説は混乱していますか?通常、NIテストの帰無仮説は、差がxよりも大きいというものですが、代替案は、それがlesまたはxに等しいというものです。それはあなたの違いのスケールの順番に依存すると思います。
ビョルン2017年

こんにちは@Björnそれは高いほど悪いか高いほど良いかによって異なります。
ピーターフロム-モニカの回復

1
片側テストでnullを受け入れることができるかどうかを尋ねることと同じですか?stats.stackexchange.com/a/85914へのコメントでそれについての議論がありました。
アメーバ2017年

2
@amoebaピーターは魅力的な議論(+1)を示していると思います。おそらくパラドックスに似ています。私たちが「H0を受け入れない」理由の1つの従来の説明は、「より多くの証拠を得れば、同じ効果サイズが重要になる」ということです。しかし、私たちはどちらかのいくつかの状況では、我々はという結論に来るんピーターとしてそのロジック以下の必要がある「H0を受け入れる」、または私たちは「理由」が実際に間違っている、いない場合、我々はすべてでそれをしない理由。私はあなたが正しいと信じています-彼の議論は片側t検定にも当てはまります。nが増加しても悪影響の大きさは重要ではないからです
Silverfish

1
はい、同意します。リンクされた回答はあなたの質問に答えません。リンクを提供したのは、コメントで関連する議論があったためです。
amoeba 2017年

回答:


7

あなたのロジックは、読者にとってより馴染みのある古き良き片側テスト(つまり)にもまったく同じように適用されます。具体的には、ヌルがが正であるという代替案に対してテストしていると想像してください。次に、真のが負の場合、サンプルサイズを増やしても有意な結果が得られません。つまり、単語を使用する場合、「証拠が増えれば、同じ効果サイズが有意になる」というのは真実ではありません。x=0H0:μ0μμ

をテストすると、次の3つの結果が考えられます。H0:μ0

  1. 第1に、信頼区間は完全にゼロより大きくすることができます。次にnullを拒否し、代替を受け入れます(そのは正です)。(1α)100%μ

  2. 第2に、信頼区間は完全にゼロ未満になる可能性があります。この場合、ヌルを拒否しません。ただし、この場合は、を別のnullと見なして拒否できるため、「nullを受け入れる」と言っても問題ないと思います。H1

  3. 3番目に、信頼区間にはゼロを含めることができます。次に、を拒否できず、も拒否できないため、受け入れるものはありません。H0H1

ですから、私は一方的な状況ではヌルを受け入れることができると思います、はい。しかし、拒否できなかったからといって受け入れることはできません。2つではなく3つの可能性があります。

(まったく同じことが、別名「2つの片側テスト」(TOST)のテスト、非劣性のテストなどにも適用されます。nullを拒否したり、nullを受け入れたり、決定的な結果を得ることができます。)

対照的に、がなどのポイントnullの場合、は有効な帰無仮説を構成しないため、それを受け入れることはできません。H0H0:μ=0H1:μ0

(が離散値しか持てない場合、たとえば整数である必要がありますが有効なnullを構成するため、受け入れることができるよう仮説ですが、これは少し特殊なケースです。)μH0:μ=0H1:μZ,μ0


この問題は、@ gungの回答の下のコメントで以前に議論されました:統計学者が有意ではない結果は、帰無仮説を受け入れるのではなく、「帰無を拒否できない」と言うのはなぜですか?

興味深い(そして投票されていない)スレッドも参照してください。ネイマン・ピアソンのアプローチでnullを拒否できないということは、それを「受け入れる」必要があるということですか?、@ Scortchiは、Neyman-Pearsonフレームワークでは、一部の作者は「nullの受け入れ」について話すことに問題がないと説明しています。@Alexisがここで彼女の回答の最後の段落で意味するのもそれです。


場合信頼区間が完全にゼロより上にあるそのヌルを拒絶:の最悪の場合のサイズとテストだ。場合信頼区間が完全にゼロ未満では、そのヌルを拒否の最悪の場合のサイズとテストです:。2つのnullは相互に排他的であるため、2 つのテストを組み合わせると、最悪の場合のサイズを維持できます。したがって、3つの結果は、1つの代替案または別の代替案を受け入れるか、またはnullを拒否しないという観点から説明できます。μ 0 α(1α)μ01-αμ>0αα2(1α)μ>0 αα2α2
Scortchi-モニカの回復

両側検定は、2つの片側検定で構成されるものと同様に考えることができます。ただし、選択肢は相互に排他的ではなく、最悪の場合のサイズは()。μ = 0αμ=0
Scortchi-モニカの回復

ありがとう@Scortchi。どういうわけか、私の答えに同意するのか、同意しないのか、私にはよくわかりません。
アメーバ2017年

受理されていない資格の一つの試験ではnullを、しかし資格別の、私は「ヌルを受け入れる」感じで代替が不ここで混乱しています。それにもかかわらず、あなたの手順は衝動を持つ人々を満足させるはずです。おそらくあなたの答えでさらに強調する価値があるのは、非劣性vs劣等性のテストとその逆の組み合わせと、優越性vs非劣等性(またはnil null)&劣等性vs非劣性(またはnil null)のテストの組み合わせの違いです。。μ0
Scortchi-モニカの回復

@Scortchi最後の文の構文は非常に複雑です。正確に組み合わせることができる(またはできない)ものと、正確に何が違うのですか?すみません、正しく理解できたとは思いません。
アメーバ2017年

6

「帰無仮説」を受け入れることは決してありません(検出力と関連する最小の効果サイズも考慮していません)。単一の仮説検定を使用して、自然状態を提起し、質問のいくつかのバリエーションに答えます。「(および私たちの分布仮定)は本当ですか?」次に、優先するタイプIのエラー率に基づいてを拒否するか拒否し、常にについての結論を導き出します。つまり、を結論付ける証拠が見つかったか、またはを結論付ける証拠を見つけられない。は受け付けていません H 0 H 0 H A H A H A H 0H0H0H0HAHAHAH0その証拠を探さなかったからです。証拠の欠如(たとえば、違いの)は、欠如の証拠(たとえば、違いの)と同じではありません。

これは、両面のテストのためであるのと同様に、一方的なテストのために真である:我々は唯一の賛成で証拠を探しとそれを見つける、またはそれを見つけることができません。HA

1つだけ提起する場合(最小の関連する効果サイズと統計的検出力の両方に真剣に注意を払わずに)は、証拠を探していないため、確認バイアスにアプリオリに確約してい、証拠のみ。もちろん、位置に関するnull仮説を提起することもできます(言うまでもありません)(差異のテスト()と等価のテスト(を組み合わせた関連性テスト))これだけを行います)。 H 0 H A H + 0 H 0H0H0HAH0+H0

あなたが片側検定から推論を組み合わせることはできません理由理由はないように思わ劣等ため片側検定で非劣性のため同時に両方向に証拠を提供する(または証拠がありません)。

もちろん、電力効果のサイズを検討していて、を拒否できなかったとしても、(a)最小の関連する効果のサイズがあり、(b)データが検出するのに十分強力であることを知っている場合与えられたテストの場合、それを証拠として解釈できます。 δ H 0H0δH0


1
ピーターの質問には、この回答がぐるぐると思われる特に興味深い点が含まれていました。標準の「H0を拒否できません」という用語についての従来の説明の1つは、たとえば、t検定では、より多くの証拠を得た場合、同じ効果があるということです。サイズが重要になります。しかし、これが「拒否できない」という「本当の」理由である場合、彼が概説する状況で「H0を受け入れる」ことができるという彼の主張は、(少なくとも私にとっては)強いものであるように思われます。意識的かつ意図的にではなく、一種の統計的な俗語として、偶然以外にそれが行われたことを見てきました。
Silverfish 2017年

1
この回答は、「H0を受け入れる」という従来の立場を、簡潔で簡潔な方法で要約したものですが、ピーターの質問の中心にある議論(またはおそらくパラドックス)に直接対処しているようには見えません。従来の用語について、「H0を受け入れることができないため、同じ効果サイズが重要になるため、H0を受け入れることはできません」という意見についてどう思いますか。ピーターの表現または拡張に欠陥があるのでしょうか、それとも論理的なものでしたかもともと無効な元の引数の?
Silverfish 2017年

1
@Silverfishは、「関連性テスト」への私の回答のリンクをたどり、「より多くの証拠を得れば同じ効果サイズが重要になるため、H0を受け入れることができない」という問題に対する私の重要な解決策をさらに拡大します
Alexis

1
@Alexis私はSilverfishに同意する必要があります。私はあなたの答えに感謝しますが、Silverfishが発表した理由のため、それは私の中心的な点を扱いません。N = 1,000,000の場合、標準設定ではほとんど違いがありません。しかし、非劣性のケースでは、そうではありません。そして、TOSTの両面でさえ、そうではありません。差が重要と思われる量よりも小さい場合、Nはそれをシグにしません。
ピーターフロム-モニカの回復

1
謝罪-私の最初のコメントは単に2番目の前置きとして意図されたものであり(より正確には、2番目は1番目のオーバーフローでした!)、それ自体の自立した点を上げることを意図したものではありません。リンクは役に立ちました、ありがとう。あなたの中心的なポイント(あなたの答えとあなたの言い直しの両方で非常にうまく書いている)は、なぜあなたがピーターの結論に同意しないのかを明確に説明しています。しかし、私はあなたが欠陥が彼の論理 -またはおそらくその前提にあると感じた場所に興味がありました。これは、直接取り組まなかったと私が感じたビットです。
Silverfish 2017年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.