一般に、より多くのデータでテストする可能性のあるパラメーターの推定値を改善し続けることができます。テストがある程度任意の重要度を達成すると、データ収集を停止することは、悪い推論を行う良い方法です。アナリストは解釈実行されるジョブがどの人によると、ネイマン・ピアソンのフレームワークの多くの意図しない結果の一つであるというサインとして有意な結果を誤解することのp原因としてに値をどちらか拒否するか、予約がに依存せずにヌルを拒否しませんクリティカルしきい値のどちら側に該当するか。
頻繁なパラダイムに対するベイジアンの代替案を考えずに(できれば誰か他の人が)、信頼区間は、基本的な帰無仮説を拒否できる点をはるかに超えて、より有益なものであり続けます。より多くのデータを収集すると、基本的な有意性テストでさらに大きな有意性が達成されると仮定すると(そして、以前の有意性の発見が偽陽性であったことは明らかになりません)、どちらにしてもnullを拒否するため、これは役に立たないかもしれません。ただし、このシナリオでは、問題のパラメーターに関する信頼区間は縮小し続けるため、対象の母集団を正確に説明できる信頼度が向上します。
μ = 0
One Sample t-test
data: rnorm(99)
t = -2.057, df = 98, p-value = 0.04234
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
-0.377762241 -0.006780574
sample estimates:
mean of x
-0.1922714
t.test(rnorm(99))
α = .05rnorm
set.seed(8);t.test(rnorm(99,1))
μ = [ 0.69 、1.12 ]
μ = .8mu=.8
set.seed(8);t.test(rnorm(999,1),mu=.8)
μ = 0μ = .8μ = [ 0.90 、1.02 ]μ = .89
H0:μ = .9set.seed(9);t.test(rnorm(999,1),mu=.9)
漸進的により厳密な帰無仮説をテストするか、さらに良いことに、単純に信頼区間の縮小に焦点を当てることは、進めるための1つの方法にすぎません。もちろん、帰無仮説を拒否するほとんどの研究は、対立仮説に基づいた他の研究の基礎となります。たとえば、相関がゼロより大きいという対立仮説をテストする場合、次のフォローアップ調査でメディエーターまたはモデレーターをテストできます...元の結果を再現できました。
考慮すべきもう1つのアプローチは、等価性テストです。パラメータが単一の値と異なるだけでなく、可能な値の特定の範囲内にあると結論付けたい場合は、従来の対立仮説に従ってパラメータが含まれる値の範囲を指定してテストできますパラメータがその範囲外にある可能性を一緒に表す異なる一連の帰無仮説に対して。この最後の可能性は、あなたが書いたときに念頭に置いていたものに最も似ているかもしれません:
代替案が真実であるという「いくつかの証拠」はありますが、その結論を引き出すことはできません。私が本当にその結論を最終的に描きたいなら...
set.seed(8)
rnorm(99)
rnorm(99,1)-1
μ = .8- 0.2 ≤ μ ≤ 0.2
require(equivalence);set.seed(8);tost(rnorm(99),epsilon=.2)
tost
μ = [ - 0.27 、0.09 ]rnorm(999)
μ = [ − .09 、.01 ]
信頼区間は、同等性テストの結果よりも興味深いと思います。これは、人口平均が対立仮説よりも具体的であることをデータが示唆するものを表し、対立仮説で指定したよりもさらに短い間隔内にあることを合理的に確信できることを示唆しています。実証するために、非現実的なシミュレーションの力をもう一度悪用し、「レプリケート」を使用しset.seed(7);tost(rnorm(999),epsilon=.09345092)
ます。確かに、p = .002です。