イントロ:この質問で、今日受け取っ注意を指摘した、「?ペアワイズt検定のいずれでもないとき缶ANOVAが重要である、」私は答えの独自のセットに値するだろう面白い方法でそれをリフレームすることができるかもしれないと思いました。
統計的有意性が単純な二分法として理解され、より高い基準に基づいて判断される場合、または場合、さまざまな不整合な結果(額面)が発生する可能性があります。上記の質問に対する @Glen_bの回答は、次の場合の有用な例を示しています。P α
- ANOVA F検定
F は、4つのレベルを持つ1つの独立変数(IV)に対してp F < .05pF<.05 を生成しますが、 - IVの4つのレベルの各ペアに対応する観測値間で、同じ従属変数(DV)の差を比較する
pt>.08 すべての2サンプル tt 検定で p t > .08。
この質問による事後のペアワイズ比較のボンフェローニ補正にもかかわらず、同様のケースが発生しました:Anovaの反復測定は重要ですが、ボンフェローニ補正とのすべての多重比較はそうではありませんか?重回帰のテストがわずかに異なる前述のケースも存在します。
- 有意なF統計量(p <.001)であるが有意ではないリグレッサーt検定を取得できるのはなぜですか?:P F < 0.001 、P β T > 0.09
pF<.001,pβt>.09 - 回帰はどのように有意であるが、すべての予測変数は有意ではないのでしょうか?
- @ whuberさんに答え、P F = 0.0003 、P β T > 0.09
pF=.0003,pβt>.09
- @ whuberさんに答え、P F = 0.0003 、P β T > 0.09
私は賭けてこのような場合には、ことをいくつかの(すべてではない)ペアごとの比較(または回帰係数有意性検定)のp
質問: ANOVA F検定が連続DVに対する1つのポリトマスIVの効果に対してp F = .05を生成する場合、IVのレベルの各ペアを比較するすべての2サンプルt検定の中で最低のp値はどれくらい高いでしょうか?最小のペアワイズ有意性はp t = .50と同じくらい高いでしょうか?
この特定の質問のみを扱った回答を歓迎します。ただし、この質問をさらに動機付けるために、いくつかの潜在的な修辞的な質問を詳しく説明します。これらの懸念に対処することも歓迎します。必要に応じて、特に特定の質問が最終的な回答を得る場合は、特定の質問を無視することもできます。
意義:統計的有意性が帰無仮説に対する証拠の強さの連続的な観点で判断された場合、p F = .04とp t = .06の違いがどれほど重要でないかを考慮してください(Ron Fisherのアプローチ、私は思う? )、null卸売りを拒否するかどうかを選択する際に許容されるエラーの確率について、α = .05のしきい値を上回ったり下回ったりするなど、二項ではありません。「p -hacking」は、pの解釈によって導入された不必要な脆弱性に悪名を部分的に負っている既知の問題です
逆に、オムニバスp = .05であるが、すべてのペアワイズp > .50のようなデータが存在する可能性がある場合、これはオムニバスをさらに動機付け、練習および教育学全体でのテストのコントラストを高めるべきではないでしょうか?この問題は、二分法対連続法に従って統計的有意性を判断する相対的なメリットを知らせるべきであるように思われます。この差/調整が非常に大きくなる可能性がある場合(たとえば、p t − p F >
考慮または無視するその他のオプションの複雑さ- 回答をより簡単で価値のあるものにするもの:
- どのように高いのpのためのトンのため、場合秒かもしれません
p t F、 P < 0.05の代わりに(例えば、 P = 0.01 、0.001 、...)F p<.05 p=.01,.001,… - ポリトーマスIVのレベル数に対する感度
- ペアワイズ差の有意性の不均一性に対する感度(すべてのp t > p F)
pt>pF - whuberの答えは、小さな違いを含めると大きな違いを隠すことができることを示しています。
- 複数の比較のためのさまざまなオムニバステストの修正の違い
- 関連項目:被験者内の反復比較の修正/反復測定ANOVA; 保守的すぎる?
- 複数のIVがあると、多重共線性がこの問題を悪化させる可能性があるようです。
- データが従来のパラメトリックテストのすべての仮定を最適に満たす制限されたケース
- この制限は、この質問が多少無意味になるのを防ぐために重要かもしれません。