p値を解釈するのが困難または不可能であるため、別の統計的検定の結果に基づいて統計的検定を選択することが問題になることはよく知られています(たとえば、別の結果(たとえば、正規性)に基づいて統計的検定を選択する) 。ただし、これは依然として多くのアプリケーションで標準的な方法であり、通常、適用された論文では気づかれず、議論もされていないようです。文献を調べたところ、この現象について実際に説明している論文は見つかりませんでした。
別の統計的検定の結果に基づいて統計的検定を選択することに関連する出版物、特に応用科学者がアクセスできる出版物へのリンクをいただければ幸いです。
無関係のコメント:私の検索で、RS Nickersonの論文「Null仮説の重要性のテスト:古くて継続的な論争のレビュー」に出くわしました。
—
Rob Hall
ずっと前に、そのような状況の詳細な分析をquantdec.com/envstats/notes/class_12/ucl.htmに投稿しました。これは、予備仮説テストの結果を条件として選択された手順によって決定されるUCLのプロパティを調査します(基になるディストリビューションについて)。
—
whuber
「問題があることはよく知られている」と単純に言うのは、問題の性質がおそらくその人が働いている統計的フレームワークに依存するため、不十分な特異性を提供することだと私には思われます。頻度論的解釈の問題は、データの証拠的な意味を評価する方法の問題ではないかもしれません。
—
Michael Lew
これが問題となる簡単な例は、引用とほとんど同じ目的に役立つでしょう。
—
BKay 2014年