関連する質問が私の答えにならなかったと思います。2つ以上の分類子(機械学習)のパフォーマンスを評価します。Null仮説は、パフォーマンスは変わらないというものです。この仮説を評価するために、パラメトリック(ANOVA)テストとノンパラメトリック(Friedman)テストを実行します。それらが重要である場合、ポストホッククエストでどの分類子が異なるかを調べたいと思います。
私の質問は2つあります。
1)多重比較テスト後のp値の修正は必要ですか?「Alphafehler Kumulierung」のドイツ語版ウィキペディアサイトでは、同じデータに対して複数の仮説がテストされた場合にのみ問題が発生すると述べています。分類子(1,2)、(1,3)、(2,3)を比較すると、データは部分的にのみオーバーラップします。それでもp値を修正する必要がありますか?
2)P値補正は、t検定によるペアワイズ検定の後に使用されることがよくあります。Nemenyi(ノンパラメトリック)やTukeyのHSDテストなどの特殊な事後テストを行う場合にも必要ですか?この回答は、TukeyのHSDに「いいえ」と答えています。TukeyHSDテストは、複数の比較に対して正しいですか?。ルールはありますか、またはすべての潜在的な事後テストについてこれを調べる必要がありますか?
ありがとう!