これが非常に基本的な質問である場合はお詫びします。
正規分布されていないデータがあり(たとえば、ゆがんだ、Shapiro-Wilk検定が重要である)、ランクベースの方法(たとえばWilcoxon Signed Rank test)に頼る場合、異常値を考慮する必要がありますか?
たとえば、ボックスプロットを使用してデータをプロットし、少数のデータポイントが外れ値としてマークされていると想像してください。これらのポイントを変換する必要がありますか?またはそれらを削除しますか?多くの教科書が外れ値の扱いについて話しているように思えますが、それはそれらが平均や標準偏差などのパラメーターに大きな影響を与えるからです。ただし、ランクベースのテストを使用する場合、それらはすでにランクの次の値になるように「変換」されるため、テストに大きな影響を与えることはありません。これまでのところ、統計の本に明記されていないので、ここで質問したいと思いました。
ランクベースのテストを使用するとき、外れ値について心配する必要がありますか?