私のノンパラメトリックテキストPractical Nonparametric Statisticsでは、期待値、分散、検定統計量などについて明確な式が示されることがよくありますが、これは関係を無視した場合にのみ機能するという警告が含まれています。Mann-Whitney U統計を計算するときは、どちらが大きいかを比較するときに、タイペアを捨てることをお勧めします。
どちらのグループも他のグループよりも大きいため、関係はどの人口が大きいかについてはあまり教えてくれません(それが私たちが興味を持っているのであれば)。しかし、漸近分布を開発する場合、それは問題ではないようです。
なぜそれはいくつかのノンパラメトリック手順での関係を扱うのにそんなに困惑しているのですか?単にそれらを捨てるのではなく、タイから有用な情報を抽出する方法はありますか?
編集:@whuberのコメントに関して、ソースを再度確認しました。一部の手順では、関連付けられた値を完全に削除するのではなく、ランクの平均を使用しています。これは、情報の保持に関しては賢明なことのように思えますが、厳密さを欠いているようにも思えます。しかし、疑問の精神は今でも残っています。