私のデータにはいくつかの異常値があり、それらを除外して結果が変化するかどうかを確認したいと考えていました。あなたの意見では、外れ値の最大数はいくつですか?
ありがとう!
私のデータにはいくつかの異常値があり、それらを除外して結果が変化するかどうかを確認したいと考えていました。あなたの意見では、外れ値の最大数はいくつですか?
ありがとう!
回答:
最大値や最小値はありません。外れ値は、それらが悪いデータである場合、またはそれらを削除する他の実質的な理由がある場合は削除する必要があります。実質的な理由がない場合は、外れ値に対して堅牢な方法を使用することをお勧めします。外れ値が他の点から少し離れているという理由だけで、外れ値を削除しません。
私は他の回答やコメントで述べられたことを強調します(@Peter Flomの回答は正確であり、EdMはとりわけ、測定について適切に連絡していると思います)。
データの分析は注意深く行う必要があります。連絡先の外れ値の意味をよく理解している必要があります。たとえば、測定手順が「正しく」行われたと仮定すると(つまり、バイアスを導入していない、機器が較正されている、機器を読んだ人が正しく行っているなど)、一部の外れ値によって興味深いことがわかりますそして時には非常に重要です。
これは構成された例です。すべての面で100%正しくない場合は、甘やかしてください(コメントで指摘してください)。;)
誰かが特定の量の物質を細菌の培養(母集団)に適用する効果をテストしているとしましょう。現在、「一般的に」、効果は母集団内の細菌数を安定させることですが、異なる文化の間にはいくつかの異常値があります。
すべての外れ値がすべての細菌が死んでいる状況を示していると想像してください。または、すべての外れ値が、細菌集団が制御不能に成長した培養を表すということです。
私が指摘したいのは、あなたの知覚された外れ値の性質は意味があるかもしれず、それぞれの結果は異なるということです。バクテリアの数が増えたり減ったりするのが我慢できない状況にあるかもしれません。
もちろん、一部の集団が物質によって一掃されていることに気付いた場合、それは容易に認識できる状況であるため、おそらくその問題について調査するでしょう。しかし、すべての現象を簡単に検出できるわけではありません。
まとめると、外れ値の概念はいくぶん恣意的ですが、それらの意味は複数であり、重要度が異なります。それがあなたに問題について考えさせてくれることを願っています... :)