プロセスの実行時間を分析するスクリプトを書いています。それらの分布はわかりませんが、プロセスが「長すぎる」かどうかを知りたいです。これまでのところ、最後の実行時間の3つの標準偏差(n> 30)を使用してきましたが、データが正常でない場合(これは正常ではないように見える)、これは有用なものではないと言われました。私は次のような異常値テストを見つけました:
IQR = Q3-Q1である四分位範囲を見つけます。Q3は3番目の四分位数、Q1は最初の四分位数です。次に、次の2つの数値を見つけます。
a)Q1-1.5 * IQR b)Q3 + 1.5 * IQR
<aまたは> bの場合、ポイントは異常値です
私のデータは2秒、3秒、2秒、5秒、300秒、4秒などの傾向があります。ここで、300秒は明らかに異常値です。
どちらの方法が良いですか?IQR法または標準偏差法?