タグ付けされた質問 「outliers」

17
Pandasデータフレームの外れ値を検出して除外する
列が少ないpandasデータフレームがあります。 これで、特定の行が特定の列値に基づく外れ値であることがわかりました。 例えば 列「Vol」にはすべての値が12xxあり、1つの値は4000(外れ値)です。 次にVol、このような列を持つ行を除外します。 したがって、基本的には、特定の列の値が平均から3標準偏差以内にあるすべての行を選択するように、データフレームにフィルターをかける必要があります。 これを達成するためのエレガントな方法は何ですか?

11
データセットから外れ値を削除する方法
美容と年齢の多変量データをいくつか持っています。年齢の範囲は2〜20(20、22、24 .... 40)の間隔で20〜40であり、データの各レコードについて、年齢と1〜5の美しさの評価が与えられます。このデータのボックスプロット(X軸の年齢、Y軸の美しさの評価)を行うと、各ボックスのひげの外側にいくつかの外れ値がプロットされています。 データフレーム自体からこれらの外れ値を削除したいのですが、Rがボックスプロットの外れ値を計算する方法がわかりません。以下は、私のデータの例です。
98 r  statistics  outliers 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.