1
散布図で外れ値を見つける
ある場所に座ってパターンに従うはずのデータポイントのセットがありますが、最終的な分析で不確実性を引き起こす主な場所からのいくつかの散乱ポイントがあります。きちんとした軌跡を取得して、後で分析に適用したいと考えています。青い点は、手動で行わずに洗練された方法で見つけて除外したい散乱点です。 Nearest Neighbors Regressionのようなものを使用することを考えていましたが、それが最善のアプローチであるかどうか、または適切な結果を得るためにどのように実装する必要があるのかよくわかりません。ちなみに、フィッティングは一切せずにやりたいです。 データの転置バージョンは次のとおりです。 X=array([[ 0.87 , -0.01 , 0.575, 1.212, 0.382, 0.418, -0.01 , 0.474, 0.432, 0.702, 0.574, 0.45 , 0.334, 0.565, 0.414, 0.873, 0.381, 1.103, 0.848, 0.503, 0.27 , 0.416, 0.939, 1.211, 1.106, 0.321, 0.709, 0.744, 0.309, 0.247, 0.47 , -0.107, 0.925, 1.127, 0.833, 0.963, 0.385, 0.572, …