統計とビッグデータ scatterplot

1

ある場所に座ってパターンに従うはずのデータポイントのセットがありますが、最終的な分析で不確実性を引き起こす主な場所からのいくつかの散乱ポイントがあります。きちんとした軌跡を取得して、後で分析に適用したいと考えています。青い点は、手動で行わずに洗練された方法で見つけて除外したい散乱点です。 Nearest Neighbors Regressionのようなものを使用することを考えていましたが、それが最善のアプローチであるかどうか、または適切な結果を得るためにどのように実装する必要があるのかよくわかりません。ちなみに、フィッティングは一切せずにやりたいです。データの転置バージョンは次のとおりです。 X=array([[ 0.87 , -0.01 , 0.575, 1.212, 0.382, 0.418, -0.01 , 0.474, 0.432, 0.702, 0.574, 0.45 , 0.334, 0.565, 0.414, 0.873, 0.381, 1.103, 0.848, 0.503, 0.27 , 0.416, 0.939, 1.211, 1.106, 0.321, 0.709, 0.744, 0.309, 0.247, 0.47 , -0.107, 0.925, 1.127, 0.833, 0.963, 0.385, 0.572, …

9 outliers scatterplot

3

散布図のX軸とY軸にどの変数が入るかを判断する方法は？

私は、識字能力と乳児死亡率の関係を確認するために散布図を作成しようとしています。識字率が私のX軸であり、乳児死亡率が私のY軸であるかどうか、またはその逆はどうすればわかりますか？X軸とY軸に何が入るかをどのように判断しますか？

8 data-visualization scatterplot

1

判別式を散布図の線としてプロットする

データ散布図が与えられると、主成分スコアである点で並べられた軸としてデータの主成分をプロットできます。雲（2つのクラスターからなる）とその最初の主成分のプロット例を見ることができます。簡単に描くことができます。生のコンポーネントスコアは、データマトリックスx固有ベクトルとして計算されます。元の軸（V1またはV2）上の各スコアポイントの座標は、スコアx cos-between-the-axis-and-the-component（固有ベクトルの要素）です。私の質問：なんとかして同様の方法で判別式を描くことは可能ですか？私の写真を見てください。次に、2つのクラスター間の判別を、判別スコア（判別分析後）をポイントとして並べた線としてプロットします。はいの場合、アルゴは何でしょうか？

8 pca discriminant-analysis scatterplot

1

3次元散布図の代替

プレゼンテーションでは、3次元データを視覚化する必要があります。それらを「散布図のスタイル」で視覚化する必要があります。最初のアイデアは三次元散布図散布図行列次元削減（PCA）とその後の2次元散布図これらの概念に代わるものは何ですか？可能であれば、回答にRコードを含めてください。編集：3次元のオブジェクトが40個あります。各観測は、1から6までの整数値を取ることができます。

7 r data-visualization scatterplot

3

散布図でのパターン検出

以下は、プロジェクトが受け取る平均寄付と、開いているDonors Choose Dataに表示されているすべてのプロジェクトの資金提供依頼エッセイの単語数を表す散布図（1万ドルを上限）です。目立つパターンがありますが、カーブを当てはめて特徴付けようとしました f（x ）=（ax − b）2f(x)=(ax−b)2 f(x)=\left(\frac{a}{x-b}\right)^2 手動でのパラメーター操作。ただし、このようなデータのモデリングやパターン/関係の検索にアプローチする他の方法を知りたいのですが。他の方法を探す動機となる格差は次のとおりです。線形回帰の標準的な例では、散在点は曲線からの逸脱です。この例では、ポイントが特定のエリアの下に集まっているように見えるため、明らかにそうではありません。

7 regression data-visualization curve-fitting scatterplot

タグ付けされた質問 「scatterplot」

タグ付けされた質問「scatterplot」