タグ付けされた質問 「scatterplot」

デカルト座標の点としてプロットされた(x、y)値のペア。探索的および診断ツールとして広く使用されています。

1
散布図で外れ値を見つける
ある場所に座ってパターンに従うはずのデータポイントのセットがありますが、最終的な分析で不確実性を引き起こす主な場所からのいくつかの散乱ポイントがあります。きちんとした軌跡を取得して、後で分析に適用したいと考えています。青い点は、手動で行わずに洗練された方法で見つけて除外したい散乱点です。 Nearest Neighbors Regressionのようなものを使用することを考えていましたが、それが最善のアプローチであるかどうか、または適切な結果を得るためにどのように実装する必要があるのか​​よくわかりません。ちなみに、フィッティングは一切せずにやりたいです。 データの転置バージョンは次のとおりです。 X=array([[ 0.87 , -0.01 , 0.575, 1.212, 0.382, 0.418, -0.01 , 0.474, 0.432, 0.702, 0.574, 0.45 , 0.334, 0.565, 0.414, 0.873, 0.381, 1.103, 0.848, 0.503, 0.27 , 0.416, 0.939, 1.211, 1.106, 0.321, 0.709, 0.744, 0.309, 0.247, 0.47 , -0.107, 0.925, 1.127, 0.833, 0.963, 0.385, 0.572, …


1
判別式を散布図の線としてプロットする
データ散布図が与えられると、主成分スコアである点で並べられた軸としてデータの主成分をプロットできます。雲(2つのクラスターからなる)とその最初の主成分のプロット例を見ることができます。簡単に描くことができます。生のコンポーネントスコアは、データマトリックスx固有ベクトルとして計算されます。元の軸(V1またはV2)上の各スコアポイントの座標は、スコアx cos-between-the-axis-and-the-component(固有ベクトルの要素)です。 私の質問:なんとかして同様の方法で判別式を描くことは可能ですか?私の写真を見てください。次に、2つのクラスター間の判別を、判別スコア(判別分析後)をポイントとして並べた線としてプロットします。はいの場合、アルゴは何でしょうか?

1
3次元散布図の代替
プレゼンテーションでは、3次元データを視覚化する必要があります。それらを「散布図のスタイル」で視覚化する必要があります。 最初のアイデアは 三次元散布図 散布図行列 次元削減(PCA)とその後の2次元散布図 これらの概念に代わるものは何ですか?可能であれば、回答にRコードを含めてください。 編集:3次元のオブジェクトが40個あります。各観測は、1から6までの整数値を取ることができます。

3
散布図でのパターン検出
以下は、プロジェクトが受け取る平均寄付と、開いているDonors Choose Dataに表示されているすべてのプロジェクトの資金提供依頼エッセイの単語数を表す散布図(1万ドルを上限)です。 目立つパターンがありますが、カーブを当てはめて特徴付けようとしました f(x )=(ax − b)2f(x)=(ax−b)2 f(x)=\left(\frac{a}{x-b}\right)^2 手動でのパラメーター操作。ただし、このようなデータのモデリングやパターン/関係の検索にアプローチする他の方法を知りたいのですが。 他の方法を探す動機となる格差は次のとおりです。 線形回帰の標準的な例では、散在点は曲線からの逸脱です。この例では、ポイントが特定のエリアの下に集まっているように見えるため、明らかにそうではありません。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.