タグ付けされた質問 「data-visualization」

データの意味のある有用なグラフィック表現を構築します。(あなたの質問が特定のソフトウェアに特定の効果を生み出す方法だけに関するものであるなら、それはおそらくここでは話題になりません。)

2
ポイントの方向角度を示すプロットを作成するにはどうすればよいですか?[閉まっている]
休業。この質問には詳細または明確さが必要です。現在、回答を受け付けていません。 この質問を改善してみませんか?詳細を追加し、この投稿を編集して問題を明確にしてください。 6年前休業。 カバの群れの隣人の角度を比較できるようにしたいです。x座標とy座標、およびそれらが向いている角度のデータがあります(imageJを使用すると、角度は-180から180の間で、0は画像の中央を横切る水平直線になります)。私はg(r )g(r)g(r)関数をプロットして、私のカバが近くにいる個人に「向いている」かどうかを確認しましたが、を使用して群れの方向の視覚的表現を計算できるようにしたいと思いRます。 どんな助けでも大歓迎です、私はまだ本当にR文盲ではありません!


5
既知のクラスターの分離を最大化するための次元削減手法?
それで、R ^ nにたくさんのデータポイントがあるとします。nはかなり大きい(50など)。このデータは3つのクラスターに分類され、各データポイントがどのクラスターに属しているかがわかります。私がやりたいのは、これらのクラスターを2Dで視覚化して、クラスター間の分離を最大化することです。Rのデータポイントの位置に基づいてクラスターが簡単に分離できることを証明することが目標です。 ^ nだけ。 これまで私がこれまで行ってきた方法は、データポイントでPCA変換を実行し、クラスターがかなりきれいに分離されているように見えるまでPCのペアをランダムに視覚化することです。このアプローチはかなりアドホックに思えますが、全体的な分散を最大化する代わりに、クラスター間の分離を最大化するPCAスタイルのデータのローテーションを見つける簡単な方法があるはずです。 これを行う標準的な技術はありますか?そうでない場合、そのような変換を作成する方法についてのアイデアはありますか?

3
データのより良い視覚化によるデータ分析の改善?
4つのプログラムを2つの異なるマシンでa, b, c, d 並行してX、Y別々に10回実行しました。以下はデータのサンプルです。10各プログラムの実行時間(ミリ秒)は、それぞれの名前で示されています。 Machine-X: a b c d 29 40 21 18 28 43 20 18 30 49 20 28 29 50 19 19 28 51 21 19 29 41 30 29 32 47 10 18 29 43 20 18 28 51 30 29 29 41 21 19 …

1
t-SNE視覚化手法に関する直感
データセット(標準化された約10(平均= 0、sd = 1)の数値特徴)のt-SNE視覚化を生成し、次の2次元プロットに到達しました。点が一種の弧状のグループに整列している理由がよくわかりません。たとえば、囲まれた画像の右下の部分(または左端の部分)を参照してください。 元の論文http://www.cs.toronto.edu/~hinton/absps/tsne.pdfでも同様の効果が見つかりました-図4.aを参照してください。しかし、私はこの種の現象をうまく説明することができませんでした。 なぜこれが起こるのかに関する直感はありますか?

2
Rの2変量データを使用して散布図から歪度を判断できますか?
plot(filterdacsom5$Median_Income,filterdacsom5$Total_Population, xlab="Income", ylab ="Population", main="Demographics plotted for all zip codes in 2017 ",col="red" ) 私はR歪度を初めて理解しました。 これはMedian_Income、横軸とTotal_Population縦軸の散布図です。散布図から、データが残っているか、負に歪んでいると言っても安全ですか?

2
なぜ治療コーディングはランダムな傾きと切片の間の相関をもたらすのですか?
実験的処理変数に2つのレベル(条件)がある被験者内および項目内の要因計画を考えます。をm1最大モデルとm2非ランダム相関モデルにします。 m1: y ~ condition + (condition|subject) + (condition|item) m2: y ~ condition + (1|subject) + (0 + condition|subject) + (1|item) + (0 + condition|item) Dale Barr はこの状況について次のように述べています。 編集(2018年4月20日):Jake Westfallが指摘したように、次のステートメントはこの Webサイトの図1および2に示されているデータセットのみを参照しているようです。ただし、基調講演は変わりません。 偏差コーディング表現(条件:-0.5 vs. 0.5)m2では、被験者のランダムな切片が被験者のランダムな傾きと無相関である分布が可能です。最大モデルのみm1が、2つが相関している分布を許可します。 治療コーディング表現(条件:0対1)では、被験者のランダム切片が被験者のランダムな傾きと無相関であるこれらの分布は、無作為相関モデルを使用してフィッティングできません。治療コード表現における勾配と切片。 なぜ治療コーディングは 常に ランダムな傾きと切片の間に相関関係が生じますか?

1
2つの時系列が互いに「異なる」かどうかをどのように示すことができますか?
病気の登録簿に載っている若い患者の数が時間とともに増加していることを示す小さなデータセットがあります。これは、レジストリが時間の経過とともに成功し、今ではより多くのケースを捕らえているからだと思います。 したがって、毎年レジストリに登録されている患者の総数(つまり、すべての年齢)とともに、レジストリに登録されている若い患者の数を毎年(たとえば、折れ線グラフなど)プロットし、 私はこれを大まかにExcelで行いましたが、傾向は同じではありません。したがって、傾向が統計的/グラフ的に相互に一致しているかどうかを示したいと思います。誰もが、スタタまたはエクセルのいずれかを使用してこれを行う良い方法を提案できますか?


1
3次元散布図の代替
プレゼンテーションでは、3次元データを視覚化する必要があります。それらを「散布図のスタイル」で視覚化する必要があります。 最初のアイデアは 三次元散布図 散布図行列 次元削減(PCA)とその後の2次元散布図 これらの概念に代わるものは何ですか?可能であれば、回答にRコードを含めてください。 編集:3次元のオブジェクトが40個あります。各観測は、1から6までの整数値を取ることができます。

5
データ視覚化のための良い本や参考書は何ですか?
効果的なグラフ/データ視覚化の作成に関する参考資料を探しています。 特定のツール(R / ggplotとpython / pandasなど)を使用してデータの視覚化を作成する方法を示す本をたくさん見つけましたが、それは私が探しているものではありません。統計/数学に関してさまざまな種類のグラフを説明するリファレンスを探しています。プロセスよりも理論が欲しい。 さまざまな種類のグラフとその使用方法を知りたい。何か助けて!

2
時間の経過に伴う相関行列のプロット
あなたの経験から、時間的に変化する相関行列を表すための提案はありますか?私が見/quant/1565/how-do-i-graphically-represent-the-evolution-of-a-covariance-matrix-over-timeが、私はいずれかを見つけることができませんでした良い記事。私がこの質問をしているのは、データ分析の分野にかなり慣れていないためggplot2です。また、今まで読んだ唯一の本は、ウィッカムの本です。そこで、専門家に聞いてみようと思いました。 何卒よろしくお願いいたします。

3
散布図でのパターン検出
以下は、プロジェクトが受け取る平均寄付と、開いているDonors Choose Dataに表示されているすべてのプロジェクトの資金提供依頼エッセイの単語数を表す散布図(1万ドルを上限)です。 目立つパターンがありますが、カーブを当てはめて特徴付けようとしました f(x )=(ax − b)2f(x)=(ax−b)2 f(x)=\left(\frac{a}{x-b}\right)^2 手動でのパラメーター操作。ただし、このようなデータのモデリングやパターン/関係の検索にアプローチする他の方法を知りたいのですが。 他の方法を探す動機となる格差は次のとおりです。 線形回帰の標準的な例では、散在点は曲線からの逸脱です。この例では、ポイントが特定のエリアの下に集まっているように見えるため、明らかにそうではありません。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.