タグ付けされた質問 「data-visualization」

データの意味のある有用なグラフィック表現を構築します。(あなたの質問が特定のソフトウェアに特定の効果を生み出す方法だけに関するものであるなら、それはおそらくここでは話題になりません。)


1
分位数回帰プロット(quantregパッケージ)の赤い線は何ですか?
R plot.rqのquantregパッケージで使用すると、係数推定分布をプロットして、次のような結果を得ることができます。 赤い点線は何ですか?広範囲のグーグルにより、真ん中の値は99のすべての推定値の平均であることがわかりましたが、赤い点線についてはまだわかりません。

5
ゼロ値の過半数を含む管理図を解釈する方法は?
管理図を使用して一部の感染データを処理しようとしていますが、感染が「制御不能」と見なされた場合は警告が表示されます。 ほとんどの時点で感染がゼロで、1〜2回の感染が数回しかない一連のデータに到達したときに問題が発生しますが、これらはすでにグラフの管理限界を超えており、アラートが発生します。 データセットの陽性感染数が非常に少ない場合、管理図でどのように作業すればよいですか? ありがとう!

4
時系列グラフの「しきい値」の線の色は適切ですか?
ネットワーク/サーバー操作のコンテキストで時系列メトリックをプロットしています。データのサンプルレートは5分で、CPU使用率、エラー率などで構成されています。 グラフに水平の「しきい値」線を追加して、それを超えると人々が心配/注意する必要のある値のしきい値を視覚的に示します。たとえば、CPU使用率の例では、おそらく「心配」のしきい値は75%です。 私のチームは、この線が何色であるかについて内部の議論をしています: 背景グリッドとデータラインからはっきりと目立つ鮮やかな赤のようなもので、これは警告状態であることを示しています 線の「インク」は実際のデータを表していないため、もっと微妙で赤くはないはずです。そのため、不必要に注意を引くべきではありません。 ガイダンス/ベストプラクティスに感謝します...

1
Rのボックスプロット:変位値が決定されるときに異常値はカウントされますか?
1次元のデータセットがあり、boxplot関数を使用してボックスプロットを作成します。その後、私はいくつかの外れ値を持っていることがわかります。 変位値が決定されるときに異常値はカウントされますか? どちらの方法が使用されているかが明らかである限り、正しい/間違った方法はありますか、それとも両方が正しいですか?もしそうなら、Rはそれをどのように行うのですか?

4
このBBCチャート(教育と結果の間のブレグジットの相関関係)はどのように描画する必要がありますか?
BBCはより多くのBrexit国民投票データを分析しました。彼らの記事の最初のチャートが私の目を引いた: x軸を50%に分割するのは奇妙に思えました。確かに、これはデータの中央値で分割されるべきでしたか?(または、データが正常に分布していた場合の平均ですが、目を細めると、ここではそうではありません。) (彼らはデータを公表していませんが、簡単なグーグルは卒業生が成人人口の約-25%であることを示唆しており、それはチャートの目を見張るようなものと一致するので、私はそれに進みます。) しかし、それによって私はこのチャートをできるだけ客観的に描く方法を考えました。X軸を直線に保ち、右側の2つのボックスの幅を3倍にするほうがよいでしょうか。または、ボックスをすべて同じサイズに保ち、x軸を押しつぶして伸ばし、すべてのNピクセルスパンが同じ数のデータポイントをカバーするようにしますか?または、他の何か?

5
探索的データ分析のためのグラフのコメントの保持
探索的データ分析を行う際に、グラフを印刷したり、コメント/注釈などを書き出すことがよくあります。 人々はより良​​い電子的方法論についての提案を持っていますか?私は特にpython / Rに興味があります。 探索的作業を遅くすることはないが、私が行った洞察を記録するのに役立つ、「迅速な(そして汚い)」何かを探しています。 私が想像できることは、PDFとしてグラフを生成し、コメントを追加することです。 理想的には、これをプログラムで行うオプションが欲しいので、グラフをやり直すと、「自動的に」コメントを追加できるようになります。

3
SVDを実行して欠損値を代入する方法、具体例
SVDを適用する前に欠損値を処理する方法に関する素晴らしいコメントを読みましたが、簡単な例でどのように機能するか知りたいです。 Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 上記のマトリックスを考えると、NAの値を削除すると、User2とUser5しかなくなります。これは、私のUが2×kになることを意味します。しかし、欠損値を予測する場合、Uは5×kである必要があります。これは、特異値とVで乗算できます。 上記のマトリックスで、最初に欠損値のあるユーザーを削除してからSVDを適用して、欠損値を記入する人はいますか?数学記号を使いすぎずに、適用した手順の非常に簡単な説明を提供し、答えを実用的なものにしてください(つまり、数値に別の数値を掛けると答えが得られます)。 次のリンクを読みました。 stats.stackexchange.com/q/33142 stats.stackexchange.com/q/31096 stats.stackexchange.com/q/33103
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 

1
RでのPCAの視覚化:データポイント、固有ベクトル、射影、信頼楕円
私は17人のデータセットを持ち、77のステートメントをランク付けしています。ステートメント間(ケースとして)の人(変数)間の相関の転置相関行列の主成分を抽出したい。奇妙なことに、Qメソドロジと呼ばれています。 データのペアのみの固有値/ベクトルを抽出して視覚化することにより、このコンテキストでPCAがどのように機能するかを説明します。(私の分野では PCAを取得している人はほとんどいないため、QAへの適用はもちろんのこと、私も含まれます)。 私の実際のデータに対してのみ、この素晴らしいチュートリアルからの視覚化が必要です。 これを私のデータのサブセットにしましょう: Person1 <- c(-3,1,1,-3,0,-1,-1,0,-1,-1,3,4,5,-2,1,2,-2,-1,1,-2,1,-3,4,-6,1,-3,-4,3,3,-5,0,3,0,-3,1,-2,-1,0,-3,3,-4,-4,-7,-5,-2,-2,-1,1,1,2,0,0,2,-2,4,2,1,2,2,7,0,3,2,5,2,6,0,4,0,-2,-1,2,0,-1,-2,-4,-1) Person2 <- c(-4,-3,4,-5,-1,-1,-2,2,1,0,3,2,3,-4,2,-1,2,-1,4,-2,6,-2,-1,-2,-1,-1,-3,5,2,-1,3,3,1,-3,1,3,-3,2,-2,4,-4,-6,-4,-7,0,-3,1,-2,0,2,-5,2,-2,-1,4,1,1,0,1,5,1,0,1,1,0,2,0,7,-2,3,-1,-2,-3,0,0,0,0) df <- data.frame(cbind(Person1, Person2)) g <- ggplot(data = df, mapping = aes(x = Person1, y = Person2)) g <- g + geom_point(alpha = 1/3) # alpha b/c of overplotting g <- g + geom_smooth(method = "lm") # just for …

1
差異の差異(複数期間)回帰を視覚化する最良の方法は何ですか?
バイナリー処理と連続処理の両方で差異の違いを視覚化する最良の方法は何ですか? コントロールのセットで結果変数を後退させますが、治療変数を除外し、各グループの残差をプロットしますか(バイナリケース)? ATEパラメータの「ダイナミクス」を経時的に確認する方法はありますか? 並行トレンドの仮定が妥当であることを示したいと思います。

2
可視化とオーバープロット:散布の代替
多数の国データが混み合っていますが(下に表示されているように)、ラベルと外れ値が必要です–グラフもたくさんあるため、ウィンドウをリセットして偽のデータポイントを追加するのは面倒です外れ値の。 そのような状況でより良いかもしれない散布図の良い代替はありますか?本当に地図を作成したいのですが、表示された順序付けられたペアの両方の部分が必要です。


2
ハムスターの車輪回転データの分析
この質問を投稿する前に、私はこのスタックの他の質問を閲覧しましたが、これはおそらくそれを読む人にとっては公園の散歩になるでしょう!しかし、このスタックの説明にはデータ分析と視覚化が含まれているので、これが正しい場所にあることを願っています! </ preapology> 私は磁石とリードセンサーを備えたRaspberry Piを使用して、ハムスターが夜に起きていることを記録しています。Piは各回転を次のように記録します。 2014-09-04 00:20:04.987819,1 2014-09-04 00:20:16.219891,2 2014-09-04 00:20:17.260086,3 2014-09-04 00:20:20.031204,4 2014-09-04 00:20:20.907755,5 ... それは私がいくつかの助けをして欲しいデータで何かをすることになるときです。Piが生成する毎日の分析の例を次に示します。 こんにちはパパ! 昨夜、私は00:20に車に乗り、04:51に就寝しました(もちろん休憩あり)。ホイールから離れるのに最も長くかかったのは、03:05-03:31の26分間でした。 4時間31分の間にホイールを11,903回周回しました!車輪の直径は18cmなので、18⋅⋅11903/100≈6,731メートル移動したことになります。それは4.18マイルです! ラブビスケットx 次のようなデータの簡単なグラフも作成しました。 また、彼が最もアクティブな時間を確認するために、1時間ごとの分析を行うことも考えました。 私の存在しない統計的知識を考えると、それは私が考えることができるすべてです。他に何かできることはありますか?(分析と視覚化の両方に関して)。追加のデータをキャプチャする必要がある場合は問題ありません。 アクティグラフィー追跡の開始を示すために編集されました

1
棒を色分けされたオブジェクトに置き換える棒グラフの名前はありますか?
私はこのタイプのチャートに関する情報を見つけようとしていて、意図しない結果が出続けるだけです。この例のように、棒を色分けされたオブジェクトで置き換える棒グラフを見つけるための名前または検索語はありますか。 誰かが興味を持っている場合は、グラフィックデザインエクスチェンジでこの質問の解決策を提供するために調査しています:正確な統計を含む積み上げ棒グラフでデザインを使用するにはどうすればよいですか?

4
グラフのドットを接続する
方程式の積であるグラフが与えられると、方程式を解く点を有意義に計算でき、その結果、点を通る直線も計算できます。線は、その任意の点で、答えです。 しかし、「1時間あたりの車の数/駐車場」のような測定値についてはどうでしょう。各時間測定のドットを接続することは意味がありますか?それまでに何台の車があったかわからないので、これは私たちを誤った結果、または少なくとも誤解を招く結果に導くのではないでしょうか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.