タグ付けされた質問 「data-visualization」

データの意味のある有用なグラフィック表現を構築します。(あなたの質問が特定のソフトウェアに特定の効果を生み出す方法だけに関するものであるなら、それはおそらくここでは話題になりません。)

5
クロスオーバー(ペア)実験のエラーバーを表示する方法
次のシナリオは、調査担当者(I)、校閲者/編集者(R、CRANとは無関係)、およびプロット作成者としての私(M)のトリオで最もよくある質問になりました。(R)は、各プロットがエラーバーを持たなければならないことだけを知っている典型的な医療大ボスレビューアであると仮定できます。そうでなければ、それは間違っています。統計レビューアが関与している場合、問題はそれほど重大ではありません。 シナリオ 典型的な薬理学的クロスオーバー研究では、2つの薬物AとBがグルコースレベルへの影響についてテストされます。各患者は、キャリーオーバーがないという仮定の下で、ランダムな順序で2回テストされます。主要エンドポイントはグルコース(BA)の違いであり、対応のあるt検定が適切であると想定しています。 (I)両方の場合の絶対グルコースレベルを示すプロットが必要です。彼は(R)のエラーバーに対する欲求を恐れ、棒グラフの標準エラーを求めます。ここで棒グラフ戦争を始めないでください。 (I):それは真実ではない。バーは重なり、p = 0.03?それは私が高校で学んだことではありません。 (M):ここにはペアのデザインがあります。要求されたエラーバーは完全に無関係です。重要なのは、プロットに示されていないペアの差のSE / CIです。選択肢があり、データが多すぎない場合は、次のプロットを選択します 追加1:これは、いくつかの応答で言及された平行座標プロットです (M):線はペアリングを示し、ほとんどの線が上昇します。勾配が重要なので正しい印象です(わかりました、これはカテゴリですが、それでもなお)。 (I):その写真は紛らわしいです。誰もそれを理解しておらず、エラーバーもありません(Rは潜んでいます)。 (M):差の関連する信頼区間を示す別のプロットを追加することもできます。ゼロラインからの距離は、効果の大きさの印象を与えます。 (I):誰もやらない (R):そして貴重な木を無駄にします (M):(良いドイツ人として):はい、木の上のポイントが取られます。ただし、複数の治療法と複数のコントラストがある場合は、これを使用します(公開することはありません)。 提案はありますか?プロットを作成する場合、Rコードは以下のとおりです。 # Graphics for Crossover experiments library(ggplot2) library(plyr) theme_set(theme_bw()+theme(panel.margin=grid::unit(0,"lines"))) n = 20 effect = 5 set.seed(4711) glu0 = rnorm(n,120,30) glu1 = glu0 + rnorm(n,effect,7) dt = data.frame(patient = rep(paste0("P",10:(9+n))), treatment = rep(c("A","B"), each=n),glucose …

2
ヒート/等高線図での色の最も効果的な使用
時間周波数の脳波所見を提示する際に、熱/等高線図を使用することは非常に一般的です。しばしば選択される配色(および私が気に入って使用している配色)は「ジェット」配色です(たとえば、Google画像検索の時間周波数EEGを参照)。これらのプロットを表示するためのより良い配色、および/またはそのようなマップの表示のためのガイドラインがあるかどうか疑問に思っています。 たとえば、Rベースライブラリから #Volcano x <- 10*(1:nrow(volcano)) y <- 10*(1:ncol(volcano)) image(x, y, volcano, col = terrain.colors(100), axes = FALSE) # With Jet colours jet.colors <- colorRampPalette(c("midnightblue","blue", "cyan","green1", "yellow","orange","red", "darkred"), space="Lab") image(x, y, volcano, col = jet.colors(100), axes = FALSE)

5
視覚化のために高次元データを削減する方法
2Dの物理シミュレーションに取り組んでおり、いくつかの時点でデータを時間内に収集しています。これらの離散点は垂直軸に沿っており、軸方向に複数の線があります。これにより、データセットが事実上4Dになります。 たとえば、次の(X、Y)座標にコレクションポイントがあると仮定します。 (0,0)、(1,0)、(2,0) (0,1)、(1,1)、(2,1) (0,2)、(1,2)、(2,2) そして、各ポイントで収集しています。ここで、Pは圧力、Tは温度、U 、Vは速度のXおよびY成分です。シミュレーションの各反復で、これらの変数は9つの収集ポイントすべてに対して保存されます。したがって、私のデータはすべて、空間内の各離散点で時間的に連続しています。{P,T,U、V}{P、T、うん、V}\{P,T,U,V\}PPPTTTうん、Vうん、VU,V たとえば、単一ポイントのデータは次のようになります。 たとえば、すべてのポイントで圧力を常に表示して、垂直波と軸波を表示することに興味があります。これを1本の線(垂直または軸)に沿って行う場合、軸(Y、時間、圧力)のウォーターフォールプロットを使用できます。しかし、3本の垂直線と3本の軸線がある場合、これは6つのウォーターフォールプロットになり、両方向の波動の全体像を取得します。空間座標は離散変数ですが、フィールド(この場合は圧力)と時間が連続しています。 T ≈ 0.000125t≈0.000125t\approx0.000125 すべてを一度に表示する方法はありますか?通常、「4番目の」次元を表示するために色を追加できますが、別の可能なアプローチはありますか?できる限り多くの方法でプロットして、他の人が知らない情報が明らかになるかどうかを確認する予定です。アイデアを提案してください。 シミュレーションが3Dで、5Dの結果データセットがあった場合はどうなりますか?それは可能な視覚化方法を変えますか?

8
プロットの設計と作成に不可欠なルールは何ですか?
バックグラウンド: 以前、クロス検証では、次の質問がありました。 プロットを準備する際のベストプラクティスは何ですか? 2つの数値変数をプロットするためのオンラインで利用可能な良いヒントは何ですか? それはによって示唆された@デビッドでこの質問へのコメントは我々が持っている必要があることをコミュニティのwikiとの質問の回答ごとに可視化ルールをコミュニティは上の投票ができること。 質問 データのグラフィカル表現の設計と作成に関する基本的なルールは何ですか? ルール 回答ごとに1つのルール 理想的な理由を簡単に説明してください。 良いプラクティスと悪いプラクティスの例(コードと画像)を含む回答が望ましい。

10
データの視覚化の作成を学習するためのリソースですか?
http://flowingdata.comおよびinformationisbeautifulで表示される視覚化の種類を作成する方法を学ぶことに興味があります。編集:それ自体が興味深い意味、視覚化-ちょっとしたレポートのようなものとは対照的に、NYタイムズのグラフィックのようなものです。 これらを作成するためにどのようなツールが使用されますか?ほとんどはAdobe Illustrator / Photoshopの多くですか?特にデータの視覚化にこれらのツールを使用する方法を学習するのに役立つリソース(書籍、Webサイトなど)とは何ですか? 私はビジュアライゼーションがどのように見えるかを知っています(そして、Tufteの本などの設計原則に精通しています)が、それらを作成する方法がわかりません。

1
ggplot2でファセットの未使用レベルを削除する[終了]
閉まっている。この質問はトピック外です。現在、回答を受け付けていません。 この質問を改善したいですか? 質問を更新して、相互検証のトピックになるようにします。 去年閉鎖されました。 ggplot2sファセットで使用されていないレベルをドロップすることは可能ですか?これは私のコードです: tab = as.data.frame(cbind(groups = mtcars$cyl, names = row.names(mtcars), val = mtcars$mpg, N = mtcars$disp)) tab$N = as.numeric(tab$N) ggplot(tab, aes(names,val)) + geom_point() + coord_flip() + theme_bw() + facet_grid(groups ~ ., drop=TRUE)#, scales="free", as.table=F, space="free") drop=Tスイッチを試しましたが、役に立ちません。何が間違っていますか?

4
RまたはSPSSを使用したリッカート応答の視覚化
2つのグループに82人の回答者(グループAの43人とグループBの39人)があり、それぞれ1〜5の65のリッカート質問の調査を完了しました(強く同意する-強く同意しない)。したがって、66列(質問ごとに1 +グループ割り当てを示す1)と82行(回答者ごとに1)のデータフレームがあります。 RまたはSPSSを使用することで、このデータを視覚化する優れた方法を誰もが知っています。 このようなものが必要です: (Jason Bryerから) しかし、コードの最初のセクションを機能させることはできません。あるいは、以前の相互検証された投稿からリッカートデータを視覚化する方法の非常に良い例を見つけました:リッカートアイテムレスポンスデータを視覚化するが、RまたはSPSSを使用してこれらの中心カウントグラフまたは積み上げ棒グラフを作成する方法に関するガイドも指示もありません。

9
チャート、図、プロットタイプのギャラリー
データ表示技術の包括的なギャラリーとして何をお勧めしますか?データを表示するより良い方法を考えているときに参照するために使用できるソースですか? 私は以下のものを特定しましたが、あなたがあなたのものを追加できたら嬉しいです: オンラインギャラリー: http://www.mathworks.com/discovery/gallery.html http://www.idlcoyote.com/gallery/ https://developers.google.com/chart/interactive/docs/gallery?csw=1 http://www.walkingrandomly.com/?p=4788 http://en.wikipedia.org/wiki/Category:Statistical_charts_and_diagrams(1 ページのグラフィックギャラリーは提供しません) http://docs.ggplot2.org/current/ http://www.itl.nist.gov/div898/handbook/graphgal.htm http://scikit-learn.org/stable/auto_examples/index.html http://www.stata.com/support/faqs/graphics/gph/stata-graphs/ http://shiny.rstudio.com/gallery/ https://bl.ocks.org/(インタラクティブおよびベクターグラフィックス) http://www.texample.net/tikz/examples/(コードを使用したTikZおよびPGPの視覚化) ブック(ページに散らばったプロット): エドワード・R・タフテ、定量的情報の視覚的表示 Nathan Yau、データポイント

4
ゲージチャートが悪い場合、なぜ車にはゲージがあるのですか?
データ視覚化の専門家は一般的にゲージチャートを不承認にしているようです(ここを参照:パーセントを示す針が付いたハーフパイチャートのように見えるチャートとは何ですか?)。主な理由は、ゲージチャートのデータとインクの比率が低いことです。 これらの概念(いくつかのTufteの本)にさらされて以来、私は一般にそれらに同意しましたが、今日は疑問に思いました:ゲージが情報を伝達するのに非常に非効率であるなら、なぜ車/ボート/飛行機には多くのゲージがありますか彼らのダッシュボード?そして、その質問に対する答えは、大企業向けのソフトウェアダッシュボードの作成に何らかの関連性がありますか? 私が見つけたいくつかの追加情報を含むように編集しました: 「ガラスのコックピット」という用語を見つけました。これは、機械式ゲージがLCDスクリーンに置き換えられた飛行機のコックピットを指します。これは、ウェインによって出された「慣習」の議論に信頼性を与えます。 http://en.wikipedia.org/wiki/Glass_cockpit iPadのアプリは、ダッシュボードのように車のテレメトリを表示します。ゲージは表示されません。 http://itunes.apple.com/us/app/dashcommand-obd-ii-gauge-dashboards/id321293183?mt=8 また、自動車用のデジタルゲージの大まかな例を見つけました(視聴者の裁量をお勧めします)。 http://www.chetcodigital.com/index-Automotive.htm

1
Rでスパークラインをプロットする
ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け入れていません。 Rを使用して、次のようなものをプロットしたいと思います。 座標、幅、高さなどを追跡することは可能ですが、非常に複雑に思えます。直感的には、各セルを新しいプロットとして扱い、各セルの座標を変換するのが最善のように思われます。Rでこれを行う方法はありますか? ありがとう!

4
Tufteの軸を達成するためのRプロットの境界線の削除
ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け入れていません。 次のグラフを検討してください。 x <- 1:100 y1 <- rnorm(100) y2 <- rnorm(100)+100 par(mar=c(5,5,5,5)) plot(x,y1,pch=0,type="b",col="red",yaxt="n",ylim=c(-8,2),ylab="") axis(side=2, at=c(-2,0,2)) mtext("red line", side = 2, line=2.5, at=0) par(new=T) plot(x,y2,pch=1,type="b",col="blue",yaxt="n",ylim=c(98,108), ylab="") axis(side=4, at=c(98,100,102), labels=c("98%","100%","102%")) mtext("blue line", side=4, line=2.5, at=100) Tufteのスタイルを実現するために、自動生成された境界線を削除し、軸線のみを保持するにはどうすればよいですか?


4
3つのグループ間で多くの割合の違いを最もよく視覚化する方法は?
3つの異なるニュース出版物がさまざまなトピックをカバーする方法を視覚的に比較しようとしています(LDAトピックモデルによって決定されます)。これを行うための2つの関連する方法がありますが、これはあまり直感的ではないという同僚から多くのフィードバックを受け取っています。誰かがこれを視覚化するためのより良いアイデアを持っていることを願っています。 最初のグラフでは、各出版物の各トピックの割合を次のように示しています。 これは、私が話したほとんどすべての人にとって非常に簡単で直感的です。ただし、出版物の違いを確認することは困難です。どの新聞がどのトピックをさらに取り上げていますか? これを実現するために、トピックの割合が最も高い出版物と2番目に高い出版物との違いをグラフ化し、最高の出版物で色付けしました。このような: たとえば、サッカーの巨大なバーは、実際にはアルアフラムイングリッシュとデイリーニュースエジプト(サッカーの報道では2位)の間の距離であり、アルアハラムが1位であるため、赤色になっています。同様に、エジプト独立の割合が最も高く、バーサイズがエジプト独立とデイリーニュースエジプト(再び#2)の間の距離であるため、試行は緑色です。 2つのパラグラフのすべてが、グラフが自給自足テストに失敗したというかなり確実な兆候であることを説明しなければならないという事実。見ているだけでは、実際に何が起こっているのかを知るのは困難です。 各トピックの主要な出版物を視覚的に強調する方法に関する一般的な提案はありますか? 編集:データを再生するにはここでのdputRからの出力だけでなく、CSVファイル。 編集2:これは予備のドットプロットバージョンです。ドットの直径はコーパス内のトピックの割合に比例します(これは、トピックが最初にソートされた方法です)。まだ少し調整する必要がありますが、以前よりもずっと直感的に感じられます。みんな、ありがとう!


4
ACFおよびPACFの式
時系列データからACFとPACFをプロットするコードを作成したい。このように、minitab(下)からプロットを生成しました。 数式を検索しようとしましたが、まだよくわかりません。 式とその使用方法を教えてください。 上記のACFおよびPACFプロットの水平の赤い線は何ですか?式は何ですか? ありがとうございました、

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.