タグ付けされた質問 「ggplot2」

ggplot2は、「The Grammar of Graphics」の原則に基づいた、R用の拡張プロットライブラリです。このタグは、(a)質問の重要な部分として「ggplot2」および/または予想される回答を含み、(b)「ggplot2」の使い方だけではない、*トピック*の質問に使用します。

2
ggplot2で凡例のタイトルを変更するにはどうすればよいですか?[閉まっている]
2 x 4 x 3セルデータセットからのデータを要約するために、ggplot2で作成しているプロットがあります。を使用して2レベル変数のパネルを作成しfacet_grid(. ~ Age)、を使用してx軸とy軸を設定できましたaes(x=4leveledVariable, y=DV)。私aes(group=3leveledvariable, lty=3leveledvariable)はこれまでプロットを作成していました。これにより、2レベル変数でパネル化された視覚化が提供されます。X軸は4レベル変数を表し、3レベル変数のパネル内に異なる線がプロットされます。しかし、3レベル変数のキーには3レベル変数の名前が付けられており、文字スペースを含むタイトルにしたいです。凡例のタイトルの名前を変更するにはどうすればよいですか? 私が試したものはうまくいかないようです(abp私のgpgplot2オブジェクトはどこですか): abp <- abp + opts(legend.title="Town Name") abp <- abp + scale_fill_continuous("Town Name") abp <- abp + opts(group="Town Name") abp <- abp + opts(legend.title="Town Name") サンプルデータ: ex.data <- data.frame(DV=rnorm(2*4*3), V2=rep(1:2,each=4*3), V4=rep(1:4,each=3), V3=1:3)

6
RのROC曲線を使用して最適なカットオフポイントとその信頼区間を決定する方法は?
正常細胞と腫瘍細胞を区別するために使用できるテストのデータがあります。ROC曲線によると、この目的には適しています(曲線下面積は0.9): 私の質問は: このテストのカットオフポイントと、読み取り値があいまいであると判断される信頼区間を決定する方法 これを視覚化する最良の方法は何ですか(を使用ggplot2)? グラフはROCRとggplot2パッケージを使用してレンダリングされます: #install.packages("ggplot2","ROCR","verification") #if not installed yet library("ggplot2") library("ROCR") library("verification") d <-read.csv2("data.csv", sep=";") pred <- with(d,prediction(x,test)) perf <- performance(pred,"tpr", "fpr") auc <-performance(pred, measure = "auc")@y.values[[1]] rd <- data.frame(x=perf@x.values[[1]],y=perf@y.values[[1]]) p <- ggplot(rd,aes(x=x,y=y)) + geom_path(size=1) p <- p + geom_segment(aes(x=0,y=0,xend=1,yend=1),colour="black",linetype= 2) p <- p + geom_text(aes(x=1, y= 0, hjust=1, …

3
ggplot2の散布図領域の周りにきちんとしたポリゴンを描く方法[非公開]
散布図上のポイントのグループの周りにきちんとしたポリゴンを追加するにはどうすればよいですか?私はggplot2を使用していますが、の結果には失望していますgeom_polygon。 データセットは、タブ区切りテキストファイルとしてそこにあります。以下のグラフは、多くの国における健康と失業に対する態度の2つの指標を示しています。 私はgeom_density2dより派手ではないが経験的により正確なものに切り替えたいgeom_polygonです。ソートされていないデータの結果は役に立ちません: min-max yx値の周りの輪郭パスとして動作する「きれいな」ポリゴンを描画するにはどうすればよいですか?データを無用にソートしようとしました。 コード: print(fig2 <- ggplot(d, aes(man, eff, colour=issue, fill=issue)) + geom_point() + geom_density2d(alpha=.5) + labs(x = "Efficiency", y = "Mandate")) dオブジェクトを用いて得られる、このCSVファイル。 溶液: ウェイン、アンディ・W、その他の彼らのポインターに感謝します!データ、コード、グラフはGitHubに投稿されています。結果は次のようになります。

4
グリッド線と灰色の背景はチャートジャンクであり、例外ベースでのみ使用する必要がありますか?
ほとんどの当局は、プロット内の暗いグリッド線または他の顕著なグリッド線は、合理的な定義によって「チャートジャンク」であり、チャートの本文のメッセージから視聴者をそらすことに同意しているようです。そのため、その点について言及することはありません。 同様に、視聴者への参照を作成するために淡いグリッド線が必要になる場合があることに同意することができます。この記事で指摘されているように、Tufteは時折グリッド線の必要性を主張しました。そして、あなたがそれらを使用する必要があるときに、淡い灰色の背景にそのようなグリッド線を白にするというggplot2のHadley Wickhamのアプローチに同意します。 しかし、私が不確かなのは、そのようなグリッド線と灰色の背景がggplot2のようにデフォルトであるかどうかです。たとえば、灰色の背景に白いグリッド線を浮き彫りにする以外の理由はないようです-これは、どちらかが必要かどうかの質問をさらに頼みます。私は最近、ほとんどのグラフィックニーズにggplot2の使用を開始し、素晴らしいと思いますが、以前使用していたグラフィックに対する「ボックスなし、背景なし、グリッド線なし」アプローチに挑戦しました。gridlines=OFFそれらを追加する特別な理由がない限り、これが私のデフォルトであると考えていました。たとえば、基本的にこの記事で推奨されているアプローチなどです。 もちろん、グリッド線と背景の陰影を避けるためにggplot2でテーマを定義するのは簡単ですが(実際、私たちの仕事でこれを行いました)、ggplot2のアプローチは非常に素晴らしく、一般的にそのデフォルトの美的選択は良いのでしょうか?何かが欠けています。 だから-私はこの点に関する参考に感謝するでしょう。(例えば、Hadley Wickhamがggplot2のデフォルトを設定することで)よく考えられていて、正しい方向に向けられることに非常に寛容です。私が見つけた中で最高ののは、ggplot2 googleグループ上のリンクのカップルですが、クリーブランドによる最も参考になりそうな参照は、与えられたリンクでは利用できません。

1
ggplot2でgeom_pointの位置を「回避」するにはどうすればよいですか?
ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け入れていません。 Rでggplot2を使用して、次のようなプロットを作成しています。 エラーバーは互いに重なり合っており、非常に乱雑に見えます。異なるインデックスのエラーバーを分離するにはどうすればよいですか?position = "dodge"を使用しましたが、機能していないようです。これが私のコードの主要部分です。 plot = ggplot(data,aes(x=ntrunc,y=beta_best,group=ntrunc,colour=INDEX)) +geom_point(aes(shape=detectable),na.rm=TRUE,position="dodge") +geom_errorbar(aes(x=ntrunc,ymax=beta_high,ymin=beta_low),na.rm=TRUE,position="dodge")

1
ggplot2でファセットの未使用レベルを削除する[終了]
閉まっている。この質問はトピック外です。現在、回答を受け付けていません。 この質問を改善したいですか? 質問を更新して、相互検証のトピックになるようにします。 去年閉鎖されました。 ggplot2sファセットで使用されていないレベルをドロップすることは可能ですか?これは私のコードです: tab = as.data.frame(cbind(groups = mtcars$cyl, names = row.names(mtcars), val = mtcars$mpg, N = mtcars$disp)) tab$N = as.numeric(tab$N) ggplot(tab, aes(names,val)) + geom_point() + coord_flip() + theme_bw() + facet_grid(groups ~ ., drop=TRUE)#, scales="free", as.table=F, space="free") drop=Tスイッチを試しましたが、役に立ちません。何が間違っていますか?

2
インクとデータの比率およびプロットの背景
パッケージとテーマをプロットする多くの「最新技術」と多くの著名なデータの人々は、プロットに灰色の背景を使用していることに気付きました。以下に例を示します。 ggplot2: ネイトシルバーのfivethirtyeight.com: 上記の最初の例(ggplot2)では、灰色の背景を使用するとグリッド線に必要なインクが減ると主張するかもしれませんが、これは確かに2番目の場合には当てはまりません。白または透明の背景とは対照的に、灰色の背景を使用する利点は何ですか?

2
ggplot2で回帰直線を予測または拡張する方法は?
Emacsの日付とバージョン番号とFirefoxのリリースという2つの時系列を含むデータフレームがあります。1つのggplot2コマンドを使用すると、ポイントを線に変換するために黄土を使用したグラフを簡単に作成できます(少しおもしろそうですが、気にしませんが)。 将来的にラインを拡張するにはどうすればよいですか?EmacsとFirefoxのバージョン番号がいつどこで交差するかを判断したいと思います。エラー範囲を表示する方法があれば、さらに良い結果が得られます。 ggplot2がラインをプロットしていることを考えると、モデルを持っている必要がありますが、ラインを延長したり、モデルを取り出してそれで何かをするように指示する方法がわかりません。 > library(ggplot2) > programs <- read.csv("http://www.miskatonic.org/files/se-program-versions.csv") > programs$Date <- as.Date(programs$Date, format="%B %d, %Y") > head(programs) Program Version Date 1 Emacs 24.1 2012-06-10 2 Emacs 23.4 2012-01-29 3 Emacs 23.3 2011-03-10 4 Emacs 23.2 2010-05-08 5 Emacs 23.1 2009-07-29 6 Emacs 22.3 2008-09-05 > head(subset(programs, Program == "Firefox")) …

1
帰無仮説の下で交換可能なサンプルの背後にある直感は何ですか?
順列テスト(ランダム化テスト、再ランダム化テスト、または正確なテストとも呼ばれます)は非常に便利で、たとえば、必要な正規分布の仮定がt-test満たされていない場合や、ランク付けによる値の変換時に役立ちますノンパラメトリックテストのようにMann-Whitney-U-test、より多くの情報が失われます。ただし、この種の検定を使用する場合、帰無仮説の下でのサンプルの交換可能性の仮定は1つだけの仮定を見落とすべきではありません。coinRパッケージで実装されているようなサンプルが3つ以上ある場合にも、この種のアプローチを適用できることも注目に値します。 この仮定を説明するために、平易な英語で比fig的な言葉や概念的な直観を使ってください。これは、私のような非統計学者の間で見過ごされているこの問題を明確にするのに非常に役立つでしょう。 注: 置換テストの適用が同じ仮定の下で保持または無効にならない場合に言及することは非常に役立ちます。 更新: 私の地区の地元の診療所から無作為に50人の被験者を収集したとします。彼らは、1:1の比率で薬またはプラセボを無作為に割り当てられました。それらはすべてPar1、V1(ベースライン)、V2(3か月後)、およびV3(1年後)のパラメーター1について測定されました。50個の被験者はすべて、機能Aに基づいて2つのグループにサブグループ化できます。Aポジティブ= 20およびAネガティブ=30。これらは、機能Bに基づいて別の2つのグループにサブグループ化することもできます。Bポジティブ= 15およびBネガティブ=35 。今、私はPar1すべての訪問ですべての被験者からの値を持っています。交換可能性の仮定の下で、次のPar1場合に順列検定を使用するレベルを比較でき ますか?-薬物と被験者をV2でプラセボを投与した被験者と比較する ますか?-機能Aの対象とV2の機能Bの対象を比較しますか? -V2で機能Aを持つ対象とV3で機能Aを持つ対象を比較しますか? -この比較はどのような状況で無効であり、交換可能性の仮定に違反しますか?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
ggplotは回帰の信頼区間をどのように計算しますか?
Rプロットパッケージggplot2には、関連する信頼帯を使用して回帰直線(または曲線)をプロットするためのstat_smoothという素晴らしい関数があります。 ただし、回帰線(または「メソッド」)のたびに、この信頼帯がどのように生成されるかを正確に把握するのは困難です。どうすればこの情報を見つけることができますか?

1
ggplotで階段関数をプロットする方法は?
ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け入れていません。 私はこのようなグラフを持っています: それを生成するためのRコードは次のとおりです。 DF <- data.frame(date = as.Date(runif(100, 0, 800),origin="2005-01-01"), outcome = rbinom(100, 1, 0.1)) DF <- DF[order(DF$DateVariable),] #Sort by date DF$x <- seq(length=nrow(DF)) #Add case numbers (in order, since sorted) DF$y <- cumsum(DF$outcome) library(ggplot2) ggplot(DF, aes(x,y)) + geom_path() + #Ploting scale_y_continuous(name= "Number of failures") + scale_x_continuous(name= "Operations performed") 私はこのようなものが欲しい: …

4
ヘビーテール分布のBoxplot相当?
ほぼ正規分布のデータの場合、ボックスプロットは、データの中央値と広がり、および異常値の存在をすばやく視覚化する優れた方法です。 ただし、より重い裾の分布では、多くのポイントが外れ値として表示されます。これは、外れ値がIQRの固定因子の外側にあると定義されているためです。 では、この種のデータを視覚化するために人々は何を使用していますか?もっと適応したものはありますか?それが重要な場合は、Rでggplotを使用します。

2
Rでggplot2を使用する2つの因子に関する箱ひげ図
ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け入れていません。 私はRとRのパッケージを初めて使用します。ggplot2のドキュメントを調べましたが、これを見つけることができませんでした。boxthis2つの因子f1とに関して変数のボックスプロットが必要ですf2。それは両方を想定あるf1とf2因子変数であり、それらのそれぞれが2つの値をとり、boxthis連続変数です。私は、それぞれの可能な組み合わせの中から1つの組み合わせに対応し、グラフ上の4箱ひげ図を取得したいf1とf2取ることができます。私はRの基本的な機能を使用して、これを行うことができると思う > boxplot(boxthis ~ f1 * f2 , data = datasetname) 助けてくれてありがとう。
13 r  boxplot  ggplot2 

1
RのPROC Mixedとlme / lmerの違い-自由度
注:法的な理由で以前の質問を削除する必要があったため、この質問は再投稿です。 SASのPROC MIXED をR lmeのnlmeパッケージの関数と比較していると、やや紛らわしい違いを見つけました。より具体的には、異なるテストの自由度はとの間PROC MIXEDで異なり、lmeなぜだろうと思いました。 次のデータセットから開始します(以下のRコード)。 ind:測定が行われる個人を示す因子 fac:測定が行われる臓器 trt:治療を示す因子 y:連続応答変数 アイデアは、次の単純なモデルを構築することです: y ~ trt + (ind):indランダムな要因として y ~ trt + (fac(ind)):facにネストされたindランダムな要因として、 最後のモデルでは特異性が生じることに注意してください。とのyすべての組み合わせに対しての値は1つだけです。indfac 最初のモデル SASでは、次のモデルを作成します。 PROC MIXED data=Data; CLASS ind fac trt; MODEL y = trt /s; RANDOM ind /s; run; チュートリアルによると、使用しているRの同じモデルnlmeは次のようになります。 > require(nlme) > options(contrasts=c(factor="contr.SAS",ordered="contr.poly")) > m2<-lme(y~trt,random=~1|ind,data=Data) 両方のモデルは、係数とそのSEに対して同じ推定値を与えますがtrt、の効果に対してF検定を実行する場合、異なる自由度を使用します。 SAS …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.