プログラミング r

2

私はこれを見つけました、ggplot2を使用してRのgeom_barにラベルを配置する方法。ここでは、x軸ごとに2本の棒があるとしましょう。同じようにするにはどうすればよいですか。私のデータとコードは次のようになります： dat <- read.table(text = "sample Types Number sample1 A 3641 sample2 A 3119 sample1 B 15815 sample2 B 12334 sample1 C 2706 sample2 C 3147", header=TRUE) library(ggplot2) bar <- ggplot(data=dat, aes(x=Types, y=Number, fill=sample)) + geom_bar(position = 'dodge') + geom_text(aes(label=Number)) 次に、以下を取得します。数字のテキストも「覆い焼き」パターンで配置されているようです。私が検索したマニュアルgeom_textいくつかの情報を見つけることが、それを動作させることはできません。提案？

99 r ggplot2 bar-chart

4

lapplyのFUNにいくつかの引数を渡します（他の* apply）

で使用lapplyする場合、関数に複数の引数を渡すことについて質問がありRます。の構文でlapplyを使用すると、lapply(input, myfun);これは簡単に理解でき、myfunを次のように定義できます。 myfun <- function(x) { # doing something here with x } lapply(input, myfun); およびの要素はinput、x引数としてに渡されますmyfun。しかし、さらに引数を渡す必要がある場合はどうなりmyfuncますか？たとえば、次のように定義されています。 myfun <- function(x, arg1) { # doing something here with x and arg1 } input（x引数として）要素と他の引数の両方を渡してこの関数を使用するにはどうすればよいですか？

99 r lapply

10

複数の列を一緒に貼り付け

データフレームに次のように一緒に貼り付けたい（「-」で区切られた）列の束があります。 data <- data.frame('a' = 1:3, 'b' = c('a','b','c'), 'c' = c('d', 'e', 'f'), 'd' = c('g', 'h', 'i')) i.e. a b c d 1 a d g 2 b e h 3 c f i 私がなりたいもの： a x 1 a-d-g 2 b-e-h 3 c-f-i 私は通常これを次のようにして行うことができます： within(data, x <- paste(b,c,d,sep='-')) …

99 r paste r-faq

11

データセットから外れ値を削除する方法

美容と年齢の多変量データをいくつか持っています。年齢の範囲は2〜20（20、22、24 .... 40）の間隔で20〜40であり、データの各レコードについて、年齢と1〜5の美しさの評価が与えられます。このデータのボックスプロット（X軸の年齢、Y軸の美しさの評価）を行うと、各ボックスのひげの外側にいくつかの外れ値がプロットされています。データフレーム自体からこれらの外れ値を削除したいのですが、Rがボックスプロットの外れ値を計算する方法がわかりません。以下は、私のデータの例です。

98 r statistics outliers

6

ggplot2でのqplot（）とggplot（）の選択[終了]

休業。この質問は意見に基づいています。現在、回答を受け付けていません。この質問を改善してみませんか？この投稿を編集して、事実と引用で回答できるように質問を更新してください。 3年前休業。この質問を改善する私は偉大使用することを始めているggplot2Rでプロットするためのパッケージを、各プロットがされる前に、私は自分自身に尋ねる最初のものの一つ「だけでなく、私が使用しますqplotかggplot？」最大の機能と柔軟性qplotをggplot可能にしながら、より単純な構文を提供することを理解していますが、最もよく使用する関数は何ですか？それぞれに正確な使用例はありますか？あなたは、ほとんど使用していますqplotし、ggplot複雑なプロットのためにのみ、またはあなたが使用して行うggplot毎回？ご意見ありがとうございます！

98 r ggplot2

5

パッケージのロード時にメッセージを無効にする

私のR環境にロードする必要があるR（ROCR）のパッケージがあります。パッケージをロードすると、一連のメッセージが出力されます。これは通常は問題ありませんが、Rスクリプトの出力はさらに分析するために使用されているため、この出力をすべて完全に無効にしたいと思います。それ、どうやったら出来るの？さらに、ROCRをまったく変更せずにそれを実行したいので、このスクリプトの将来のユーザーもそれを実行する必要はありません。これまでのところ： sink()ここでは機能しません-stdoutとstd errの両方をリダイレクトし/dev/nullても何も起こりません。当然のことながら、options(warnings=-1)これらは警告そのものではないため、何も実行されません。何かご意見は？

98 r messages

8

バープロットのRでx軸ラベルを回転させる

運が悪いので、バープロットでx軸ラベルを45度回転させようとしています。これは私が以下に持っているコードです： barplot(((data1[,1] - average)/average) * 100, srt = 45, adj = 1, xpd = TRUE, names.arg = data1[,2], col = c("#3CA0D0"), main = "Best Lift Time to Vertical Drop Ratios of North American Resorts", ylab = "Normalized Difference", yaxt = 'n', cex.names = 0.65, cex.lab = 0.65)

98 r graph plot bar-chart axis-labels

6

dplyrを使用して複数の列にまたがる合計

私の質問には、データフレームの複数の列にわたる値を合計し、を使用してこの合計に対応する新しい列を作成することが含まれますdplyr。列のデータエントリはbinary（0,1）です。のsummarise_eachormutate_each関数の行方向のアナログを考えていdplyrます。以下は、データフレームの最小限の例です。 library(dplyr) df=data.frame( x1=c(1,0,0,NA,0,1,1,NA,0,1), x2=c(1,1,NA,1,1,0,NA,NA,0,1), x3=c(0,1,0,1,1,0,NA,NA,0,1), x4=c(1,0,NA,1,0,0,NA,0,0,1), x5=c(1,1,NA,1,1,1,NA,1,0,1)) > df x1 x2 x3 x4 x5 1 1 1 0 1 1 2 0 1 1 0 1 3 0 NA 0 NA NA 4 NA 1 1 1 1 5 0 1 1 0 1 6 1 0 0 0 …

98 r dplyr

17

各グループで最大値の行を選択する方法

各被験者に複数の観測値があるデータセットで、各レコードの最大データ値のみを含むサブセットを取得したいと思います。たとえば、次のデータセットを使用します。 ID <- c(1,1,1,2,2,2,2,3,3) Value <- c(2,3,5,2,5,8,17,3,5) Event <- c(1,1,2,1,2,1,2,2,2) group <- data.frame(Subject=ID, pt=Value, Event=Event) 被験者1、2、および3は、それぞれ5、17、および5の最大のpt値を持っています。最初に各被験者の最大のpt値を見つけてから、この観測値を別のデータフレームに配置するにはどうすればよいですか？結果のデータフレームには、各サブジェクトの最大のpt値のみが含まれている必要があります。

98 r dataframe r-faq

5

Rでの例外処理[終了]

閉まっている。この質問はスタックオーバーフローのガイドラインを満たしていません。現在、回答を受け付けていません。この質問を改善してみませんか？Stack Overflowのトピックとなるように質問を更新します。 4年前休業。この質問を改善する Rでの例外処理の例/チュートリアルはありますか？公式ドキュメントは非常に簡潔です。

97 r exception-handling

7

Rデータファイルから指定した変数名にオブジェクトをロードするにはどうすればよいですか？

を使用してRデータファイルに変数を保存すると、変数はsave、それを保存したセッションで使用されていた名前で保存されます。後で別のセッションからロードするときに、同じ名前でロードされますが、ロードスクリプトではこれを認識できません。この名前は、ロードセッションで同じ名前の既存の変数を上書きする可能性があります。既存の変数を破壊するリスクなしに、データファイルから指定した変数名にオブジェクトを安全にロードする方法はありますか？例：セッションを保存しています： x = 5 save(x, file="x.Rda") ロードセッション： x = 7 load("x.Rda") print(x) # This will print 5. Oops. どのように機能させるか： x = 7 y = load_object_from_file("x.Rda") print(x) # should print 7 print(y) # should print 5

97 r variable-names rdata

3

Rにはpythonのようにassertステートメントがありますか？

何かが真であるかどうかをチェックし、そうでない場合は特定のエラーメッセージを出力して終了するステートメント

97 r assert language-design assertions

6

dplyrを使用してdata.frame内の完全なケースをフィルタリング（ケースごとの削除）

dplyrを使用して完全なケースのdata.frameをフィルタリングすることは可能ですか？complete.casesもちろん、すべての変数のリストが機能します。ただし、これは、a）変数が多数ある場合は冗長であり、b）変数名が不明な場合（たとえば、data.frameを処理する関数内）は不可能です。 library(dplyr) df = data.frame( x1 = c(1,2,3,NA), x2 = c(1,2,NA,5) ) df %.% filter(complete.cases(x1,x2))

97 r dplyr magrittr

4

dplyr要約：出力で長さがゼロのグループを保持するための「.drop = FALSE」と同等

の関数で使用summariseする場合、空のカテゴリはデフォルトで削除されます。この動作を変更するには、を追加します。ただし、これをで使用する場合は機能しません。結果に空のカテゴリを保持する別の方法はありますか？plyrddply.drop = FALSEsummarisedplyr 以下は、偽のデータの例です。 library(dplyr) df = data.frame(a=rep(1:3,4), b=rep(1:2,6)) # Now add an extra level to df$b that has no corresponding value in df$a df$b = factor(df$b, levels=1:3) # Summarise with plyr, keeping categories with a count of zero plyr::ddply(df, "b", summarise, count_a=length(a), .drop=FALSE) b count_a 1 1 6 2 …

97 r dplyr plyr tidyr

5

Rでdata.framesをマージ/結合する最も速い方法は何ですか？

たとえば（ただし、最も代表的な例かどうかはわかりません）： N <- 1e6 d1 <- data.frame(x=sample(N,N), y1=rnorm(N)) d2 <- data.frame(x=sample(N,N), y2=rnorm(N)) これは私がこれまでに得たものです： d <- merge(d1,d2) # 7.6 sec library(plyr) d <- join(d1,d2) # 2.9 sec library(data.table) dt1 <- data.table(d1, key="x") dt2 <- data.table(d2, key="x") d <- data.frame( dt1[dt2,list(x,y1,y2=dt2$y2)] ) # 4.9 sec library(sqldf) sqldf() sqldf("create index ix1 on d1(x)") …

97 performance r join merge data.table

タグ付けされた質問 「r」

タグ付けされた質問「r」