プログラミング r

12

文字列から数値を抽出しようとしています。そして[0-9]+、文字列に対して何かをして"aaa12xxx"、取得し"12"ます。私はそれが次のようなものになると思いました： > grep("[0-9]+", "aaa12xxx", value=TRUE) [1] "aaa12xxx" そして、私は考えました... > sub("[0-9]+", "\\1", "aaa12xxx") [1] "aaaxxx" しかし、私はいくつかの形の応答をしました： > sub("[0-9]+", "ARGH!", "aaa12xxx") [1] "aaaARGH!xxx" 私が見逃している小さな詳細があります。

111 regex r

14

plot.new（）のエラー：Rの余白が大きすぎます

私はRを使い始めたばかりですが、小さいデータセットで多数の相関プロットを作成しました。しかし、大きなデータセット（2 GB以上）をプロットしようとすると、うまくプロットを作成できますが、凡例が表示されません。何かアドバイス？または代替？ library(gplots) r.cor <- cor(r) layout(matrix(c(1,1,1,1,1,1,1,1,2,2), 5, 2, byrow = TRUE)) par(oma=c(5,7,1,1)) cx <- rev(colorpanel(25,"yellow","black","blue")) leg <- seq(min(r.cor,na.rm=T),max(r.cor,na.rm=T),length=10) image(r.cor,main="Correlation plot Normal/Tumor data",axes=F,col=cx) axis(1, at=seq(0,1,length=ncol(r.cor)), labels=dimnames(r.cor)[[2]], cex.axis=0.9,las=2) axis(2,at=seq(0,1,length=ncol(r.cor)), labels=dimnames(r.cor)[[2]], cex.axis=0.9,las=2) image(as.matrix(leg),col=cx,axes=T) エラーplot.new()：図の余白が大きすぎます tmp <- round(leg,2) axis(1,at=seq(0,1,length=length(leg)), labels=tmp,cex.axis=1)

111 r plot

1

xtableを使用するときにdata.frame行名を削除する

わかりました、これは少しきつい（確かに「愚かな」）と認めますが、それも非常に簡単だと思います。私はレポートを書いていて、xtableLaTeXテーブルの生成にパッケージを使用したいと思います（memiscパッケージが機能することに注意してください。ただし、これはでのみ行いたいと言っていますxtable）。標準のmtcarsデータセットとreshapeパッケージを使用してみましょう： mdtf <- melt(mtcars, id.vars = c("am", "cyl"), measure.vars = c("mpg", "hp", "wt")) ( res <- cast(mdtf, am + cyl ~ variable, mean) ) am cyl mpg hp wt 1 0 4 22.90000 84.66667 2.935000 2 0 6 19.12500 115.25000 3.388750 3 0 8 15.05000 194.16667 4.104083 4 1 …

111 r latex report

1

dplyrは複数の列または複合キーで結合できますか？

dplyrv3.0では、さまざまな変数を結合できることがわかりました。 left_join(x, y, by = c("a" = "b")に一致x.aしますy.b しかし、変数の組み合わせで結合することは可能ですか、または事前に複合キーを追加する必要がありますか？このようなもの： left_join(x, y, by = c("a c" = "b d")連結【一致するx.aとx.cする]を[ y.bかつy.d]

111 r dplyr

7

省略された軸ラベルのプロットを停止するようにRに強制します-たとえば、ggplot2の1e + 00

ggplot2で、軸ラベルが省略されるのをどのように停止できますか-たとえば1e+00, 1e+01、一度プロットされたx軸に沿って？理想的には、Rにこの場合はとなる実際の値を表示させます1,10。どんな助けも大歓迎です。

111 r graph ggplot2 axes

5

ggplotの凡例タイトルを削除

で凡例のタイトルを削除しようとしていggplot2ます： df <- data.frame( g = rep(letters[1:2], 5), x = rnorm(10), y = rnorm(10) ) library(ggplot2) ggplot(df, aes(x, y, colour=g)) + geom_line(stat="identity") + theme(legend.position="bottom") 私はこの質問を見ましたが、そこにある解決策のどれも私にはうまくいかないようです。ほとんどは、opts非推奨の方法とtheme代わりに使用する方法についてエラーを出します。私ものさまざまなバージョンを試してみたtheme(legend.title=NULL)、theme(legend.title="")、theme(legend.title=element_blank)、などの一般的なエラーメッセージは、次のとおりです。 'opts' is deprecated. Use 'theme' instead. (Deprecated; last used in version 0.9.1) 'theme_blank' is deprecated. Use 'element_blank' instead. (Deprecated; last used in version 0.9.1) ggplot2バージョン0.9.3がリリースされて以来初めて使用していますが、一部の変更をナビゲートするのが難しいと感じています...

111 r ggplot2

3

Rで2つのリストを組み合わせる方法

2つのリストがあります。 l1 = list(2, 3) l2 = list(4) 3番目のリストが欲しい： list(2, 3, 4). どうすれば簡単にできますか。私はforループでそれを行うことができますが、ワンライナーの答え、またはおそらく組み込みメソッドを期待しています。：実は、私はリストを持っている list(list(2, 3), list(2, 4), list(3, 5), list(3, 7), list(5, 6), list(5, 7), list(6, 7)). 上で計算した後list(2, 3)とlist(2, 4)、私が欲しいです、list(2, 3, 4)。

111 r list

7

「添え字の小さい要素」を含むすべての重複行の検索

R duplicatedは、ベクトルまたはデータフレームの各要素が、添え字の小さい要素の複製かどうかを示すベクトルを返します。したがって、5行のデータフレームの行3、4、および5が同じであるduplicated場合、ベクトルを取得します FALSE, FALSE, FALSE, TRUE, TRUE しかし、この場合、私は実際に取得したい FALSE, FALSE, TRUE, TRUE, TRUE つまり、添え字の大きい行によって行が重複しているかどうかを知りたいのです。

111 r duplicates r-faq

1

dplyrメッセージ `summarise（）`の再グループ化出力を 'x'で解釈する方法（ `.groups`引数でオーバーライド）？

dplyr開発バージョン0.8.99.9003に更新した後、group_byとsummarise（）を実行すると、新しいメッセージ（投稿のタイトルを参照）が表示され始めました。出力を再作成する例を次に示します。 library(tidyverse) library(hablar) df <- read_csv("year, week, rat_house_females, rat_house_males, mouse_wild_females, mouse_wild_males 2018,10,1,1,1,1 2018,10,1,1,1,1 2018,11,2,2,2,2 2018,11,2,2,2,2 2019,10,3,3,3,3 2019,10,3,3,3,3 2019,11,4,4,4,4 2019,11,4,4,4,4") %>% convert(chr(year,week)) %>% mutate(total_rodents = rowSums(select_if(., is.numeric))) %>% convert(num(year,week)) %>% group_by(year,week) %>% summarise(average = mean(total_rodents)) 出力ティブルは正しいですが、次のメッセージが表示されます。 summarise()'年'による出力の再グループ化（.groups引数でオーバーライド）これはどのように解釈されるべきですか？年と週の両方でグループ化したときに、「年」のみで再グループ化が報告されるのはなぜですか？また、オーバーライドするとはどういう意味ですか？なぜそれをやりたいのですか？このメッセージはdplyrビネット全体に表示されるため、問題を示しているとは思いません：https：//cran.r-project.org/web/packages/dplyr/vignettes/programming.html dplyrを使用してpairwise.wilcox.testの出力を溶かす方法などのごく最近のSOの質問にのみ表示されているため、これは新しいメッセージだと思います。およびR複数の列に集約します（どちらも再グループ化/オーバーライドメッセージに対応していません）。ありがとうございました！

111 r dplyr summarize

1

RにCSVファイルをインポートするにはどうすればよいですか？[閉まっている]

ここで何が尋ねられているのかを知るのは難しい。この質問は、あいまいで、あいまいで、不完全で、過度に広い、または修辞的であり、現在の形では合理的に回答することができません。再開できるようにこの質問を明確にするヘルプについては、ヘルプセンターにアクセスしてください。 7年前休業。 .csvワークステーションにファイルがあります。そのファイルをRで開いて統計計算を行うにはどうすればよいですか？

110 r csv import

3

Rでの印刷出力の10進桁数の制御

Rには、桁の表示を制御するためのオプションがあります。例えば： options(digits=10) Rセッション終了までの計算結果を10桁で表示することになっています。Rのヘルプファイルでは、digitsパラメータの定義は次のとおりです。桁数：数値を印刷するときに印刷する桁数を制御します。これは単なる提案です。有効な値は1 ... 22デフォルトで7 したがって、これは単なる提案であると述べています。多かれ少なかれ常に10桁を表示したい場合はどうなりますか？ 2つ目の質問は、22桁を超える数値を表示したい場合、つまり100桁のようなより正確な計算を行う場合はどうなりますか？ベースRで可能ですか、それとも追加のパッケージ/機能が必要ですか？編集： jmoyの提案のおかげで、私は試してみsprintf("%.100f",pi)ました [1] "3.1415926535897931159979634685441851615905761718750000000000000000000000000000000000000000000000000000" 小数点以下48桁です。これはRが処理できる最大制限ですか？

110 r precision digits r-faq output-formatting

17

rgdalパッケージのインストール

ここでの問題は、Rを介してマップをプロットする方法ではなく、ここでかなり良い例を見つけたのではなく、それを機能させる方法です。実際、私はライブラリをロードできませんrgdal： library(rgdal) Error in library(rgdal) : there is no package called ‘rgdal’ しかし、上記のパッケージを手動でインストールしようとすると、次のエラーが発生します。 .... configure: error: proj_api.h not found in standard or given locations. ERROR: configuration failed for package ‘rgdal’ * removing ‘/home/eualin/R/i686-pc-linux-gnu-library/2.15/rgdal’ Warning in install.packages : installation of package ‘/home/eualin/Downloads/rgdal_0.8-5.tar.gz’ had non-zero exit status 任意の入力を歓迎します！

110 r maps

9

Rで変数を命名するための好ましいスタイルは何ですか？[閉まっている]

休業。この質問は意見に基づいています。現在、回答を受け付けていません。この質問を改善してみませんか？この投稿を編集して、事実と引用で回答できるように質問を更新してください。 4年前休業。この質問を改善する変数と関数の命名規則として、Rコードではどの規則を使用しますか？私の知る限りでは、いくつかの異なる規則があり、それらはすべて不協和音で共存します。 1.ピリオドセパレータの使用、例えば stock.prices <- c(12.01, 10.12) col.names <- c('symbol','price') 長所： Rコミュニティで歴史的な優先順位があり、Rコア全体に普及しており、GoogleのRスタイルガイドで推奨されています。短所：オブジェクト指向の意味合いで溢れ、R初心者を混乱させる 2.アンダースコアの使用 stock_prices <- c(12.01, 10.12) col_names <- c('symbol','price') 長所：多くのプログラミング言語で共通の規則。Hadley WickhamのStyle Guideに支持され、ggplot2およびplyrパッケージで使用されています。短所： Rプログラマーがこれまで使用していない。Emacs-Speaks-Statistics（「ess-toggle-underscore」で変更可能）の「<-」演算子にうっとうしくマッピングされます。 3.混合大文字の使用（camelCase） stockPrices <- c(12.01, 10.12) colNames <- c('symbol','price') 長所：いくつかの言語コミュニティで広く採用されているようです。短所：最近の前例がありますが、（Rベースまたはそのドキュメントで）歴史的に使用されていません。最後に、それが十分に混乱していないかのように、Googleスタイルガイドは変数のドット表記を主張しているが、関数の大文字の混在は主張していることを指摘する必要があります。 Rパッケージ全体で一貫したスタイルがないことは、いくつかのレベルで問題があります。開発者の観点からすると、他のコードの保守と拡張が困難になります（特に、スタイルが自分のコードと一致しない場合）。Rユーザーの観点から見ると、一貫性のない構文は、概念の表現方法を増やすことで、Rの学習曲線を急勾配にします（たとえば、日付キャスト関数としてasDate（）、as.date（）、またはas_date（）ですか？いいえ、そうです。日付（））。

110 r coding-style naming-conventions

5

<マイコード>のエラー：タイプ「クロージャー」のオブジェクトはサブセット化できません

ようやく、こすり落とすためのコードを作成することができました。正常に動作しているように見え、突然再度実行すると、次のエラーメッセージが表示されました。 Error in url[i] = paste("http://en.wikipedia.org/wiki/", gsub(" ", "_", : object of type 'closure' is not subsettable コードで何も変更していないので、なぜかわかりません。お知らせ下さい。 library(XML) library(plyr) names <- c("George Clooney", "Kevin Costner", "George Bush", "Amar Shanghavi") for(i in 1:length(names)) { url[i] = paste('http://en.wikipedia.org/wiki/', gsub(" ","_", names[i]) , sep="") # some parsing code }

110 r r-faq

10

行列を1次元配列に変換する

マトリックス（32X48）があります。行列を1次元配列に変換するにはどうすればよいですか？

110 arrays r matrix

タグ付けされた質問 「r」

タグ付けされた質問「r」