プログラミング r

9

しばらく前に、Rコアチーム（私は信じています）からSimon Urbanekに、ユーザーにreturn関数の最後に明示的に呼び出すよう勧めることで非難されました（ただし、彼のコメントは削除されました）。 foo = function() { return(value) } 代わりに彼は推奨しました： foo = function() { value } おそらくこのような状況ではそれが必要です： foo = function() { if(a) { return(a) } else { return(b) } } 彼のコメントreturnは、厳密に必要とされない限り電話をかけないことがなぜ良いのかについていくつかの光を投げかけましたが、これは削除されました。私の質問は次のとおりです。なぜreturn、より速く、またはよりよく電話をかけないので、望ましいのですか？

199 r

7

Rの同じ行に文字列と変数の内容を出力する

テキストと変数の内容を同じ行に印刷する方法はありますか？例えば、 wd <- getwd() print("Current working dir: ", wd) これを可能にする構文については何も見つかりませんでした。

198 r printing

4

R-マークダウンでパッケージの読み込みメッセージを回避

私はR-Studioを介してKnitrを使用してきましたが、それはかなりすっきりしていると思います。ちょっとした問題があります。R-Chunkでファイルをソースすると、knitrの出力に次のような外部コメントが含まれます。 + FALSE Loading required package: ggplot2 + FALSE Loading required package: gridExtra + FALSE Loading required package: grid + FALSE Loading required package: VGAM + FALSE Loading required package: splines + FALSE Loading required package: stats4 + FALSE Attaching package: 'VGAM' + FALSE The following object(s) are masked from …

197 r markdown knitr rstudio r-markdown

8

data.tableの名前で列をどのように削除しますか？

で「foo」という名前の列を削除するにはdata.frame、次のようにします。 df <- df[-grep('foo', colnames(df))] ただし、いったんオブジェクトにdf変換されるとdata.table、列を削除するだけの方法はありません。例： df <- data.frame(id = 1:100, foo = rnorm(100)) df2 <- df[-grep('foo', colnames(df))] # works df3 <- data.table(df) df3[-grep('foo', colnames(df3))] しかし、いったんdata.tableオブジェクトに変換されると、これは機能しなくなります。

194 r data.table

9

Rのループ演算を高速化する

Rに大きなパフォーマンスの問題がありdata.frameます。オブジェクトを反復処理する関数を作成しました。それは単に新しい列をdata.frame何かを蓄積します。（簡単操作）。にdata.frameはおよそ850K行あります。私のPCはまだ動作しており（現在は約10時間）、ランタイムについて何も知りません。 dayloop2 <- function(temp){ for (i in 1:nrow(temp)){ temp[i,10] <- i if (i > 1) { if ((temp[i,6] == temp[i-1,6]) & (temp[i,3] == temp[i-1,3])) { temp[i,10] <- temp[i,9] + temp[i-1,10] } else { temp[i,10] <- temp[i,9] } } else { temp[i,10] <- temp[i,9] } } names(temp)[names(temp) == "V10"] <- "Kumm." …

193 performance r loops rcpp r-faq

2

data.tableが別のdata.tableの（対コピー）への参照であるときを正確に理解する

の参照渡しプロパティを理解するのに少し問題がありdata.tableます。いくつかの操作は参照を「壊す」ようであり、私は何が起こっているのかを正確に理解したいと思います。 data.table別のからを作成するとdata.table（を介し<-て新しいテーブルをで更新する:=と、元のテーブルも変更されます。これは、次のように予想されます。 ?data.table::copy およびstackoverflow：pass-by-reference-the-operator-in-the-data-table-package 次に例を示します。 library(data.table) DT <- data.table(a=c(1,2), b=c(11,12)) print(DT) # a b # [1,] 1 11 # [2,] 2 12 newDT <- DT # reference, not copy newDT[1, a := 100] # modify new DT print(DT) # DT is modified too. # a b # [1,] 100 11 …

193 r reference copy data.table assignment-operator

5

チブルのすべての行を表示/印刷します（tbl_df）

tibble（以前はtbl_df）は、dplyrRのデータフレーム操作パッケージによって作成されたデータフレームのバージョンです。誤ってデータフレームを呼び出したときに、長いテーブル出力を防ぎます。データフレームがtibble/ tbl_dfでラップされた後、データフレーム全体（データフレームのすべての行と列）を表示するコマンドはありますか？を使用するdf[1:100,]と100行すべてが表示されますが、を使用df[1:101,]すると最初の10行しか表示されません。すべての行を簡単に表示して、すばやくスクロールしたい。これを打ち消すdplyrコマンド、またはデータフレームのラップを解除する方法はありますか？

192 r dplyr options display

7

ベクトルからNA値を削除する

いくつかのNA値を持つ巨大なベクトルがあり、そのベクトルの最大値（ベクトルはすべて数値です）を見つけようとしていますが、NA値が原因でこれを行うことができません。 NA最大値を計算できるように値を削除するにはどうすればよいですか？

191 r max min na missing-data

4

ggplot2のデフォルトのカラーパレットをエミュレートする

ggplot2のデフォルトのカラーパレットを目的の色数でエミュレートするために使用できる関数は何ですか。たとえば、3を入力すると、次の色を持つHEX色の文字ベクトルが生成されます。

191 r ggplot2

10

データフレームから数値列のみを選択する

次のようなdata.frameがあるとします。 x <- data.frame(v1=1:20,v2=1:20,v3=1:20,v4=letters[1:20]) xで数値である列のみをどのように選択しますか？

189 r

5

軸ティックの数を増やす

一部のデータのプロットを生成していますが、目盛りの数が少なすぎるため、読み取り精度を上げる必要があります。 ggplot2の軸目盛りの数を増やす方法はありますか？軸ティックとしてベクトルを使用するようにggplotに指示できることは知っていますが、すべてのデータについて、ティックの数を増やしたいです。つまり、データからティック数を計算したいのです。おそらくggplotはこれを内部的にいくつかのアルゴリズムで実行しますが、それがどのように行われるかを見つけることができず、必要に応じて変更します。

188 r ggplot2

7

ggplot2のAxesテキストのフォントサイズと方向の変更

x軸にカテゴリ変数、y軸に数値変数を使用してグラフをプロットしています。 x軸の場合、データポイントが多数あるとすると、デフォルトのテキスト形式では、各目盛りのラベルが他のラベルと重なってしまいます。（a）軸テキストのフォントサイズを変更し、（b）テキストが軸に垂直になるようにテキストの向きを変更するにはどうすればよいですか？

188 r ggplot2

4

特定の文字列を含む行をフィルタリングする

文字列が含まれている行を基準としてデータフレームをフィルター処理する必要がありますRTB。私は使用していdplyrます。 d.del <- df %.% group_by(TrackingPixel) %.% summarise(MonthDelivery = as.integer(sum(Revenue))) %.% arrange(desc(MonthDelivery)) で関数filterを使用できることはわかっdplyrていますが、文字列の内容をチェックするように指示する方法を正確には示していません。特にコラムの内容を確認したいTrackingPixel。文字列にラベルが含まれている場合、RTB結果から行を削除します。

188 r filter dplyr

2

Rプログラミング言語での〜（チルド）の使用

私は次のコマンドをモデル化する回帰についてのチュートリアルで見ました： myFormula <- Species ~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width このコマンドは正確には何をし~ますか？また、コマンドでの（チルダ）の役割は何ですか？

187 r r-faq

14

統計分析とレポート作成のワークフロー

カスタムレポートの作成に関連するデータ分析のワークフローについて、知識はありますか？ユースケースは基本的にこれです：クライアントは、データ分析を使用するレポートを委託します。たとえば、水区の人口推定や関連マップなどです。アナリストは一部のデータをダウンロードし、データを変更して結果を保存します（たとえば、単位あたりの人口の列を追加したり、地区の境界に基づいてデータをサブセット化したりします）。アナリストは、（2）で作成されたデータを分析し、彼女の目標に近づきますが、さらに多くのデータが必要であるため、（1）に戻ります。テーブルとグラフィックスがQA / QCを満たし、クライアントを満足させるまで繰り返します。表とグラフィックを組み込んだレポートを作成します。来年、幸せなクライアントが戻ってきて、更新を求めています。これは、仕様が変更されない限り、新しいダウンロード（たとえば、昨年の建築許可の取得）によってアップストリームデータを更新し、[RECALCULATE]ボタンを押すのと同じくらい簡単なはずです。現時点では、ディレクトリを作成して、できる限りその場限りで作成します。もっと体系的なアプローチが欲しいので、誰かがこれを理解してくれることを願っています...私は、スプレッドシート、SQL、ARCGIS、R、およびUnixツールを組み合わせて使用しています。ありがとう！ PS：以下は、さまざまな中間データセット（.RDataサフィックス付き）とスクリプト（.Rサフィックス）の依存関係をチェックする基本的なMakefileです。Makeはタイムスタンプを使用して依存関係をチェックします。そのためtouch ss07por.csv、このファイルが依存しているすべてのファイル/ターゲットよりも新しいことがわかり、指定されたスクリプトを実行してそれらを適宜更新します。これは、SQLデータベースに入れるステップや、sweaveなどのテンプレート言語のステップを含む、まだ進行中の作業です。Makeは構文がタブに依存していることに注意してください。したがって、カットアンドペーストする前にマニュアルをお読みください。楽しんでフィードバックしてください！ http://www.gnu.org/software/make/manual/html_node/index.html#Top R = / home / wsprague / R-2.9.2 / bin / R persondata.RData：ImportData.R ../../DATA/ss07por.csv Functions.R $ R --slave -f ImportData.R persondata.Munged.RData：MungeData.R persondata.RData Functions.R $ R --slave -f MungeData.R report.txt：TabulateAndGraph.R persondata.Munged.RData Functions.R $ R --slave -f …

186 r statistics data-visualization

タグ付けされた質問 「r」

タグ付けされた質問「r」