タグ付けされた質問 「r」

Rは、統計コンピューティング、バイオインフォマティクス、視覚化、および一般的なコンピューティングのための無料のオープンソースプログラミング言語およびソフトウェア環境です。必要な出力とともに、最小限の再現可能な例を提供してください。データには `dput()`を使用し、 `library()`呼び出しですべての非ベースパッケージを指定します。データやコードの画像を埋め込まないでください。代わりにインデントされたコードブロックを使用してください。統計関連の質問については、https://stats.stackexchange.comを使用してください。


6
時刻、緯度、経度を指定した太陽の位置
この質問は、3年ちょっと前に尋ねられました。答えがありましたが、解決策に不具合が見つかりました。 以下のコードはRにあります。別の言語に移植しましたが、元のコードをRで直接テストして、移植に問題がないことを確認しました。 sunPosition <- function(year, month, day, hour=12, min=0, sec=0, lat=46.5, long=6.5) { twopi <- 2 * pi deg2rad <- pi / 180 # Get day of the year, e.g. Feb 1 = 32, Mar 1 = 61 on leap years month.days <- c(0,31,28,31,30,31,30,31,31,30,31,30) day <- day + cumsum(month.days)[month] leapdays …

2
igraphのコミュニティ検出アルゴリズムの違いは何ですか?
約700の頂点と3500のエッジを持つ典型的なオブジェクトを含む約100のigraphオブジェクトのリストがあります。 結びつきの可能性が高い頂点のグループを特定したいと思います。次に、混合モデルを使用して、頂点属性とグループ属性を使用して、グループ内のタイの頂点の数を予測する予定です。 私のプロジェクトの他の側面に対応したいと思う人もいるかもしれませんが、私が最も興味を持っているのは、頂点をグループ化するためのigraphの関数に関する情報です。私はこれらのコミュニティ検出アルゴリズムに出くわしましたが、それらの長所と短所、または他の機能が私の場合に適しているかどうかはわかりません。ここにもリンクがありますが、igraphに固有のものではありません。アドバイスをしてくれてありがとう。
83 r  igraph 

4
文字列の一致に基づいて列を選択します-dplyr :: select
たくさんの列を持つデータフレーム(「データ」)があります。一部の列には特定の文字列( "search_string")が含まれています。 dplyr::select()文字列を含む列のみを含むサブセットを取得するにはどうすればよいですか? 私は試した: # columns as boolean vector select(data, grepl("search_string",colnames(data))) # columns as vector of column names names select(data, colnames(data)[grepl("search_string",colnames(data))]) どちらも機能しません。 select()列の代わりに数値ベクトルを受け入れることは知っています。例: select(data,5,7,9:20) しかしID、grepl()式から列の数値ベクトルを取得する方法がわかりません。
83 r  regex  dplyr 

5
変数の動的な数を持つ式
仮定し、そこにいくつかのdata.frameのあるfoo_data_frameと1は、ターゲット列の回帰見つけたいYをいくつかの他の列で。その目的のために、通常、いくつかの式とモデルが使用されます。例えば: linear_model <- lm(Y ~ FACTOR_NAME_1 + FACTOR_NAME_2, foo_data_frame) 式が静的にコーディングされている場合、これはうまく機能します。従属変数の数が一定(たとえば2)の複数のモデルをルート化する必要がある場合は、次のように扱うことができます。 for (i in seq_len(factor_number)) { for (j in seq(i + 1, factor_number)) { linear_model <- lm(Y ~ F1 + F2, list(Y=foo_data_frame$Y, F1=foo_data_frame[[i]], F2=foo_data_frame[[j]])) # linear_model further analyzing... } } 私の質問は、プログラムの実行中に変数の数が動的に変化するときに同じ影響を与える方法です。 for (number_of_factors in seq_len(5)) { # Then root over subsets …
83 r  formula 

1
前の式の結果を変数に割り当てる方法は?
Rのインタラクティブコンソールを使用していて、次のようなことをしたとします。 long_running_command() その長時間実行されるコマンドは値を返しますが、その値を破棄するのではなく、変数に割り当てたいと思ったところです。では、コマンドを再度実行せずにその値を取得するにはどうすればよいですか?このようなコマンドはありますか? result = get_last_return_value()

3
繰り返される値のシーケンスを順番に作成しますか?
繰り返される数字のシーケンスが必要です。つまり、1 1 ... 1 2 2 ... 2 3 3 ... 3 etc.これを実装する方法は次のとおりです。 nyear <- 20 names <- c(rep(1,nyear),rep(2,nyear),rep(3,nyear),rep(4,nyear), rep(5,nyear),rep(6,nyear),rep(7,nyear),rep(8,nyear)) これは機能しますが、不器用で、明らかにうまくスケーリングしません。 N個の整数をそれぞれM回順番に繰り返すにはどうすればよいですか? 私はネスティングしようとしたseq()とrep()それはかなり私が望んでませんでした。 私は明らかにこれを行うためのforループを書くことができますが、これを行うための本質的な方法があるはずです!
83 r  repeat  seq  replicate 

4
dplyrを使用してグループごとに行数をカウントする
mtcarsデータセットを使用しています。特定のデータの組み合わせのレコード数を調べたい。count(*)SQLのgroupby句に非常によく似たもの。plyrddply()から私のために働いています library(plyr) ddply(mtcars, .(cyl,gear),nrow) 出力があります cyl gear V1 1 4 3 1 2 4 4 8 3 4 5 2 4 6 3 2 5 6 4 4 6 6 5 1 7 8 3 12 8 8 5 2 このコードを使用する library(dplyr) g <- group_by(mtcars, cyl, gear) summarise(g, length(gear)) 出力があります …
83 r  dplyr  count  plyr 

4
プロットをオブジェクトに保存する
ではggplot2、グラフィックをRオブジェクトに簡単に保存できます。 p = ggplot(...) + geom_point() # does not display the graph p # displays the graph 標準関数plotは、グラフィックをvoid関数として生成し、NULLを返します。 p = plot(1:10) # displays the graph p # NULL によって作成さplotれたグラフィックをオブジェクトに保存することはできますか?
83 r  plot 

2
Rに組み込まれたモデルの再利用
Rでモデルを作成する場合、新しいデータで再利用できるように、モデルの仕様をどのように保存しますか?履歴データにロジスティック回帰を作成したが、来月まで新しい観測値がない場合を考えてみましょう。最善のアプローチは何ですか? 私が考慮したこと: モデルオブジェクトを保存し、新しいセッションにロードする 一部のモデルはPMMLでエクスポートできることは知っていますが、PMMLのインポートについては実際には何も見ていません。 簡単に言うと、新しいセッションでモデルを使用する必要があるときに、あなたが何をしているのかを理解しようとしています。 前もって感謝します。
82 r  models 

1
リストから複数の要素を選択します
私はRに約10,000要素の長さのリストを持っています。要素5、7、および9のみを選択したいとします。forループなしでそれを行う方法がわかりません。 のようなことをしたいのですが、うまくいきmylist[[c(5,7,9]]ません。私もこのlapply機能を試しましたが、それを機能させることもできませんでした。
82 r  list  subset 

3
RのPythondictに相当
Rでpythondictに相当するものを作りたいです。基本的に、pythonでは次のようになります。 visited = {} if atom_count not in visited: Do stuff visited[atom_count] = 1 アイデアは、その特定のatom_countを見た場合、[atom_count] = 1にアクセスしたことです。したがって、そのatom_countをもう一度見た場合、「DoStuff」は実行しません。Atom_Countは整数です。 ありがとう!
82 python  r  dictionary 

9
すべてのコンソール出力をRのファイルに保存するにはどうすればよいですか?
すべてのコンソールテキストをファイルにリダイレクトしたい。これが私が試したものです: > sink("test.log", type=c("output", "message")) > a <- "a" > a > How come I do not see this in log Error: unexpected symbol in "How come" これが私がtest.logで得たものです: [1] "a" これが私がtest.logに欲しいものです: > a <- "a" > a [1] "a" > How come I do not see this in log Error: …
82 file  r  console  logging 


16
データフレーム内の多くの列のクラスを因数分解から数値に変更します
多数の列を因数分解から数値に変更する最も速い/最良の方法は何ですか? 次のコードを使用しましたが、データが並べ替えられたようです。 > head(stats[,1:2]) rk team 1 1 Washington Capitals* 2 2 San Jose Sharks* 3 3 Chicago Blackhawks* 4 4 Phoenix Coyotes* 5 5 New Jersey Devils* 6 6 Vancouver Canucks* for(i in c(1,3:ncol(stats))) { stats[,i] <- as.numeric(stats[,i]) } > head(stats[,1:2]) rk team 1 2 Washington Capitals* 2 13 …
82 r 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.