タグ付けされた質問 「r」

Rは、統計コンピューティング、バイオインフォマティクス、視覚化、および一般的なコンピューティングのための無料のオープンソースプログラミング言語およびソフトウェア環境です。必要な出力とともに、最小限の再現可能な例を提供してください。データには `dput()`を使用し、 `library()`呼び出しですべての非ベースパッケージを指定します。データやコードの画像を埋め込まないでください。代わりにインデントされたコードブロックを使用してください。統計関連の質問については、https://stats.stackexchange.comを使用してください。

23
サンプル関数を使用してデータをトレーニング/テストセットに分割する方法
Rを使い始めたばかりで、データセットを次のサンプルコードに組み込む方法がわかりません。 sample(x, size, replace = FALSE, prob = NULL) トレーニング(75%)およびテスト(25%)セットに含める必要があるデータセットがあります。xとサイズにどのような情報を入力すればよいかわかりません。xはデータセットファイルであり、サンプルのサイズはいくつですか?
160 r  sample 

2
ggplotを使用してプロットを作成するとき、hjustとvjustは何をしますか?
ggplotを使用してプロットを作成するたびに、次のような行でhjustとvjustの異なる値を試す間、少し時間を費やします + opts(axis.text.x = theme_text(hjust = 0.5)) 軸ラベルが軸にほぼ接触し、軸に対して同じ高さになるように軸ラベルを揃えます(いわば軸に揃えます)。しかし、何が起こっているのか本当にわかりません。多くの場合、hjust = 0.5たとえばとは劇的に異なる結果が得られるhjust = 0.6ため、さまざまな値を試してみただけではそれを理解できませんでした。 hjustオプションとvjustオプションがどのように機能するかについての包括的な説明を誰かに教えてもらえますか?
159 r  plot  ggplot2 


8
Rの空のベクトルに値を追加しますか?
Rを習得しようとしているのですが、リストに追加する方法がわかりません。 これがPythonだったら私はそうするでしょう。。。 #Python vector = [] values = ['a','b','c','d','e','f','g'] for i in range(0,len(values)): vector.append(values[i]) Rでこれをどのように行うのですか? #R Programming > vector = c() > values = c('a','b','c','d','e','f','g') > for (i in 1:length(values)) + #append value[i] to empty vector
159 r  list  vector  append 


11
Rの新しいバージョンをインストールする簡単な方法は?
Andrew Gelmanは最近、Rの簡単なアップグレードプロセスがないことを嘆きました(おそらくLinuxよりもWindowsのほうが適切です)。ソフトウェアのインストールからすべての設定/パッケージのコピーまで、アップグレードを行うための良いトリックはありますか? この提案はコメントに含まれており、私が最近使用しているものです。最初に新しいバージョンをインストールしてから、古いバージョンでこれを実行します。 #--run in the old version of R setwd("C:/Temp/") packages <- installed.packages()[,"Package"] save(packages, file="Rpackages") 新しいバージョンではこれが続きます: #--run in the new version setwd("C:/Temp/") load("Rpackages") for (p in setdiff(packages, installed.packages()[,"Package"])) install.packages(p)
158 r  upgrade  packages 

5
特定の順序のベクトルに従ってデータフレーム行を順序付け
以下の短い例で実装したもののように、「ターゲット」ベクトルに従ってデータフレームの行が確実に順序付けられるようにする簡単な方法はありますか? df <- data.frame(name = letters[1:4], value = c(rep(TRUE, 2), rep(FALSE, 2))) df # name value # 1 a TRUE # 2 b TRUE # 3 c FALSE # 4 d FALSE target <- c("b", "c", "a", "d") これはどういうわけか、仕事を成し遂げるには少し複雑すぎるようです: idx <- sapply(target, function(x) { which(df$name == x) }) df <- …
158 r  sorting  dataframe 

9
文字列ベクトル入力を使用して、dplyrの複数の列でグループ化
私はplyrの理解をdplyrに変換しようとしていますが、複数の列でグループ化する方法がわかりません。 # make data with weird column names that can't be hard coded data = data.frame( asihckhdoydkhxiydfgfTgdsx = sample(LETTERS[1:3], 100, replace=TRUE), a30mvxigxkghc5cdsvxvyv0ja = sample(LETTERS[1:3], 100, replace=TRUE), value = rnorm(100) ) # get the columns we want to average within columns = names(data)[-3] # plyr - works ddply(data, columns, summarize, value=mean(value)) …
157 r  dplyr  r-faq 

5
Rの回転軸ラベル
Rでは、(棒)プロットのy軸ラベルをY軸に平行ではなくX軸に平行にするにはどうすればよいですか?
156 r  label  axis  plot 

2
フルファイルパスからファイル名を検索
文字列を操作する手間をかけずに、ファイルのフルパス(ファイルパスの一部)からファイル名を抽出する方法はありますか? Javaで同等のものは次のようになります。 File f = new File ("C:/some_dir/a") f.getName() //output a f.getFullAbsolutePath() //output c:/some_dir/a
156 file  r  path 

13
ソロデータアナリストのRおよびバージョン管理
私が尊敬している多くのデータアナリストは、バージョン管理を使用しています。例えば: http://github.com/hadley/ http://permut.wordpress.com/2010/04/21/revision-control-statistics-bleg/のコメントを参照してください ただし、gitなどのバージョン管理システムを採用する価値があるかどうかを評価しています。 簡単な概要: 私はRを使用して研究出版物のデータを分析する社会科学者です。現在、Rパッケージを作成していません。プロジェクトの私のRコードには、通常、データ入力、クリーニング、操作、分析、および出力生成のための数千行のコードが含まれています。出版物は通常、LaTeXを使用して作成されます。 バージョン管理に関しては、私が読んだ多くの利点がありますが、それらはソロデータアナリストにはあまり関係がないようです。 バックアップ:すでにバックアップシステムを導入しています。 フォークと巻き戻し:これを行う必要性を感じたことはありませんが、どのように役立つかはわかります(たとえば、同じデータセットに基づいて複数のジャーナル記事を準備している、毎月更新されるレポートを準備している、など) ) コラボレーション:ほとんどの場合、自分でデータを分析しているため、バージョン管理によるコラボレーションのメリットは得られません。 バージョン管理の採用には、いくつかの潜在的なコストも伴います。 バージョン管理システムを評価および学習する時間 現在のファイル管理システムよりも複雑さが増す可能性 しかし、私はまだ何かが足りない気がします。バージョン管理に関する一般的なガイドは、データアナリストよりもコンピュータサイエンティストに向けられているようです。 したがって、具体的には、上記と同様の状況のデータアナリストに関連して、 バージョン管理は努力する価値がありますか? バージョン管理を採用する主な長所と短所は何ですか? Rを使用したデータ分析のバージョン管理を開始するための適切な戦略は何ですか(例、ワークフローのアイデア、ソフトウェア、ガイドへのリンク)。
155 git  version-control  r 

9
論理条件でdata.frame行をフィルタリングする
data.frame論理条件に基づいてから行をフィルタリングします。私のようなデータフレームがあるとしましょう expr_value cell_type 1 5.345618 bj fibroblast 2 5.195871 bj fibroblast 3 5.247274 bj fibroblast 4 5.929771 hesc 5 5.873096 hesc 6 5.665857 hesc 7 6.791656 hips 8 7.133673 hips 9 7.574058 hips 10 7.208041 hips 11 7.402100 hips 12 7.167792 hips 13 7.156971 hips 14 7.197543 hips 15 7.035404 …
155 r  subset  dataframe 


4
XMLパッケージを使用してHTMLテーブルをRデータフレームにスクレイピングする
XMLパッケージを使用してHTMLテーブルをスクレイピングするにはどうすればよいですか? たとえば、ブラジルのサッカーチームに関するこのWikipediaのページを見てください。私はそれをRで読み、「ブラジルがFIFA認定チームと対戦したすべての試合のリスト」表をdata.frameとして取得したいと考えています。これどうやってするの?
153 html  r  xml  parsing  web-scraping 

5
プロット軸の値を削除します
Rプロットグラフで、x軸またはy軸のいずれかの軸の値を取り除く方法があるかどうかだけを考えていました。 私はそれaxes = falseが軸全体を取り除くことを知っていますが、私は番号付けを取り除きたいと思います。
153 r  plot  axis-labels 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.