プログラミング r

23

Rを使い始めたばかりで、データセットを次のサンプルコードに組み込む方法がわかりません。 sample(x, size, replace = FALSE, prob = NULL) トレーニング（75％）およびテスト（25％）セットに含める必要があるデータセットがあります。xとサイズにどのような情報を入力すればよいかわかりません。xはデータセットファイルであり、サンプルのサイズはいくつですか？

160 r sample

2

ggplotを使用してプロットを作成するとき、hjustとvjustは何をしますか？

ggplotを使用してプロットを作成するたびに、次のような行でhjustとvjustの異なる値を試す間、少し時間を費やします + opts(axis.text.x = theme_text(hjust = 0.5)) 軸ラベルが軸にほぼ接触し、軸に対して同じ高さになるように軸ラベルを揃えます（いわば軸に揃えます）。しかし、何が起こっているのか本当にわかりません。多くの場合、hjust = 0.5たとえばとは劇的に異なる結果が得られるhjust = 0.6ため、さまざまな値を試してみただけではそれを理解できませんでした。 hjustオプションとvjustオプションがどのように機能するかについての包括的な説明を誰かに教えてもらえますか？

159 r plot ggplot2

2

if / while（条件）のエラー{：TRUE / FALSEが必要な場所に値がありません

次のエラーメッセージが表示されました。 Error in if (condition) { : missing value where TRUE/FALSE needed または Error in while (condition) { : missing value where TRUE/FALSE needed それは何を意味し、どうすればそれを防ぐことができますか？

159 r r-faq

8

Rの空のベクトルに値を追加しますか？

Rを習得しようとしているのですが、リストに追加する方法がわかりません。これがPythonだったら私はそうするでしょう。。。 #Python vector = [] values = ['a','b','c','d','e','f','g'] for i in range(0,len(values)): vector.append(values[i]) Rでこれをどのように行うのですか？ #R Programming > vector = c() > values = c('a','b','c','d','e','f','g') > for (i in 1:length(values)) + #append value[i] to empty vector

159 r list vector append

3

複数のベクターから共通の要素を見つける方法は？

複数のベクターから共通の要素を見つける方法を誰かに教えてもらえますか？ a <- c(1,3,5,7,9) b <- c(3,6,8,9,10) c <- c(2,3,4,5,7,9) 上記のベクトルから共通の要素を取得したい（例：3および9）

159 r vector r-faq

11

Rの新しいバージョンをインストールする簡単な方法は？

Andrew Gelmanは最近、Rの簡単なアップグレードプロセスがないことを嘆きました（おそらくLinuxよりもWindowsのほうが適切です）。ソフトウェアのインストールからすべての設定/パッケージのコピーまで、アップグレードを行うための良いトリックはありますか？この提案はコメントに含まれており、私が最近使用しているものです。最初に新しいバージョンをインストールしてから、古いバージョンでこれを実行します。 #--run in the old version of R setwd("C:/Temp/") packages <- installed.packages()[,"Package"] save(packages, file="Rpackages") 新しいバージョンではこれが続きます： #--run in the new version setwd("C:/Temp/") load("Rpackages") for (p in setdiff(packages, installed.packages()[,"Package"])) install.packages(p)

158 r upgrade packages

5

特定の順序のベクトルに従ってデータフレーム行を順序付け

以下の短い例で実装したもののように、「ターゲット」ベクトルに従ってデータフレームの行が確実に順序付けられるようにする簡単な方法はありますか？ df <- data.frame(name = letters[1:4], value = c(rep(TRUE, 2), rep(FALSE, 2))) df # name value # 1 a TRUE # 2 b TRUE # 3 c FALSE # 4 d FALSE target <- c("b", "c", "a", "d") これはどういうわけか、仕事を成し遂げるには少し複雑すぎるようです： idx <- sapply(target, function(x) { which(df$name == x) }) df <- …

158 r sorting dataframe

9

文字列ベクトル入力を使用して、dplyrの複数の列でグループ化

私はplyrの理解をdplyrに変換しようとしていますが、複数の列でグループ化する方法がわかりません。 # make data with weird column names that can't be hard coded data = data.frame( asihckhdoydkhxiydfgfTgdsx = sample(LETTERS[1:3], 100, replace=TRUE), a30mvxigxkghc5cdsvxvyv0ja = sample(LETTERS[1:3], 100, replace=TRUE), value = rnorm(100) ) # get the columns we want to average within columns = names(data)[-3] # plyr - works ddply(data, columns, summarize, value=mean(value)) …

157 r dplyr r-faq

5

Rの回転軸ラベル

Rでは、（棒）プロットのy軸ラベルをY軸に平行ではなくX軸に平行にするにはどうすればよいですか？

156 r label axis plot

2

フルファイルパスからファイル名を検索

文字列を操作する手間をかけずに、ファイルのフルパス（ファイルパスの一部）からファイル名を抽出する方法はありますか？ Javaで同等のものは次のようになります。 File f = new File ("C:/some_dir/a") f.getName() //output a f.getFullAbsolutePath() //output c:/some_dir/a

156 file r path

13

ソロデータアナリストのRおよびバージョン管理

私が尊敬している多くのデータアナリストは、バージョン管理を使用しています。例えば： http://github.com/hadley/ http://permut.wordpress.com/2010/04/21/revision-control-statistics-bleg/のコメントを参照してくださいただし、gitなどのバージョン管理システムを採用する価値があるかどうかを評価しています。簡単な概要：私はRを使用して研究出版物のデータを分析する社会科学者です。現在、Rパッケージを作成していません。プロジェクトの私のRコードには、通常、データ入力、クリーニング、操作、分析、および出力生成のための数千行のコードが含まれています。出版物は通常、LaTeXを使用して作成されます。バージョン管理に関しては、私が読んだ多くの利点がありますが、それらはソロデータアナリストにはあまり関係がないようです。バックアップ：すでにバックアップシステムを導入しています。フォークと巻き戻し：これを行う必要性を感じたことはありませんが、どのように役立つかはわかります（たとえば、同じデータセットに基づいて複数のジャーナル記事を準備している、毎月更新されるレポートを準備している、など））コラボレーション：ほとんどの場合、自分でデータを分析しているため、バージョン管理によるコラボレーションのメリットは得られません。バージョン管理の採用には、いくつかの潜在的なコストも伴います。バージョン管理システムを評価および学習する時間現在のファイル管理システムよりも複雑さが増す可能性しかし、私はまだ何かが足りない気がします。バージョン管理に関する一般的なガイドは、データアナリストよりもコンピュータサイエンティストに向けられているようです。したがって、具体的には、上記と同様の状況のデータアナリストに関連して、バージョン管理は努力する価値がありますか？バージョン管理を採用する主な長所と短所は何ですか？ Rを使用したデータ分析のバージョン管理を開始するための適切な戦略は何ですか（例、ワークフローのアイデア、ソフトウェア、ガイドへのリンク）。

155 git version-control r

9

論理条件でdata.frame行をフィルタリングする

data.frame論理条件に基づいてから行をフィルタリングします。私のようなデータフレームがあるとしましょう expr_value cell_type 1 5.345618 bj fibroblast 2 5.195871 bj fibroblast 3 5.247274 bj fibroblast 4 5.929771 hesc 5 5.873096 hesc 6 5.665857 hesc 7 6.791656 hips 8 7.133673 hips 9 7.574058 hips 10 7.208041 hips 11 7.402100 hips 12 7.167792 hips 13 7.156971 hips 14 7.197543 hips 15 7.035404 …

155 r subset dataframe

2

write.csvの使用時に行名がファイルに書き込まれないようにする

コマンド： t <- data.frame(v = 5:1, v2 = 9:5) write.csv(t, "t.csv") 結果のファイル： # "","v","v2" # "1",5,9 # "2",4,8 # "3",3,7 # "4",2,6 # "5",1,5 行インデックスを持つ最初の列がファイルに書き込まれないようにするにはどうすればよいですか？

154 r csv

4

XMLパッケージを使用してHTMLテーブルをRデータフレームにスクレイピングする

XMLパッケージを使用してHTMLテーブルをスクレイピングするにはどうすればよいですか？たとえば、ブラジルのサッカーチームに関するこのWikipediaのページを見てください。私はそれをRで読み、「ブラジルがFIFA認定チームと対戦したすべての試合のリスト」表をdata.frameとして取得したいと考えています。これどうやってするの？

153 html r xml parsing web-scraping

5

プロット軸の値を削除します

Rプロットグラフで、x軸またはy軸のいずれかの軸の値を取り除く方法があるかどうかだけを考えていました。私はそれaxes = falseが軸全体を取り除くことを知っていますが、私は番号付けを取り除きたいと思います。

153 r plot axis-labels

タグ付けされた質問 「r」

タグ付けされた質問「r」