プログラミング r

8

data.tableの使用に問題があります：列クラスを変換するにはどうすればよいですか？簡単な例を次に示します。data.frameを使用すると、変換に問題はありません。data.tableを使用すると、方法がわかりません。 df <- data.frame(ID=c(rep("A", 5), rep("B",5)), Quarter=c(1:5, 1:5), value=rnorm(10)) #One way: http://stackoverflow.com/questions/2851015/r-convert-data-frame-columns-from-factors-to-characters df <- data.frame(lapply(df, as.character), stringsAsFactors=FALSE) #Another way df[, "value"] <- as.numeric(df[, "value"]) library(data.table) dt <- data.table(ID=c(rep("A", 5), rep("B",5)), Quarter=c(1:5, 1:5), value=rnorm(10)) dt <- data.table(lapply(dt, as.character), stringsAsFactors=FALSE) #Error in rep("", ncol(xi)) : invalid 'times' argument #Produces error, does data.table …

118 r data.table

11

桁区切り記号としてカンマが含まれている数値がある場合にデータを読み取る方法は？

私は数値の一部は、例えば桁区切りとしてカンマで文字列として表現されているCSVファイル持っている"1,513"代わりにします1513。データをRに読み込む最も簡単な方法は何ですか？私はを使用できますがread.csv(..., colClasses="character")、それらの列を数値に変換する前に、関連する要素からコンマを取り除く必要があり、そのためのきちんとした方法を見つけることができません。

117 r csv r-faq

3

Rを使用して最大値を含む行インデックスを見つける

次の行列があるとすると、2列目の最大値を見つけたいとしましょう。 mat <- matrix(c(1:3,7:9,4:6), byrow = T, nc = 3) mat [,1] [,2] [,3] [1,] 1 2 3 [2,] 7 8 9 [3,] 4 5 6 私max(mat[,2])は8を返します。行インデックス（この場合は2行目）を返すにはどうすればよいですか？

117 r matrix

3

ggplot2に散布図（pairs（）と同等）の行列を作成します。

追加の因子を色、形状などにマッピングし、より滑らかにするなどのの優れた機能ggplot2を使用して、で散布図の行列をプロットすることは可能ggplotですか？そのbase機能に似たものを考えていますpairs。

117 r ggplot2

16

R：rJavaパッケージのインストールが失敗する

install.packages("rJava")コマンドを使用してrJavaをインストールすると、次のエラーが発生します。 checking Java support in R... present: interpreter : '/usr/bin/java' archiver : '/usr/bin/jar' compiler : '/usr/bin/javac' header prep.: '/usr/bin/javah' cpp flags : '-I/usr/lib/jvm/java-6-sun-1.6.0.20/jre/../include -I/usr/lib/jvm/java-6-sun-1.6.0.20/jre/../include/linux' java libs : '-L/usr/lib/jvm/java-6-sun-1.6.0.20/jre/lib/amd64/server -L/usr/lib/jvm/java-6-sun-1.6.0.20/jre/lib/amd64 -L/usr/lib/jvm/java-6-sun-1.6.0.20/jre/../lib/amd64 -L -L/usr/java/packages/lib/amd64 -L/usr/lib64 -L/lib64 -L/lib -L/usr/lib -ljvm' checking whether JNI programs can be compiled... yes checking JNI data types... configure: …

116 r rjava

3

R散布図の点のサイズを制御しますか？

Rでは、plot()関数はpch、プロット内のポイントの外観を制御する引数を取ります。私は何万点もの散布図を作成しており、小さいが小さすぎない点を好みます。基本的に、私はpch='.'小さすぎpch=19ますが、太りすぎです。どうにかしてドットを縮小するための中間または何らかの方法がありますか？

116 r plot scatter-plot

6

データフレームの行をベクトルに変換する

データフレームの行からベクトルを作成します。しかし、行と列の名前を付ける必要はありません。私はいくつかのことを試みました...しかし運がありませんでした。これは私のデータフレームです： > df <- data.frame(a=c(1,2,4,2),b=c(2,6,2,1),c=c(2.6,8.2,7.5,3)) > df a b c 1 1 2 2.6 2 2 6 8.2 3 4 2 7.5 4 2 1 3.0 私は試した： > newV <- as.vector(df[1,]) > newV a b c 1 1 2 2.6 しかし、私は本当にこのようなものを望んでいます： > newV <- c( 1,2,2.6) > newV [1] …

116 r vector dataframe

3

Rの文字列からすべての特殊文字を削除しますか？

Rの文字列からすべての特殊文字を削除してスペースで置き換える方法は？削除するいくつかの特殊文字は次のとおりです。 ~!@#$%^&*(){}_+:"<>?,./;'[]-= 私はパターンで試しましたがregex、[:punct:]句読点のみを削除します。質問2：次のような外国語から文字を削除する方法：â í ü Â á ą ę ś ć？回答：を使用[^[:alnum:]]して削除したり~!@#$%^&*(){}_+:"<>?,./;'[]-=、を使用[^a-zA-Z0-9]しâ í ü Â á ą ę ś ćてregexやregexpr関数を削除したりします。

116 regex string r character

7

data.frameに列を追加する

以下のdata.frameがあります。h_no最初の一連のh_no 1,2,3,4がクラス1、2番目の一連のh_no（1〜7）がクラス2になるように、列1（）に従ってデータを分類する列を追加します。最後の列に示されているような。 h_no h_freq h_freqsq 1 0.09091 0.008264628 1 2 0.00000 0.000000000 1 3 0.04545 0.002065702 1 4 0.00000 0.000000000 1 1 0.13636 0.018594050 2 2 0.00000 0.000000000 2 3 0.00000 0.000000000 2 4 0.04545 0.002065702 2 5 0.31818 0.101238512 2 6 0.00000 0.000000000 2 7 0.50000 0.250000000 2 1 …

115 r dataframe

4

遅いR関数を高速化するCコードの記述方法はどこで習得できますか？[閉まっている]

閉まっている。この質問はスタックオーバーフローのガイドラインを満たしていません。現在、回答を受け付けていません。この質問を改善してみませんか？Stack Overflowのトピックとなるように質問を更新します。 3年前休業。この質問を改善する Rで使用するCコードを記述する方法を学習するための最良のリソースは何ですか？R拡張機能のシステムと外国語インターフェースのセクションについては知っていますが、かなり難しいと思います。Rで使用するCコードを作成するための優れたリソース（オンラインとオフラインの両方）は何ですか？明確にするために、Cコードの記述方法を学びたくありません。RとCをより適切に統合する方法を学びたいと思います。たとえば、C整数ベクトルからR整数ベクトルに（またはその逆に）変換する方法を学びますまたはCスカラーからRベクトルへ？

115 r rcpp

3

ggplot2でfacet_wrapおよびscales = "free"を使用して個々の軸の制限を設定する

予測値と残差のプロットと並べて予測値と実際の値を表示するファセットプロットを作成しています。私はshiny、さまざまなトレーニングパラメーターを使用してモデリング作業の結果を調査するために使用します。データの85％でモデルをトレーニングし、残りの15％でテストし、これを5回繰り返し、毎回実際の/予測された値を収集します。残差を計算すると、data.frame次のようになります。 head(results) act pred resid 2 52.81000 52.86750 -0.05750133 3 44.46000 42.76825 1.69175252 4 54.58667 49.00482 5.58184181 5 36.23333 35.52386 0.70947731 6 53.22667 48.79429 4.43237981 7 41.72333 41.57504 0.14829173 私が欲しいもの： predvs actとpredvsの横並びのプロットresid predvs. のx / y範囲/制限actは同じで、理想的min(min(results$act), min(results$pred))にはmax(max(results$act), max(results$pred)) predvs. のx / y範囲/制限は、実際のvs.予測プロットに対して私が何をするかによって影響を受けresid ません。x予測値yのみと残差範囲のみのプロットは問題ありません。両方のプロットを並べて表示するために、データを溶解します。 library(reshape2) plot <- melt(results, id.vars = …

115 r ggplot2 facet

4

`levels <-`（これはどんな魔術ですか？

別の質問への回答として、@ Marekは次のソリューションを投稿しました：https ://stackoverflow.com/a/10432263/636656 dat <- structure(list(product = c(11L, 11L, 9L, 9L, 6L, 1L, 11L, 5L, 7L, 11L, 5L, 11L, 4L, 3L, 10L, 7L, 10L, 5L, 9L, 8L)), .Names = "product", row.names = c(NA, -20L), class = "data.frame") `levels<-`( factor(dat$product), list(Tylenol=1:3, Advil=4:6, Bayer=7:9, Generic=10:12) ) これは出力として生成されます： [1] Generic Generic Bayer Bayer …

114 r types levels

12

Cのローリングメディアンアルゴリズム

私は現在、Cでローリングメジアンフィルター（ローリングミーンフィルターに類似）を実装するアルゴリズムに取り組んでいます。私の文献検索から、それを行うには2つの合理的に効率的な方法があるようです。1つ目は、値の初期ウィンドウを並べ替えてから、バイナリ検索を実行して新しい値を挿入し、反復ごとに既存の値を削除します。 2番目（Hardle and Steiger、1995、JRSS-C、アルゴリズム296から）は、両端にヒープ、もう一方に最小ヒープ、中央に中央値を持つ両頭ヒープ構造を構築します。これにより、O（n log n）の代わりに線形時間アルゴリズムが生成されます。これが私の問題です。前者の実装は可能ですが、これを何百万もの時系列で実行する必要があるため、効率が非常に重要です。後者は実装が非常に難しいことがわかっています。RのstatsパッケージのコードのTrunmed.cファイルでコードを見つけましたが、かなり判読できません。線形時間ローリングメディアンアルゴリズムの適切に作成されたC実装を知っている人はいますか？編集：Trunmed.cコードへのリンクhttp://google.com/codesearch/p?hl=en&sa=N&cd=1&ct=rc#mYw3h_Lb_e0/R-2.2.0/src/library/stats/src/Trunmed.c

114 c algorithm r statistics median

3

スマートな方法でRmarkdownに\ newpageを追加する方法は？

\newpageRマークダウンv2でこれとは異なる方法でLaTeX コマンドを単純に使用できるかどうか疑問に思います。 ```{r, results='asis', echo=FALSE} cat("\\newpage") ``` pdf_outputを生成します。any1にアイデアがある場合は、コメントしてください:)！ありがとう私はこのようなpdfを作成します： --- title: " " author: " " date: "2014" output: pdf_document: includes: in_header: naglowek.tex highlight: pygments toc: true toc_depth: 3 number_sections: true keep_tex: true ---

114 r r-markdown

15

.csvファイルをRに読み込もうとしたときの「不完全な最終行」警告

私は.csvファイルをRに読み込もうとしており、次の式を使用しています： pheasant<-read.table(file.choose(),header=TRUE,sep=",") 次の警告メッセージが表示されます。 "incomplete final line found by readTableHeader on 'C:\Documents and Settings..." この警告を引き起こしたと思われることがいくつかありますが、残念ながら私はRについて自分で問題を診断するのに十分な知識を持っていないので、誰かが私に診断してくれることを願ってここに投稿したいと思いました！ .csvファイルはもともとExcelファイルで、.csv形式で保存しましたファイルは3列のデータで構成されています各データ列の長さが異なります。つまり、各列に異なる数の値があります一度に2つの列の平均（正規分布/非正規分布に応じてt検定または同等のものを使用）を比較したいので、たとえば、列1の値と列2の値の間のt検定、次にt-列1と列3の値のテストなどヘルプや提案は真剣にいただければ幸いです！

114 r line-endings read.csv

タグ付けされた質問 「r」

タグ付けされた質問「r」