日常業務で最も役立つと思うRパッケージは何ですか?


28

スレッドの複製: 最新バージョンのRをインストールしました。どのパッケージを入手すればよいですか?

データを使った日々の作業を想像できなかったRパッケージとは何ですか?一般的なツールと特定のツールの両方をリストしてください。

更新:ggplot224.10.10は7票の勝者のようです。

複数の言及された他のパッケージは次のとおりです。

  • plyr -4
  • RODBCRMySQL-4
  • sqldf -3
  • lattice -2
  • zoo -2
  • Hmisc/rms -2
  • Rcurl -2
  • XML -2

回答ありがとうございます!


1
非常に主観的な質問:この質問には答えることができず、QAサイトには適していません。
エゴン・ウィルハイゲン

3
おそらくコミュニティwikiであるべきです。ここでは有用な質問ですが、明確な答えはありません。
シェーン

2
@シェーン:良い点。移動しました。@エゴン:主観的。しかし、答えが知識のある人から来た場合、私は主観の量を気にしません。私はごく最近Rを学び始め、数十個を探索するためにインストールしましたが、目の前のタスクに関係なく、はるかに頻繁に使用するツールがあることに気付きました。
ラデク

StackExchangeが、コミュニティのWiki投稿をサイト間でリンクする何らかの方法をサポートできれば興味深いでしょう。Stackoverflowでこの質問が行われたに違いないと思うので、統計分析は通常SOを訪れない人を引き付けるかもしれないと思います。
シャーピー

@Sharpie:stackoverflow.com/questions/1295955/…stackoverflow.com/questions/1535021/…のようないくつかの興味深いSO投稿がありましたが、それらはパッケージに焦点を合わせていません。そして、私は同意します、コミュニティwikiのリンクは本当に役に立つかもしれません。
ラデク

回答:




8

xtableパッケージを使用します。xtableパッケージは、Rによって生成されたテーブル(特に、anovaの結果を表示するテーブル)をLaTeXテーブルに変換し、記事に含めます。



8

ggplot2 -Rに最適な視覚化

RMySQL / RSQLite / RODBC-データベースへの接続用

sqldf -SQLクエリでdata.framesを操作する

Hmisc / rms-便利なその他の関数と回帰分析のための便利な関数を含むFrank Harrellのパッケージ。

GenABEL-ゲノムワイド関連研究のための素晴らしいパッケージ

Rcmdr-必要な場合のR用の適切なGUI。

CRANtasticもチェックしてください-このリンクには、最も人気のあるRパッケージのリストがあります。リストのトップの多くはすでにメンションされています


8

data.tableは私のお気に入りです!より多くのウィッシュリストが実装された新しいバージョンを非常に楽しみにしています。



6

個人的には、次の3つのパッケージを使用します。これらはすべて、素晴らしいOmega Project for Statistical Computingから入手できます(専門家であるとは言いませんが、私の目的では非常に使いやすいです)。

  • RCurl:これには、ベースRのデフォルトの機能では困難なWebサイトへのアクセスを可能にする多くのオプションがあります。これはlibcurlライブラリーへのRインターフェースであり、Rを開発するR以外のコミュニティー全体の利点が追加されています。CRANでも利用可能です。

  • XML:不正な形式のXML / HTMLの解析は非常に寛容です。これはlibxml2ライブラリへのRインターフェースであり、R 以外のコミュニティ全体がそれを開発するという追加の利点があります。これもCRANで利用できます。

  • RJSONIO:json呼び出しから返されたテキストを解析し、さらに分析するためにリスト構造に整理できます。このパッケージのライバルはrjsonです。また、大規模データにも拡張可能です。

6

Sweaveを使用すると、RコードをLaTeXドキュメントに埋め込むことができます。コードの実行結果、およびオプションでソースコードは、最終ドキュメントの一部になります。

したがって、たとえば、Rによって生成されたイメージをLaTeXファイルに貼り付ける代わりに、R コードをファイルに貼り付けて、すべてを1か所に保持することができます。


4
Rで再現性のある研究を始めたいすべての人へのヒントですknitr。Sweaveではなく、新しいパッケージをご覧になることをお勧めします。それは基本的にステロイドのスウィーヴです。習得するのは簡単ではないにしても簡単で、はるかに柔軟です。
クリストフ


4

Deepayan Sarkar氏の本「格子:Rによる多変量データの視覚化」と一緒に、格子を見つけることができます。



4

日々の最も有用なパッケージは、「外部」である必要があります。これは、Stata、SPSS、Minitab、SASなどの他の統計パッケージのデータを読み書きする機能を持っています。非常に重要なパッケージです。


3

私が使う

car、doBy、Epi、ggplot2、gregmisc(gdata、gmodels、gplots、gtools)、Hmisc、plyr、RCurl、RDCOMClient、reshape、RODBC、TeachingDemos、XML。

たくさん。


3

なしでは生きられませんでした。

  • グラフィックスの格子
  • Excelファイルを読み取るためのxlsxまたはXLConnect
  • rtf形式でレポートを作成するrtf(私はSwordまたはR2wdを好むでしょうが、職場でstatconnをインストールすることはできません; すぐにodfWeaveを試すでしょう。)
  • 混合モデルのnlmeおよびlme4
  • 大きい配列を操作するためのff

2

データベースのデータにアクセスするためのRODBC、データフレームで単純なSQLクエリを実行するためのsqldf(ネイティブRコマンドの使用を強制していますが)、およびggplot2plyr



2

私たちは主に使用します:

  • ggplot-チャート用
  • 統計
  • e1071- SVM用

kernlabとSVMのキャレットをチェックアウトすることもできます。それらは興味深い(必ずしも良いとは限りません)選択肢です。
ザック


2

私のために私は使用していますkernlabカーネルベースの機械学習ラボ用およびe1071中 SVMのためとggplot2グラフィックスを


2

私はggplot2、veganを使用し、かなり頻繁に変形します。




2

迅速なforループが必要な場合、または非常にRに準拠していない処理を実行する必要がある場合、RCPPの大ファンです。R ecoシステムに非常によく実装されており、関数の引数として変換せずにMatrix / sparse Matrixを受け取ることができます。

C ++構文は、単純なことをしているときは簡単です(多くの場合、私の場合です)。

本当に、あなたはこの素晴らしいライブラリを必要とするパッケージメーカーである必要はありません。

C ++は非常に高速だと言いましたか?


2

doParallelforeachのパッケージは、私は私のコードを並列化し、上のコンピューティングに最適化されたインスタンス上でそれを実行できるようにすることで、そんなに簡単に私の人生を作ってきたアマゾンEC2!よく使用します。しかし、それはLouis AslettがリリースしたRStudio AMIなしでは不可能でした。最後に、文字列の操作を公園で実際に行うストリンガーパッケージについて言及する必要があります。すべてのテキストマイニングアプリケーションで使用します。また、私は自分の仕事の高品質なレポートを作成するためにknitrを非常に頻繁に使用しています。この素晴らしいパッケージYihui Xieに感謝します!


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.