複数の言語(RやSplusなど)を含む統計プロジェクトのディレクトリ構造?


9

投稿の構築統計分析プロジェクトとR の ProjectTemplateパッケージを効率的に管理する方法 ...

Q:複数の言語が大きく機能している場合(R AND Splusなど)、統計プロジェクトのディレクトリ構造をどのように構築しますか?

このトピックに関するほとんどの議論は、主に1つの言語を使用するプロジェクトに限定されています。複数の言語を使用しているときに、だらし、混乱、破損を最小限に抑える方法に関心があります。

以下に、現在のプロジェクト構造と実行方法を示します。代替は私が持っているので、別々のコードにあるかもしれない./Rし、./Splusディレクトリ---それぞれ含む、独自の/lib/src/util/tests、および/mungeディレクトリ。

Q:「ベストプラクティス(存在する場合)」に最も近いアプローチはどれですか。

  • / data-プロジェクト間で共有されるデータ
  • / libraries-プロジェクト間で共有されるスクリプト
  • / projects / myproject-私の作業ディレクトリ。現在、複数の言語を使用している場合は、この場所を作業ディレクトリとして共有しています。
  • ./data/-データに固有のデータとデータへの/myprojectシンボリックリンク/data
  • ./cache/ -キャッシュされたワークスペース(例えば、.RDataファイルを使用して保存されたsave.image()Rまたはに.sddファイルを使用して保存されたdata.dump()S-PLUSで)
  • ./lib/-メインプロジェクトファイル。すべてのプロジェクトで同じです。Rプロジェクトが実行されます経由source("./lib/main.R")今度の実行中にload.Rclean.Rtest.Ranalyze.R.report.R。複数の言語が使用されている場合、現在、たとえば、S-PLUSは、Rに加えて、私がスローされますmain.sscclean.sscこのディレクトリに、などにも。私はこれが好きかどうかわからない。
  • ./src/-プロジェクト固有の関数。ファイルごとに1つの関数を収集しました。
  • ./util/-最終的にパッケージ化される一般的な関数。ファイルごとに1つの関数を収集しました。
  • ./tests/-テストケースを実行するためのファイル。によって使われた./lib/test.R
  • ./munge/-データをクリーニングするためのファイル。によって使われた./lib/clean.R
  • ./figures/-./lib/report.R最終レポートで使用される表と図の出力
  • ./report/ - .texファイルへのファイルやシンボリックリンクで./figures
  • ./presentation/ - .texプレゼンテーション用のファイル(通常はBeamerクラス)
  • ./temp/-一時スクリプトの場所
  • ./README
  • ./TODO
  • ./.RData-Rプロジェクトワークスペースを格納する
  • ./.Data/-Sプロジェクトワークスペースを格納するため

1
これは間違いなく、stackoverflow.comでより多くの回答を得る
mpiktas

1
@mpiktas、しかしこれは応用統計学者にとって非常に重要です。
Karl

回答:


2

私は間違いなく「ベストプラクティス」とは言いませんが、私の典型的なプロジェクトにはディレクトリがあります

R(一般的に含まれprepData.Ranalysis.Rfunc.R、とfigs.R、しかしこれらは、多くのファイルにそれぞれ分割することができかもしれないとはSweaveまたは使用することができasciidocを

Perl (主にデータファイルの解析/変換用)

RawData (すべての元のデータファイル)

Data (すべての処理済みファイル)

Notes (通常、共同編集者からのメモ)

Rディレクトリには、多くの場合、サブディレクトリが含まれていますFigsRcache

特に重要:バージョン管理!私はgitが好きです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.