私はあなたの質問への答えは確かにあります-バージョン管理システムでファイルを管理する利点は、そのようなシステムを実装するコストをはるかに上回ります。
私はあなたが提起したポイントのいくつかに詳細に対応しようとします:
- バックアップ:すでにバックアップシステムを導入しています。
はい、そうです。しかし、あなたの仕事に関連する重要でアクティブなファイルを適切に追跡するために、汎用のバックアップシステムに依存することの適切性に関して考慮すべきいくつかの質問があります。パフォーマンスの面では:
- バックアップシステムはどの間隔でスナップショットを取得しますか?
- スナップショットの作成にはどのくらい時間がかかりますか?
- スナップショットを撮るときにハードドライブ全体をイメージ化する必要がありますか、それとも重要な更新を受け取ったばかりの2つのファイルをバックアップするように簡単に指示できますか?
- バックアップシステムは、正確な精度で、あるバックアップから次のバックアップへのテキストファイルの変更点を示しますか?
最も重要な:
- バックアップはいくつの場所に保存されますか?コンピュータと同じ物理的な場所にありますか?
- バックアップシステムから特定のバージョンの単一ファイルを復元するのはどのくらい簡単ですか。
たとえば、Macを所有していて、Time Machineを使用して自分のコンピューターの別のハードドライブにバックアップします。Time Machineは、おかしなファイルを回復したり、問題が発生した場合にシステムを復元したりするのに最適です。しかし、それは単に私の重要な仕事で信頼されるために必要なものを持っていません:
バックアップする場合、Time Machineはハードドライブ全体をイメージ化する必要があり、かなりの時間がかかります。作業を続行した場合、バックアップを開始したときの状態でファイルがキャプチャされる保証はありません。最初のバックアップが完了する前に、保存したい別のポイントに到達することもあります。
Time Machineのバックアップが保存されているハードドライブが私のマシンにあるため、データが盗難、火災、その他の災害に対して脆弱になります。
Gitのようなバージョン管理システムを使用すると、テキストエディターでの保存を要求するという手間をかけずに、特定のファイルのバックアップを開始できます。ファイルは即座にイメージ化されて保存されます。さらに、Gitは配布されているので、私が働いている各コンピューターにはリポジトリーの完全なコピーがあります。
これは、4つの異なるコンピューター間で私の作業をミラーリングすることになります。神の行為が私のファイルとデータを破壊することはできませんが、その時点ではおそらくあまり気にしません。
- フォークと巻き戻し:これを行う必要性を感じたことはありませんが、どのように役立つかはわかります(たとえば、同じデータセットに基づいて複数のジャーナル記事を準備している、毎月更新されるレポートを準備している、など) )
ソリストとして、私はそれほどフォークしません。ただし、巻き戻しのオプションを使用することで節約できた時間は、バージョン管理システムの学習への投資を何度も何度も払い戻しました。これを行う必要性を感じたことは一度もないというのに、現在のバックアップシステムでファイルを巻き戻すのは、本当に簡単で実行可能なオプションでしたか?
時々、レポートは45分、1時間、または2日前に見栄えがよくなっただけです。
- コラボレーション:ほとんどの場合、自分でデータを分析しているため、バージョン管理によるコラボレーションのメリットは得られません。
はい。しかし、プロジェクトで他の人と共同作業をすることになる場合に不可欠であることがわかるツールを学びます。
これについてはあまり心配しないでください。バージョン管理システムはプログラミング言語のようなものです。それらには、学習する必要があるいくつかの重要な概念があり、残りは構文上の砂糖です。基本的に、最初に学ぶバージョン管理システムは、最も時間をかけて別のバージョン管理システムに切り替える必要があり、新しいシステムが主要な概念をどのように表現するかを学ぶ必要があります。
人気のシステムを選んで、それを試してください!
- 現在のファイル管理システムよりも複雑さが増す可能性
Projects
データ分析アクティビティに関連するすべてのフォルダーとファイルを含む1つのフォルダーがありますか?その場合、バージョン管理を平手打ちすることで、ファイルシステムの複雑さが正確に増加します0
。あなたのプロジェクトは、あなたのコンピュータについて散らばっているなら、あなたはバージョン管理を適用する前にそれらを集中管理する必要があり、これは終わるだろう減少我々が持っている理由です、あなたのファイル-の管理の複雑さDocuments
、すべての後にフォルダを。
- バージョン管理は努力する価値がありますか?
はい!それはあなたに巨大な元に戻すボタンを与えて、あなたがあなたのUSBドライブを失うことのようなことを心配することなく、マシンからマシンへ簡単に仕事を移すことを可能にします。
2バージョン管理を採用する主な長所と短所は何ですか?
私が考えることができる唯一の欠点は、ファイルサイズのわずかな増加ですが、最新のバージョン管理システムは、圧縮と選択的な保存により、驚くべきことを実行できます。
3 Rを使用したデータ分析のバージョン管理を開始するための適切な戦略は何ですか(例、ワークフローのアイデア、ソフトウェア、ガイドへのリンク)。
データまたはレポートを生成するファイルをバージョン管理下に置いてください。あなたのようなものを使用している場合はSweave
、あなたの保存.Rnw
ファイルではなく.tex
、それらから生成されますファイルを。再取得が面倒な場合は、生データを保存してください。可能であれば、データを取得するスクリプトと、生データへの変更を保存するのではなく、データをクリーンアップまたは変更するスクリプトを作成して保存します。
バージョン管理システムについては、Gitとこのガイドをお勧めします。
これらのWebサイトには、Gitを使用した特定のアクションの実行に関連するヒントやコツもいくつかあります。