実際のデータセットからの小さなスニペットを使用する小さな単体テストがあります。また、さまざまな理由から、完全なデータセットに対してプログラムをテストしたいと思います。唯一の問題は、単一の実際のデータセットが約5GBであることです。Gitリポジトリーに保管できる具体的な数値は見つかりませんでしたが、多すぎるようです。
このプログラマーの投稿によると、プロジェクトをテストするために必要なすべてのデータをリポジトリーに保管する必要があります。
私のチームが採用したソリューションは、プロジェクトに、テストデータを保持するネットワーク接続ファイルシステムへのパスを含むファイルがあることです。ファイルはGit無視されます。
これは2つの理由で不完全な解決策であると感じています。NASが動作していない、遅い、または完全なテストを実行できないほどダウンしている場合。2番目の理由は、誰かが最初にリポジトリのクローンを作成するときにユニットテストが失敗するため、特定の名前で物をマウントする方法と、テストパスファイルの構築に使用される構文を理解する必要があるためです。
だから私の質問は二つあります。どのくらいのデータが多すぎてリビジョン管理に保存できませんか?
大量のテストデータを処理するためのより良い方法は何ですか?