数百万のファイルにすばやくアクセスしてバックアップするためのオプション
同様の問題を持つ人々から借りる
これは、USENETニュースサーバーとWebプロキシのキャッシュに直面する、より簡単な種類の問題、つまりランダムにアクセスされる何億もの小さなファイルに非常によく似ています。あなたは彼らからヒントを得たいと思うかもしれません(彼らが通常バックアップを取る必要がないことを除いて)。
http://devel.squid-cache.org/coss/coss-notes.txt
http://citeseer.ist.psu.edu/viewdoc/download;jsessionid=4074B50D266E72C69D6D35FEDCBBA83D?doi=10.1.1.31.4000&rep=rep1&type=pdf
明らかに、周期的なニュースファイルシステムの周期的な性質はあなたには関係ありませんが、複数のディスクファイル/デバイスがパックされたイメージと、ユーザーが位置情報を検索するために提供する情報からの高速インデックスを持つ複数の低レベルの概念は非常に適切です。
専用ファイルシステム
もちろん、これらは、ユーザーがファイル内にファイルシステムを作成し、ループバック上にマウントすることについて話していたものに似た概念です。ただし、独自のファイルシステムコードを書くことができます。もちろん、システムはほとんど読み取り専用であると言ったので、実際にはディスクパーティション(またはサイジングの柔軟性のためにlvmパーティション)をこの目的専用にすることができます。バックアップする場合は、ファイルシステムを読み取り専用でマウントしてから、パーティションビットのコピーを作成します。
LVM
LVMをパーティションの動的なサイジングを可能にして、大量の空きスペースをバックアップする必要がないようにするのに役立つと上記で言及しました。しかし、もちろん、LVMには他にも非常に適用可能な機能があります。具体的には、ある時点でファイルシステムをフリーズできる「スナップショット」機能。rm -rf
スナップショットを邪魔しないような偶発的なものなど。何をしようとしているのかによっては、バックアップのニーズに十分な場合があります。
RAID-1
RAIDについては既にご存知で、おそらく信頼性のために既に使用されていると確信していますが、少なくともソフトウェアRAIDを使用している場合は、RAID-1もバックアップに使用できます(ハードウェアRAIDで使用できますが、実際には読み取りに同じモデル/リビジョンコントローラが必要になる場合があるため、信頼性が低下します)。コンセプトは、通常の信頼性のニーズに接続するために実際に接続する必要のあるディスクよりも1つ多くのディスクでRAID-1グループを作成することです(たとえば、2つのディスク、または大きなディスクとハードウェアでソフトウェアRAID-1ハードウェアRAID-5の上にソフトウェアRAID-1を備えた小さいディスクのRAID5)。バックアップを取るときが来たら、ディスクをインストールし、mdadmにそのディスクをraidグループに追加するように依頼し、完全性を示すまで待機し、オプションで検証スクラブを依頼してから、ディスクを削除します。もちろん、