(ZFS内での重複排除とバックアップソフトウェアの使用について言及していると想定)
ストレージシステムを特別に設計しない限り、バックアップシステムにZFS ネイティブ重複排除を使用することはお勧めしません。
ZFSで重複排除を使用すると、RAMを集中的に使用します。データがストレージプールにストリーミング/書き込みされるときに重複排除がリアルタイムで発生するため、データブロックを追跡するテーブルがメモリに保持されます。これはDDTテーブルです。ZFSストレージサーバーにこのテーブルを収容するのに十分なRAMがない場合、パフォーマンスは大幅に低下します。Nexentaは、テーブルが特定のしきい値を超えると警告を出しますが、それまでには遅すぎます。これは、L2ARCデバイス(読み取りキャッシュ)を使用することで強化できますが、ZFSの初期の採用者の多くがこの罠に陥りました。
見る:
ZFS-重複排除されたzvolまたはデータセットを破棄すると、サーバーが停止します。回復するには?
ZFS-L2ARCキャッシュデバイス障害の影響(Nexenta)
重複排除を使用するためのRAM要件が高いと言うとき、64 GB以上のRAMと200 GB以上のL2ARCで記述しているデータセットのRAMとL2ARCのニーズを推定します。それは小さな投資ではありません。再読されないWindowsシステムファイルや画像ドキュメントをたくさん保存すると、DDTがすぐにいっぱいになります。見返りは、事前に行う必要があるエンジニアリング作業の価値がない場合があります。
より良いアイデアは、zpoolで圧縮を使用することです。おそらく、より圧縮可能なデータ型のgzip機能を活用します。重複排除されたデータを削除する必要がある場合にヒットするため、重複排除は価値がありません(DDTを参照する必要があります)。
また、バックアップソフトウェアにストレージをどのように提示しますか?どのバックアップソフトウェアスイートを使用しますか?Windows環境では、iSCSIを介してBackup ExecにブロックストレージとしてZFSを提示します。ZFS CIFSの機能が十分に堅牢であることに気づかず、ネイティブにフォーマットされたデバイスの利点を優先しました。
また、デザインのアイデアに関する優れたZFSリソースもここにあります。誰も言わなかったZFSについて