回答:
重複排除では、データセットの内容を確認し、存在するすべての重複ビットに注意して、データを1回だけ保存し、データのコピーをすべて1つのコピーへのポインターに置き換えます。サーバーのようなものをバックアップするとき、非常に多くのデータが同じであるため、バックアップに特に役立ちます。たとえば、1,000台のWindowsサーバーをバックアップしているとします。これらのボックスの内容の多くは同じです。
重複除外は、3つの理由で今日非常に人気があります。
最近では、オフサイトサーバーを利用した災害復旧ソリューションの構築に誰もが夢中になっています。これを行うには、大量の本番データをリモートサイトに複製する必要があり、帯域幅は大きな問題です。複製する必要があるデータの量を減らすことは、大きな助けになります。
より安価なストレージと記録保持に関する複数業界の要件のおかげで、企業が保持しているデータの量は爆発的に増加しています。
比較的最近、この技術がスイートスポットにヒットしました。長い間重複排除のようなものがありましたが(シングルインスタンスストレージなど)、これは役立っていますが、主流になるストレージの量を大幅に削減できる実際の重複排除を見てきました。
私の会社でNetappを使って作業しているときに判明したことの1つは、重複排除が実際に機能するのは、ドライブを調整した場合に限り、VM環境でのみ機能することです。多くのWindows Server 2003マシンがあり、どのドライブも調整されていないため、これは私たちにとって問題です。つまり、ドライブが正しく位置合わせされている場合、可能なスペースの約4分の1をほとんど回復できません。
しかし、ドライブが正しく配置されると、重複排除によってスペースの40〜60%を回復できるはずだと言われています。