「重複排除」とは何ですか?


8

つまり、私は辞書の定義を調べることができますが、なぜ仮想テープライブラリに関連してみんなが突然それについて話しているのですか?最近ニュースになっているように、ここで「新しい」とは何ですか?

回答:


14

重複排除では、データセットの内容を確認し、存在するすべての重複ビットに注意して、データを1回だけ保存し、データのコピーをすべて1つのコピーへのポインターに置き換えます。サーバーのようなものをバックアップするとき、非常に多くのデータが同じであるため、バックアップに特に役立ちます。たとえば、1,000台のWindowsサーバーをバックアップしているとします。これらのボックスの内容の多くは同じです。

重複除外は、3つの理由で今日非常に人気があります。

  1. 最近では、オフサイトサーバーを利用した災害復旧ソリューションの構築に誰もが夢中になっています。これを行うには、大量の本番データをリモートサイトに複製する必要があり、帯域幅は大きな問題です。複製する必要があるデータの量を減らすことは、大きな助けになります。

  2. より安価なストレージと記録保持に関する複数業界の要件のおかげで、企業が保持しているデータの量は爆発的に増加しています。

  3. 比較的最近、この技術がスイートスポットにヒットしました。長い間重複排除のようなものがありましたが(シングルインスタンスストレージなど)、これは役立っていますが、主流になるストレージの量を大幅に削減できる実際の重複排除を見てきました。


2
また、重複除外ソリューションのコストが低下しているため、ベンダーはそのメリットをより簡単に販売できるようになりました。販売が容易であれば、ベンダーはそれについてもっと話します...特に仮想テープについての議論には気づきませんでしたライブラリは他のバックアップ方法よりも優れていますが、両方のメリットを一緒に売り込むチャンスだと思います。
William

1
@ウィリアム:ええ、まさに、私が「スイートスポット」と言ったときは、コストの部分を指すつもりでしたが、明確にしていないので、指摘してくれてありがとう。確かに、コストは十分に低くなっているので、多くの人が実際に余裕のある重複除外ソリューションを見つけることができます。
icky3000 2010年

0

私の会社でNetappを使って作業しているときに判明したことの1つは、重複排除が実際に機能するのは、ドライブを調整した場合に限り、VM環境でのみ機能することです。多くのWindows Server 2003マシンがあり、どのドライブも調整されていないため、これは私たちにとって問題です。つまり、ドライブが正しく位置合わせされている場合、可能なスペースの約4分の1をほとんど回復できません。

しかし、ドライブが正しく配置されると、重複排除によってスペースの40〜60%を回復できるはずだと言われています。


(他の完全に理解できる理由で)4 KBの静的ブロックサイズを使用する具体的なNetApp実装の問題。代替案は、適切な配置を必要としない可変サイズのコンテンツ定義のチャンクです。
dmeister
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.