Server 2012重複排除機能の技術的な詳細


12

Windows Server 2012にはNTFSボリュームの重複排除機能が搭載されているため、技術的な詳細を見つけるのに苦労しています。TechNetのドキュメントから、重複排除アクション自体は非同期プロセスであると推定できます-SIS Grovelerの動作方法とは異なりますが、実装(アルゴリズムの使用、必要なリソース、パフォーマンスに関する情報までも)について実質的に詳細はありません考慮事項は、大まかな経験則スタイルの推奨事項にすぎません)。

洞察と指針は大歓迎であり、一連のシナリオでのSolarisのZFS重複排除効率との比較は素晴らしいことです。

回答:


9

私が疑ったように、それはVSSサブシステム(source)に基づいており、非同期の性質も説明しています。重複排除チャンクはに保存され\System Volume Information\Dedup\ChunkStore\*、設定はにあり\System Volume Information\Dedup\Settings\*ます。これは、バックアップソフトウェアがそのようなボリュームと対話する方法に大きな影響を与えます。これについては、リンクされた記事で説明します(簡単に:重複排除サポートなしの場合、バックアップは常に同じサイズになります。はるかに小さな重複排除ストア)。

使用された方法については、2011年にMicrosoftの研究者によって出された研究論文(sourcefulltext)がUsenix FAST11会議で見つかりました。セクション3.3は、プライマリストレージでの重複排除について説明します。このデータはNTFS重複排除機能の開発で使用された可能性があります。この引用が使用されました:

可変サイズのコンテンツ定義ブロックの標準アルゴリズムは、Rabin Fingerprints [25]です。

この論文には多くのデータがありますが、使用したツールセットの複雑さは、2012年に既にわかっている機能と組み合わされており、この論文の推論が機能の開発に使用されたことを強く示唆しています。msdnの記事なしでは確実に知ることはできませんが、これは当分の間得る可能性のある限り近いものです。

ZFSとのパフォーマンスの比較は、ベンチマークが完了するまで待つ必要があります。


2
参照していただきありがとうございますが、パフォーマンス、データの整合性、およびメモリ消費の点で重複除去と同じくらい賢明な機能について、よりドキュメンテーションのようなものを望んでいたことを認めなければなりません。それでは、待って見てみましょう。
-wabbit
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.