私が疑ったように、それはVSSサブシステム(source)に基づいており、非同期の性質も説明しています。重複排除チャンクはに保存され\System Volume Information\Dedup\ChunkStore\*
、設定はにあり\System Volume Information\Dedup\Settings\*
ます。これは、バックアップソフトウェアがそのようなボリュームと対話する方法に大きな影響を与えます。これについては、リンクされた記事で説明します(簡単に:重複排除サポートなしの場合、バックアップは常に同じサイズになります。はるかに小さな重複排除ストア)。
使用された方法については、2011年にMicrosoftの研究者によって出された研究論文(source、fulltext)がUsenix FAST11会議で見つかりました。セクション3.3は、プライマリストレージでの重複排除について説明します。このデータはNTFS重複排除機能の開発で使用された可能性があります。この引用が使用されました:
可変サイズのコンテンツ定義ブロックの標準アルゴリズムは、Rabin Fingerprints [25]です。
この論文には多くのデータがありますが、使用したツールセットの複雑さは、2012年に既にわかっている機能と組み合わされており、この論文の推論が機能の開発に使用されたことを強く示唆しています。msdnの記事なしでは確実に知ることはできませんが、これは当分の間得る可能性のある限り近いものです。
ZFSとのパフォーマンスの比較は、ベンチマークが完了するまで待つ必要があります。