ZFSとSAN —ベストプラクティス?


16

ZFSのほとんどの議論では、ハードウェアRAIDをオフにし、ZFSがディスクと直接通信し、(RAIDコントローラーではなく)ホスト上のRAIDを管理する必要があることを示唆しています。

これは、2〜16個またはそれ以上のローカルディスクを搭載したコンピューターでは理にかなっていますが、大規模なSANを備えた環境ではどうでしょうか。

たとえば、私が働いている企業には、2つのフルラックのディスクを備えた控えめなサイズのSANと考えるものがあります。これは400スピンドルのようなものです。SANシェルフは私たちのものよりもはるかに高密度であり、SAN展開は私たちのものよりもはるかに大きいのを見てきました。

100台のディスクを大きなZFSサーバーに直接公開していますか?300ディスク?3000ディスク?SAN管理ツールは、この種の自動管理を容易にしますか?

回答:


5

FWIW 単一のZFSプールで最大92個のディスクを使用した経験があり、これまでのところ正常に動作しています。

しかし、実際に数百のディスクについて話している場合は、それらを少数の分離した(しかしまだ大きな)プールに分割することを検討します。たとえばzpool scrub、3000ディスクプールでの実行時間を知りたくありません(ただし、定期的にスクラブする必要があります)。また、zpool statusこのような多数のディスクを使用すると、コマンドの出力が扱いにくくなります。では、なぜすべての卵を単一のバスケットに入れるのでしょうか?

重複除去に関する補足事項:重複除去はデータセットレベルで制御できますが、プールレベルで重複が検出されることに注意してください。つまり、提案されているようにパーティションを分割すると、重複除去の結果が悪化する可能性があります。プールが大きすぎる場合、ARC + L2ARCに収まらない可能性がある単一の巨大プールの重複除去ハッシュを保持するためにより多くのメモリが必要です。重複除去を使用している場合、利用可能なメモリ量はおそらく実用的な最大プールサイズの良い指標です)


1
+1同意します。すべてのディスクを非常に大きなプールに配置する必要はありません。
PiL

私は考えていました... san(hp、ibm、emcなどから最も一般的なもの)はすべてのディスクを直接ボックスに公開していますか?または、私が見た限りでは、LUNを作成してからサーバーに関連付ける必要がありますか?またはクリスが意図しているように、それはいくつかのDASのようなものですか?
PiL

Sun / Oracleサポートでは、パフォーマンスへの影響が非常に大きいため、独自のOpenStorage製品シリーズでも重複除去を無効にすることをお勧めします。
pfo

3

SANにRAIDを管理させます。バッテリーでバックアップされたすべてのNVRAMと専用プロセッサにお金を費やしてから、CPUでRAIDチェックサム以外の処理を行いたいサーバーに作業をオフロードするのはなぜですか?


1
この難問は「転生の輪」と呼ばれ、汎用CPUが専用CPUよりも高速になると、タスクを専用CPUにオフロードし、タスクをCPUにロールバックする間に一定のサイクルが発生します。
クリス


2

これは古い質問ですが、7年前と同じように今日は関連性があります!

質問の最初の部分に答えるために、ZFSを実行できるサーバーにrawディスクを公開する「SAN」と呼ばれるものを知りません。定義上、SANはブロックストレージ(LUN)のみを提示するか、Filer / FSがNFSまたはCIFSを提示するようなものを備えています。実際にZFSを内部で実行する「SAN」がいくつかありますが、これは大部分が抽象化されています-ディスクはサーバーに決して公開されず、代わりにSANの「ファイラー」コンポーネントがサーバーにブロックまたはネットワークファイルシステムを提示します。

rawディスクを提供するデバイス(SAS経由またはFC経由の可能性は低い)はDASです。ZFSを実行するには、通常、ディスクをJBODとして提示するようRAIDコントローラーに指示します。

ただし、SANによって提供されるLUNでZFSを使用する必要がありますか?おそらく:ZFSとたとえばEXT4は、チェックサムをチェックするスクラブやスナップショットの実行など、いくつかの追加機能を提供します。スクラブはおそらく、ディスクRAIDを実行している場合と同じ方法で自動修復することはできませんが、破損を警告して、ビット腐敗を防ぐことができます。たとえば、Linux SAMBAファイルサーバーで作成できるスナップショットは、EXTでできることよりもはるかに優れており、Windowsで「以前のバージョン」として公開することもできます。


1

ZFSで使用する冗長データ(ミラー、RAID-Zなど)を提供しないと、それを使用する利点の多くが失われます。関係するディスクの数はその事実を変えません。ただし、それが本当に重要かどうかは、環境によって異なります。必要なストレージ機能を決定し(潜在的に労働集約的な分析)、その後、ニーズを満たす最も安価なソリューション(余裕がある)を探しに行く必要があります。つまり、専用のOracleストレージデバイスとともにZFSをどこでも使用することを意味する場合があります(一部の人々はそれを行い、多くのディスクを問題なくZFSに公開し、Oracleツールを使用して管理を行います)、エンタープライズSAN製品のみを使用すること、または一部のハイブリッド(この場合、おそらく環境を管理するためにいくつかのツールとプロセスを独自に開発する必要があります)。ドン'

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.