私は分散ファイルシステムの忍者ではありませんが、できるだけ多くのドライブをできるだけ少ないマシンに統合した後、iSCSIを使用してマシンの大部分を1つのメインマシンに接続しようとします。そこで、できればフォールトトレラントストレージに統合することができました。マシン内(ドライブが停止した場合)およびマシン間(マシン全体が電源オフの場合)のフォールトトレラントが望ましい。
個人的に私はZFSが好きです。この場合、組み込みの圧縮、重複排除、フォールトトレランスが役立ちます。ただし、データをフォールトトレラントにしながら圧縮する方法は他にもたくさんあるはずです。
推奨する実際のターンキー分散ファイルソリューションがあればよかったのですが、これは本当に手間のかかるものであることがわかっていますが、正しい方向を示してくれることを願っています。
編集: 私はまだZFSとiSCSIを設定するのは初めてですが、ドイツのサンがZFSの耐障害性を示しているビデオを見たことを思い出しました。3つのUSBハブをコンピューターに接続し、各ハブに4つのフラッシュドライブを配置しました。次に、1つのハブがストレージプールをダウンさせないように、各ハブの1つのフラッシュドライブで構成されるRAIDzボリュームを作成しました。次に、4つのZFS RAIDzボリュームを一緒にストライプします。この方法では、パリティ用に4つのフラッシュドライブのみが使用されました。次に、1つのハブを取り外し、すべてのzpoolを劣化させましたが、すべてのデータが利用可能でした。この構成では、最大4台のドライブが失われる可能性がありますが、2台のドライブが同じプールにない場合のみです。
この構成が各ボックスのrawドライブで使用された場合、パリティ用ではなくデータ用により多くのドライブが保持されます。 FreeNASは、iSCSIを介して「生の」方法でドライブを共有できる(またはできるようになる)と聞いたので、Linuxでも同じことができると思います。私が言ったように、私はまだ学んでいますが、この代替方法は、以前の提案よりもドライブパリティの観点から無駄が少ないでしょう。もちろん、それが受け入れられるかどうかはわかりませんが、ZFSの使用に依存します。学習経験でない限り、何かを構築/保守/修復する必要がある場合は、通常、あなたが知っていることに固執するのが最善であることを知っています。
これが良いことを願っています。
編集:掘り下げて、私が話したビデオを見つけました。USBフラッシュドライブをハブに分散させることを説明する部分は、2分10秒から始まります。このビデオでは、ストレージサーバー「Thumper」(X4500)のデモと、コントローラーにディスクを分散する方法を説明します。そのため、ハードディスクコントローラーに障害が発生してもデータは良好です。(個人的には、これはオタクが楽しんでいるだけのビデオだと思います。私は自分でサンパーボックスを持っていたらいいのに、妻は家にパレットジャックを走らせたくありません。:Dそれは大きな箱です。)
編集:OpenAFSと呼ばれる分散ファイルシステムに出くわしたことを思い出しました。私はそれを試していませんでした、私はそれについて読んだだけでした。おそらく他の人は、それが現実の世界でどのように処理するか知っています。