Fusion-ioカードをRAIDする必要がありますか?


27

1つのFusion-ioカードをサーバーにインストールして確実に実行できますか、またはソフトウェアRAIDセットアップで2つのカードを展開する必要がありますか?

Fusion-ioは、マーケティング資料を確認する際のトピックについてはあまり明確ではありません(ほとんど誤解を招く)

Linuxで実行されている独自のスタンドアロンデータベースソリューションにHPブランドの Fusion-io ioDrive2 1.2TBカードを使用する予定です。これは、実際の高可用性オプションのない単一サーバーのセットアップです。そこ 10分との非同期レプリケーションRPOミラートランザクションが第二の物理サーバにログオンすることは。

従来、このアプリケーションのトップCPUステッピングを備えたハイエンドHP ProLiantサーバーを指定していました。SSDにアクセスする必要があり、必要な容量のエンタープライズSAS SSDよりも低価格でFusion-ioを取得できます。

  • 2つのioDrive2カードを実行し、それらをソフトウェアRAID(mdまたはZFS)で結合する必要がありますか、それとも不要ですか?
  • Fusion-ioの障害は、RAIDコントローラーの障害やマザーボードの障害よりも心配する必要がありますか?
  • RAIDが好きなシステム管理者。このフォームファクターで利用可能なインターフェースとカードのウェアレベリング/エラー修正が異なる場合、これには異なる考え方が必要ですか?
  • これらのデバイスの故障率はどのくらいですか?

編集:デルのFusion-io信頼性ホワイトペーパーを読んだところ、「Fusion-ioカードには多くの内部冗長性があります... RAIDを心配しないでください!!」


IOPSの制限を超えている場合、ソフトウェアRAIDおよび/またはPCIeバスは維持できますか?正直なところ、私にはわかりませんが、チェックする価値があります。
-pauska

1
PCIeバスは維持されます。ソフトウェアRAID(Iの場合NEEDそれは可能ですので、には)、ZFSベースになります。今のところ2枚のカードを注文しましたが、Fusion-ioの文献では「1枚のカードで十分です」と言われているようです。
ewwhite

ZFSでさえCPUサイクルを使用してデータをミラーリングする必要があるため、複雑さとレイテンシーが追加されますが、特定のアプリケーションにどの程度影響するかを知ることは不可能です。Fusionは、内部ミラーリング/セーフガードのCPUコストが低いことを非常に誇りに思っているようです
。– pauska

回答:


16

最終的には、障害モデルに帰着します。障害の影響は何ですか?

歴史的に、そうするためのコストはごくわずかだったので、私たちは常にすべてをRAIDしました。ミラーリング用のドライブにさらに500ドルですか?それを考慮しなくても完全にコストに見合う価値があります。

ミラーリングを有効にするために別の1万ドル以上について話しているときは、もう少し考慮する必要があります。


いいえ、ミラーリングする必要はありません

フュージョン・アイオーカードは非常に良好な内部冗長性を持っています。これは、ディスクがシングルチップであるような種類のハードウェアではありません。私が障害を観察したほとんどの状況では、ミラーの両方のメンバーに影響を与えたのはファームウェアの問題であったため、RAIDは問題になりませんでした。

Fusion-ioカードは、ディスクが背後にあるRAIDコントローラと考えてください。シングルコントローラーのセットアップで大丈夫ですか?多分。そのように扱います。

Fusion-ioドライブを展開する多くのセットアップでは、他のセーフガード(ノードレベルでの冗長性)が組み込まれているため、あまり意味がありません。


はい、ミラーリングする必要があります

RAIDは可用性を高めます。コストにもかかわらず絶対的な最大可用性が必要ですか?障害のコストと可能なダウンタイムは高価ですか?先に進み、ドライブをミラーリングします。統計的に大規模なセットアップでは、内部セーフガードにもかかわらずドライブの障害が発生します。


更新:クライアントが追加の費用で大丈夫だったインストールでFusion-ioカードをミラーリングしました(そして製品のデプロイを容易にするため)。他の状況では、多くの単一カードのインストールを展開しました。これまでのところ、すべてが順調です
...-ewwhite

18

デバイス上の冗長性は、実際のデータストレージを実行するすべてのコンポーネント間のRAIDと同様に、フラッシュチップの障害に対してうまく機能します。

Fusion-ioの障害は、RAIDコントローラーの障害やマザーボードの障害よりも心配する必要がありますか?

デバイス全体の障害は、RAIDコントローラーまたはマザーボードの損失とほとんど同じです。Fusion-ioカードについては、これらの他の単一障害点コンポーネントとほぼ同じくらい心配していますが、ハードデータを使用して故障率を比較できるように、大規模にデバイスを使用した経験がある。

2つのioDrive2カードを実行し、それらをソフトウェアRAID(mdまたはZFS)で結合する必要がありますか、それとも不要ですか?

デバイスに既にあるもの(たとえば、複数のFusion-ioカード間でのソフトウェアRAID)に加えて冗長性を追加することは、2つの異なるRAIDコントローラー上の2つのハードウェアRAIDグループ間でソフトウェアRAIDを行うことに似ています。追加の単一障害点を除去するために極端な冗長性を保証するシステムには価値があるかもしれませんが、一般的な展開にはそうではありません(ミラー上の10分間のRPOはほとんどのアプリケーションに十分でしょうか?)。

RAIDのようなシステム管理者。このフォームファクターで利用可能なインターフェースとカードのウェアレベリング/エラー修正が異なる場合、これには異なる考え方が必要ですか?

はい、私はそう思います。基本的に、1つのパッケージでRAIDコントローラーのようなデバイスとその背後にある一連のストレージデバイスを取得しています。これは間違いなく、単一のデバイス上の機密データを置くことについて心配するしたく、しかし、1人のニーズデバイスの内部冗長性に信頼のいくつかのレベルを持っている...「RAIDの健全な理解とカウンターバランスすべきだありませんバックアップ」の概念:冗長コンポーネントの障害に備えて、またはユーザーがそのコンポーネントのデータを削除できるように、常に適切なバックアップを用意してください。


13

ご存知のように、しばらくの間、RAIDと非RAIDの両方のセットアップでキットを使用してきました-何らかの失敗を経験したかったのですが、そうではありませんでした。RAIDが助けてくれる障害はなく、オンボードの復元機能は向上しているだけです。また、それらを使用する主な機能は水平スケーリング/クラスター化されているため、RAIDを使用する理由はさらに少なくなります。素晴らしいカードですが、強くお勧めします。


良いデータポイント。ただし、RAIDレイヤーの追加が過剰であるかどうかはわかりません。
ewwhite

1
ここでは、テクノロジーが定義ポイントではないと考えています-あなたのデータは単一のFusionIOカードの損失をサポートする能力を必要とするか、そうではありません-単にそれらを高速で高価なディスクと考えてください-それはあなたが変わってもRAIDなしで生きることができますか?
チョッパー

少し...従来のアプローチは、エンタープライズSAS SSDをRAID 1 + 0で使用することです。これは、ディスクの回転に使用されるのと同じ標準をSSDに適用するだけです。ただし、これはホットスワップ可能性も想定しています。特にこれを達成するためにソフトウェアRAIDを使用せざるを得ない場合、PCIeベースのカードには適用されません。Fusion-ioにはウェアレベリングとモニタリングの改善という利点もあるため、ここでの現実的な故障モードを理解しようとしています。Fusion-ioをディスクまたはコントローラーのように扱いますか?ProLiantに2枚のSmartアレイカードを入れて、内部ディスクを提供しませんか?
ewwhite

2
@ewwhite RAIDコントローラーの障害を処理できるようにする必要がある場合、異なるディスクを備えた2つのRAIDコントローラーと、コントローラーのディスク間にRAID1が存在する場合があります。Fusion-ioカードを冗長性計画の観点からRAIDコントローラーのように扱ってください。
シェーンマッデン

@ewwhite私が使用した文言を見ると、FusionIOが装備された単一のサーバーで1回停止した行の間を読むことができます。あるメモリバンク全体に起こり、それがwhoボードを取り出しました。このシナリオでは、RAID 1を使用しましたが、明らかにそれは重要ではありませんでした。もちろん、PCIe ホットスワップ可能であり、大規模な問題になる可能性がありますが、正常に機能することを忘れないでください。
チョッパー

9

Fusionに直接精通していませんが、PCIe SSDの経験があります。

私が使用しているものは4つの異なるLUNをOSに提示し、PCIeカードをHBAのように扱います。RAIDが必要な場合は、OSを使用して2つのLUNをミラーリングします。これにより、1カードで冗長性を実現できます。ただし、カードが完全に失敗した場合、私はまだ小川を上がっています。ioDriveが同じことをするかどうかはわかりません。


この特定のユニットは、1つのブロックデバイスを提供します。
ewwhite

1
ioDriveは、1つまたは2つの独立したデバイスを提供します。2個ある場合、それらは物理的に1つのカード上の2つの個別のデバイスであり、それぞれ独自の内部保護を備えています。たとえば、それぞれSSDとして扱われる4つのデバイスを提供するIntel 910と比較してください。
MikeyB

5

過去数か月で1.2枚のカードのうち6枚を購入しました。それらの1つはすでに失敗しています。だから私は絶対に彼らを襲撃するだろう。Windowsアクティブディスクミラーを使用しました。ドライブは、「missing LEB map」というメッセージで失敗しました。交換する必要があると言われました。しかし、RMAの承認を得るには、失敗したカードの両面で写真を撮る必要があります(カードを取り出すには生産の停止が必要です)。そして、彼らは交換カードがイータなしで在庫切れであると私に言った。そのため、購入する前にかなり一生懸命に考えたいと思うかもしれません。


あなたの経験を共有してくれてありがとう。先に進み、これらの1.2TBカードをミラーペアで展開しました。HP SKUを使用しているため、RMA /交換を処理するためのHPサポート契約があります。
ewwhite 14
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.