RAIDコントローラーには一般にSATAドライブのブランド互換性の問題がありますか?


22

データベースサーバーであるLenovo ThinkServer RD120 のRAIDコントローラーに苦労しました。Lenovo / IBMがServeRAID 8kをダビングしたのは、Adaptecのブランド変更です。

このServeRAID 8kは、最新かつ最高のパッチを適用しています。

  • RAID BIOSバージョン
  • RAIDバックプレーンBIOSバージョン
  • Windows Server 2008ドライバー

このRAIDコントローラーは、私たちが所有していた短い4か月の間に複数の重要なBIOS更新があり、変更履歴はただ..ええ、怖いです。

論理RAIDドライブでライトバックとライトスルーの両方の戦略を試しました。大量のディスクアクティビティがあると、断続的なI / Oエラーが引き続き発生します。これらは一般的ではありませんが、SQL Server 2008のI / Oタイムアウトを引き起こし、時にはSQL接続プールの障害を引き起こすため、発生した場合は深刻です。

この問題のトラブルシューティングは終わりました。サーバー全体を交換したり、RAIDハードウェアを交換したりするようなハードコアなものがなければ、私たちは必死になっていた。

サーバーを最初に入手したとき、ドライブベイ#6が認識されないという問題がありました。奇妙なことに、ハードドライブを別のブランドに切り替えると、これが修正されました。また、RAID BIOSを更新すると(何度も)永久に修正されたため、ベイ6の元の「互換性のない」ドライブを使用できました私は、選択したWestern Digital SATAハードドライブがServeRAID 8kコントローラーと互換性がないと思い始めました。

6台の新​​しいハードドライブを購入するのはテーブルの安価なオプションの1つだったので、IBM / Lenovo RAIDコントローラーは通常のドライブで動作する可能性が高いという理論の下で、6台の日立(別名IBM、別名Lenovo)ハードドライブに行きましたで販売。

その予感は報われたように見えます-どんな種類のI / Oエラーも発生することなく、最も重い3日間(月、火、水)を過ごしました。これに先立ち、この時間枠で少なくとも1つのI / O "イベント"が定期的に発生していました。ハードドライブのブランドを切り替えると、断続的なRAID I / Oの問題が修正されたようです。

IBM / Lenovoはおそらく自社ブランドのハードドライブでのみRAIDコントローラーをテストすることを理解していますが、RAIDコントローラーが特定のブランドのハードドライブでこのような微妙なI / Oの問題を抱えることに不安を感じています。

だから私の質問は、この種のSATAドライブの非互換性はRAIDコントローラーと共通ですか?他のブランドよりも機能するドライブのブランドがありますか、または特定のRAIDコントローラーに対して「検証」されていますか?私は、すべての市販のSATAハードドライブが同様であり、特定のRAIDコントローラー(十分な品質)で適切に機能すると想定しました。

回答:


6

はい、ローエンドのカードとバグの多いドライバーでこれに遭遇しました。ただし、最新のAdaptecブランド変更カードでありません。うわー、私が言うことができるすべてです。考慮すべきことの1つは、RAIDコントローラーよりもドライブのバグかもしれません。

良い答えはありませんが、カードを交換する以外のほとんどのオプションを使い果たしたように見えるので(そしてドライブを交換するとうまくいきました)、トラブルシューティングのために考慮できるいくつかのアイデアがあります:

  • WDドライブはRE(RAID Edition)ドライブでしたよね?時間制限付きのエラーリカバリは重要です。そのため、それがなく、ドライブがセクタをリカバリしようとしている場合、そのドライブから一時停止することになります。RAIDコントローラーが忍耐強く、ドライブを落とさない場合、手に大きな問題があります。

  • 取り外したドライブのSMARTデータを確認し、興味深いものがあるかどうかを確認します。

NAS / RAIDベンダーサポートからの、時間制限付きエラー回復(TLER)機能の重要性に関する別のコメント:

前述したように、RAID設定でドライブを使用する場合は、エンタープライズレベルのドライブを使用することを常にお勧めします。エンタープライズレベルのドライブの応答時間はより一貫しているため、RAIDはより安全になります。


知らんが、ここではスペックのタブに表示されるよう、彼らは..「RAID-特定の時間制限エラー回復」を持っていなかったnewegg.com/Product/Product.aspx?Item=N82E16822136143
ジェフ・アトウッド

ええ、あなたは正しいものを手に入れました。(タイトルにリストされているRE2に注目してください。)それはその理論を打ち破ります!もちろん、私はまだ...(ええ、私はそのまれ便利を知っている)念のためにSMARTデータをチェックアウトするだろう
TorgoGuy

結局のところ、ドライブは不安定でした。ブレントOzarは...私たちの古いドライブを継承し、weirdnessesのためにそれらの少なくとも一方でRMAに持っていた
ジェフ・アトウッド

特別なソフトウェアは、彼らが魔法のように「enterprisey」ドライブを作るために反転ビットとして、いくつかのベンダーが表示思わTLER機能のも、興味深い関連の議論.. fatwallet.com/forums/expired-deals/993547
ジェフ・アトウッド

13

非RAID、昔ながらのデスクトップハードドライブでも、ベンダーから(予想されるとんでもないマークアップで)ドライブを購入すると違いが出ることがよくあります。たとえば、Appleは、Mac OS XのF_FULLSYNC fcntl()flag を実際に尊重できるドライブのみを出荷するように注意しています。これは、Time Machineバックアップのようなものが確実に機能するようにするのに大いに役立ちます。

繰り返しますが、これはRAIDを使用しない単純なデスクトップ使用です。それよりも複雑なものを購入したい場合は、ベンダーの高価なドライブではないにしても、少なくともベンダーの「承認済み」リストにあることがわかっているドライブモデルを購入してください。

それで、あなたの質問に答えるために、それは一般的ですか?はい、企業の領域を超えて、あなたが考えるよりも一般的です。


コストを下げるためにDIYドライブのアップグレードを行う場合は、ベンダーが通常販売しているドライブモデルを定義します。また、システムが出荷され始めたばかりのドライブ(またはコントローラー)を購入しないことをお勧めします。そうすれば、バグを見つける人になってしまうことはありません。SATAは...何らかの理由で、この点でSASよりもフレーク状のようだ
クリストファー・エドワーズ

4

それ自体は一般的ではないと思います。ただし、SANまたはスタンドアロンRAIDコントローラーのいずれであっても、エンタープライズストレージコントローラーの使用を開始するとすぐに、通常は互換性リストにかなり厳密に従う必要があります。

安価な範囲のディスクを購入することで、ステッカーの価格をいくらか節約できるかもしれませんが、ほとんどのシナリオでデータの重要性を考えると、それはおそらくお金を節約したい最後の領域の1つです。

つまり、明示的な非互換性は非常にまれですが、互換性の明示的な順守が推奨されます。


4

サーバーにSATAディスクを使用することを夢見ていません。サーバー品質のドライブの予想されるデューティサイクルがなく、ドライブのパフォーマンスと正常性を監視するためのSCSI / SASの豊富なコマンドセットがありません。Lenovoサーバ​​ーは安価で優れており、サーバーの数が多く、そのどれもそれほど重要ではない場合でも、HPの300シリーズサーバーが市場の40%を占めるという理由があります。特に、「SmartArray」ディスクコントローラーは信頼性とパフォーマンスにおいて比類のないものであり、故障前の保証は歓迎すべき追加機能です。一番安くはありませんが、あなたの時間はいくらですか?私は彼らの(よくCompaqの最初のtbhの)サーバーを20年間購入してきましたが、私が毎年500-800台の新しいサーバーを購入しても何の問題もありません。真剣にチェックしてください。


2

答えはいつものように「依存する」です。

特定のエンタープライズストレージ(EMCなど)については、ベンダーはドライブを具体的に認定し、カスタムファームウェアをロードする程度まで進みます。

マークが言うように、ベンダーの承認済みリストがある場合はそれに従うのがベストだと思います。初期コストの節約は、グレムリンを追い詰めようとするのに費やされる時間よりも重要です。


本当ですが、Lenovoの「特別な」Hitachi SATAドライブは250ドルで、同じHitachiドライブを60ドルで購入できます。つまり、ほぼ5倍の差です。つまり、$ 1250対$ 300です。私は..壮大ためのいくつかの実験をしても構わないと思ってる
ジェフ・アトウッド

私はマークアップが時々ばかげていることを知っています、あなたはEMCドライブの価格を見るはずです!しかし、それはあなたがあなたのデータをどれだけ大切にしているのかということです。信頼できるストレージを使用するには、$$$かかります。SmugmugのDon MacAskillがSun 7410について絶賛してきました。
ジャダーホー

サポートされている3wareカードはあるのでしょうか。私は長年彼らと良い経験をしました。
ジョーダーホー

2

SASコントローラーがあり、それが問題の可能性があります。SASプロトコルを使用してATAコマンドをトンネリングすることができますが、物理レベルでのシグナリングは少し異なります(SASはより高い電圧とより広い差動を使用します)。ほとんどすべてのコントローラーは、SATAドライブと直接通信できますが、中央に(大きな?くだらない?)バックプレーンがある場合、信号が中断される可能性があります。通常、SATAドライバーをSASコントローラーに直接接続する企業の世界では公式にサポートされていません。インターポーザー(片方が完全なSASプロトコルを理解し、もう片方がATAを認識するディスクに直接接続する小さなロジックボードを使用する必要があります-このようにして、バックプレーンはより高いSAS信号を伝送します)。

やや関連:SASとSATAドライブを同じバックプレーンで混在させると、すべてのドライブ(SASを含む)の信号がSATAレベルに低下するため、失敗する傾向があります。


1

ほとんどの場合、WDドライブにはファームウェアの更新が必要です。更新のダウンロードおよび適用については、このIBMノートを参照してください。指示からわかるように、WDドライブは問題がある唯一のドライブではありません。

負荷の高いサーバー環境にドライブを配置する場合、一般的な愛好家のデスクトップ構成よりも多くの問題に直面することになります。

Enterprise / RAIDクラスのUltrastarシリーズではなく、デスクトップクラスのDeskstarシリーズのドライブを選択した理由についてコメントしていただけますか?追加の信頼性と速度に見合うだけの追加費用は必要ないと感じますか?


ハードドライブに関して言えば、私はそれらの多くを信じています-安くて簡単に交換可能なアレイで、パフォーマンスはスケールから来ます。
ジェフアトウッド

エンタープライズグレードのストレージコントローラーでデスクトップグレードのドライブを使用する場合は注意してください。エンタープライズグレードのドライブは、(通常)デスクトップグレードのドライブではサポートされていないコマンドや問い合わせをサポートしています。私がかつて受け継いだエンタープライズサーバーはデスクトップグレードのドライブを使用しており、コントローラーがドライブからドライブの温度と正常性の情報を取得しようとしたときに頻繁にエラーが発生しました。エンタープライズコントローラーはエンタープライズドライブを使用すると想定しているため、コントローラーはこれらの問い合わせに応答しなかったドライブを適切に処理できませんでした(サポートされているセットアップではなかったため)。すべて非常にYMMV
bta

0

RAIDコントローラーを使用するエンジニアとして、特定のRAIDコントローラーで問題が発生するブランドのドライブがあることは珍しくありません。すべてのドライブには固有の癖があり、コントローラーの「互換性のあるデバイス」リストにリストされているドライブモデルには、コントローラーによってその癖が考慮されます。ドライブモデルがリストに表示されるためには、コントローラーメーカーのパフォーマンスと信頼性の基準を満たす必要があります。このリストにないドライブは動作する可能性がありますが、「承認済み」デバイスであるYMMVと同じ厳密なテストを行っていないためです。

特に、SATAプロトコルでは、ドライブまたはコントローラーで定義できるベンダー固有の(標準化されていない)コマンドを使用できます。あなたの場合、特定の専用コマンドにドライブが応答することを期待しているコントローラー、または到着しない専用コマンドを表示することを期待しているドライブが表示されている場合があります。

別の可能性は、問題のあるドライブが特定のストレスの多いワークロードの下ではあまりうまく動作せず、Adaptec / IBMがそのドライブモデルをサポートされているものとしてリストしないのに十分な動作です。

残念ながら、ストレージプロトコル(SATA、SASなど)は他の標準化されたインターフェイス(USB、PCIなど)ほど優れていません。必要なのは同じ言語を話すバスとデバイスだけで、すべてが順調です。特にエンタープライズグレードの機器に関しては、デバイスメーカーとドライブメーカーは多くの共同作業に時間と労力を費やし、顧客が大部分の顧客が使用する構成から可能な限り最高のパフォーマンスを得るようにします(つまり、 「サポートされているデバイス」リスト)。そのリストにないドライブは、異なるブランドのコントローラーで最適に動作するように設計されている可能性があり、表示されているエラーは最適化の副作用です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.