シャーシが完全に故障する可能性は低いです...
ブレードエンクロージャの完全な障害を維持する前に、施設で問題が発生する可能性があります。
私の経験は、主にHP C7000およびHP C3000ブレードエンクロージャに関するものです。また、DellおよびSupermicroブレードソリューションも管理しました。ベンダーは少し重要です。しかし、要約すると、HPのギアは素晴らしいものであり、Dellは素晴らしく、Supermicroは品質、弾力性に欠け、設計が不十分でした。HPとDell側で障害を経験したことはありません。Supermicroには深刻な機能停止があり、プラットフォームを放棄せざるを得ませんでした。HPとDellでは、シャーシの完全な障害に遭遇したことはありません。
- 熱イベントがありました。コロケーション施設で温度が10時間115°F / 46°Cに達すると、空調が失敗しました。
- 電力サージと回線障害:A / Bフィードの片側が失われます。個々の電源障害。通常、ブレードのセットアップには6つの電源があるため、十分な警告と冗長性があります。
- 個々のブレードサーバーの障害。1つのサーバーの問題は、エンクロージャー内の他のサーバーには影響しません。
- シャーシ内火災 ...
さまざまな環境を見てきましたが、理想的なデータセンターの条件でインストールするという利点がありました。HP C7000およびC3000側で考慮すべき主なことは、シャーシが完全にモジュール式であることです。コンポーネントは、ユニット全体に影響を及ぼすコンポーネント障害の影響を最小限に抑えるように設計されています。
このように考えてみてください...メインC7000シャーシは、フロント(パッシブ)ミッドプレーンアセンブリとバックプレーンアセンブリで構成されています。構造的エンクロージャーは、フロントとリアのコンポーネントを単に保持し、システムの重量を支えます。ほぼすべての部品を交換することができます...私を信じて、私は多くを分解しました。主な冗長性は、ファン/冷却、電源、および管理のネットワーク化です。管理プロセッサー(HPのOnboard Administrator)は、冗長性のためにペアにすることができますが、サーバーはそれらなしで実行できます。
フル装備のエンクロージャ-正面図。下部にある6つの電源装置は、シャーシの深さいっぱいに広がり、エンクロージャーの背面にあるモジュラー電源バックプレーンアセンブリに接続します。電源モードは構成可能です:3 + 3またはn + 1など。そのため、エンクロージャーには確実に電源の冗長性があります。
フル装備のエンクロージャ-背面図。背面のVirtual Connectネットワークモジュールには内部クロスコネクトがあるため、どちらか一方が失われても、サーバーへのネットワーク接続を維持できます。ホットスワップ可能な電源装置が6台、ホットスワップ可能なファンが10台あります。
空のエンクロージャ-正面図。エンクロージャのこの部分には実際には何もないことに注意してください。すべての接続は、モジュラーミッドプレーンにパススルーされます。
ミッドプレーンアセンブリを取り外しました。下部のミッドプレーンアセンブリの6つの電力供給に注意してください。
ミッドプレーンアセンブリ。これは魔法が起こるところです。16の個別のダウンプレーン接続に注意してください。各ブレードサーバーに1つです。エンクロージャー全体を殺したり、他のサーバーに影響を与えたりすることなく、個々のサーバーソケット/ベイに障害が発生しました。
電源装置のバックプレーン。標準の単相モジュールの下にある3øユニット。データセンターの配電を変更し、電源バックプレーンを交換して、新しい配電方法に対処しました
シャーシコネクタの損傷。この特定のエンクロージャは、組み立て中に落下し、リボンコネクタのピンが破損しました。これは何日も気付かれず、実行中のブレードシャーシがFIREをキャッチしました...
ミッドプレーンリボンケーブルの黒焦げのままです。これにより、シャーシの温度と環境の監視の一部が制御されました。ブレードサーバーは、問題なく稼働し続けました。影響を受けた部品は、予定されていたダウンタイム中に私の余暇に交換され、すべてが順調でした。