それで、私は別の質問をします:
プロビジョニングの前にサーバーでHP Insightハードウェア診断を実行する必要があるのはなぜですか?
上記の私のコメントで、大規模なHP ProLiant環境で先制的にこれを行うことによって得ることはほとんどないことを示しました。私はそれについて私の考えを明確にする必要があります...
頻度の降順で、通常発生する問題の種類を見てみましょう。
ストレージアレイとディスク:RAIDコントローラーはOS、ログ、SNMP、電子メール、ILOに報告し、かなりのライトを点灯して正常性を示します。
RAM:POSTプロセスは、RAMステータス、およびOS、ログ、SNMP、電子メール、ILOへのシステムレポートを検出し、フロントパネルのSystems Insight Display(SID)の LEDインジケーターを点灯させます。また、これらのシステムのエラー検出はすでに堅牢であるため、私はRAMバーンインプロセスのファンではありません。
温度とファン:サーバーの温度とファンの速度は、ILOによって調整されます。これらのシステムには30以上の温度センサーがあるため、冷却システムは非常に効率的です。これは引き続き、OS、ログ、SNMP、電子メール、およびSIDに報告します。
電源:PSUステータスは、OS、ログ、SNMP、電子メール、およびSIDと、実際の電源ユニットの実際のインジケーターライトに報告されます。
全体的なヘルス:これは、内部ヘルスLEDと外部ヘルスLEDに加えて、SIDディスプレイで一目で簡単に評価できます。これは、サーバーのログ、SNMP、電子メール、およびILOにも報告されます。
実行時またはOSのインストール後にレポートされない、またはレポートできなかった、展開前に見つかる条件は考えられません。
診断ループは、通常、明確な以前の問題がないシステムで実行しても何も検出しません。これは主に、サーバーがユーティリティを実行するために、ユーティリティまたはIntelligent Provisioningファームウェアを起動して起動する必要があるためです。
別の言い方をすると、サーバーにとって深刻な「SPOF」となる項目は、おそらくシステムが自己診断を実行することを妨げます。
最も一般的な障害項目はまだかなり堅牢です。ディスクはRAIDである必要があり、ホットスワップ可能です。ファンと電源もホットスワップ可能です。RAMにはECCしきい値があり、ほとんどのProLiantプラットフォームにはオンラインスペアオプションがあります。診断を実行してこれらのコンポーネントの障害を引き起こすためにできることは何もありません。内部冗長性があるHP C7000ブレードエンクロージャーを使用しており、障害の発生率がかなり低いはずであるという事実を追加します。