HP ProLiant Gen9用のMTTF、MTBF、MTBR、およびMTBF


14

実稼働環境で実行されているHP Gen9サーバーのMTTF、MTBF、MTBR、およびMTBFを調査しました。

私の質問の根源は、心配する必要がありますか。

各サーバーにはハードウェアが混在しているため、適切なデータを取得できないようです。

私の最後の会社では、約2000台のデルサーバーr210 r410 r710を実行しましたが、平均して1日に約5台のサーバーに何らかの障害が発生しました。そのため、サーバーの約0.25%がハードダウンし、再び使用する前に部品を交換する必要がありました。

私の最後の会社はすべて、HAペア、N + 2インフラストラクチャでセットアップされていたため、本番環境への影響はありませんでした。サーバーを交換し続けました

私の現在のオフィスでは、9台のサーバー(HP Gen9、56 VMのHyper-V)を実行していますが、多くの交換部品は手元に置いていません。何でも。

私のCTOもITマネージャーも心配しているようです。昨年は約2.5日間のダウンタイムがあり、サーバーをクラスター化する必要があると断言してきましたが、ニーズはありません。

間違っているか、ここにありますか?何をすべきかわからない。

CTOで何かが発生した場合、それは私の責任ではありません。これは非常に小さな会社で、CTO、ITマネージャー、私(開発者)、ヘルプデスク担当者1人のみです。

実稼働環境の実行に関するすべての経験は非常に限られており、多くのことを設定する方法は非常にジュニアレベルと呼ばれますが、CTOもITマネージャーもそこに着く前にクラスタリングについて多くのことを知りませんでした。彼らは、HAなしでDRをセットアップするプロジェクトの最中にありました。


HAにはお金がかかります。たぶん、彼らはお金の価値がないと思います。
マイケルハンプトン

回答:


3

MTTF、MTBF、MTBR、およびMTBFの数字について心配する必要はありません...なぜそれらが環境の詳細に適用されるのでしょうか?

サーバーには内部冗長性があり、実稼働環境では非常に安定しています。ただし、それは環境、ディスクアレイ/構成、ディスクの種類、RAMの量、CPU構成、熱特性、電力などによって異なります。

何らかの形の高可用性を採用すると、ダウンタイムの可能性減らすことができ、障害が発生した場合にワークロードをシフトする場所が提供されます。

これは、財務上および運用上のリスクの質問です。

おそらく、スタンドアロンからクラスターに移行するための増分コストは十分に高く、ビジネス上意味がありませんか?おそらく、2.5日間のダウンタイム(〜99.3%の可用性)が運用に十分です。オフサイト保護と適切なバックアップに集中する必要があります。お使いのHP Gen9システムはすべて、メーカーの保証の下で今日、あなたが行いますの部分へのアクセス権を持っています。RAID、冗長電源/ファン、および安定した電源がある場合、最も重要な領域をカバーしています。

財務の観点からこれを考え、リスク、関連するコストを概説し、あなたが望むもののための説得力のあるビジネスケースを作成してみてください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.