私は、AdaptecおよびLSI MegaRAIDハードウェアRAIDコントローラーを装備した多くのSupermicroサーバーを含む環境にいます。これらのコントローラーには、バッテリバックアップ式キャッシュモジュールが含まれており、書き込みパフォーマンスを向上させ、転送中のデータを保護します。
頻繁にサポートされる問題は、RAIDコントローラーのバッテリー障害です。これにより、アレイがライトバックモードからライトスルーモードに移行します。システムの書き込み速度が低下すると、明らかにパフォーマンスが低下します。これは、システムの電源を切ってバッテリーを交換するためのダウンタイムウィンドウが確立されるまで続きます。
これは私たちにとって非常に日常的な操作です。数千台の物理サーバーでほぼ毎週 ...充電サイクルなしで交換できるように、交換用バッテリーを準備するための充電ステーションも設置されています。
おそらく、HP ProLiantサーバーとSmartアレイRAIDコントローラーの長い歴史に甘やかされていますが、HPシステムのバッテリー寿命は通常4〜6年でした。最終的には、2009年頃にRAIDバッテリーの使用を廃止しました。スーパーキャパシタでバックアップされたメモリモジュール(フラッシュバックアップ式書き込みキャッシュ、またはFBWC)に置き換えられました。
AdaptecおよびLSIコントローラーのバッテリー障害は、 12か月未満稼働しているシステムで時々発生するのを見るので、これは他の環境で一般的かどうか疑問に思います。
これが一般的な場合、他の大規模なサーバー環境はこれをどのように処理しますか?
- RAIDバッテリーの交換を処理するためのヒントやコツはありますか?
- 役立つ構成パラメーターはありますか?
- これは、環境内の運用に対してどれほど破壊的ですか?
- シャーシの冷却と温度の低下が要因になる可能性がありますか?
- 私たちは何か間違ったことをしていますか?
- Dell PERCコントローラは、LSIによって作成されています。Dell環境では、同じ短いバッテリ寿命が発生しますか?
1年以上使用できる新世代バッテリーの概要を示すLSI製品資料。
HP ProLiant DL585 G2サーバーは、1000日以上の稼働時間とRAIDバッテリーを搭載しています...
# uptime
05:38:08 up 1031 days, 44 min, 31 users, load average: 0.49, 0.64, 0.99
# hpacucli
Cache Board Present: True
Cache Status: OK
Accelerator Ratio: 50% Read / 50% Write
Total Cache Size: 512 MB
Battery Pack Count: 1
Battery Status: OK