RAID 5構成でドライブ障害から回復する方法は?


15

今朝、データベースサーバーでドライブに障害が発生しました。ドライブアレイ(3台のディスク)は、RAID 5構成でセットアップされています。

ドライブの交換を待つ間、回復戦略の準備を進めています。ユーザーは非常にゆっくりですが、システムでの作業を続けています(理由が分からないのですか??)。

新しいドライブをどのようにインストールしますか?このドライブのデータはパリティから自動的に再構築されますか、それとも別のプロセスに従う必要がありますか?

編集: これはハードウェアRAIDコントローラーです。(これまでの回答に感謝、感謝)


4
ところで、重要なサーバーでドライブに障害が発生した場合の対処方法を決定する時は、重要なサーバーでドライブに障害が発生する前です。
デビッドシュワルツ

回答:


15

追加のCPUおよびI / Oを含む欠落データを再構築する必要があるため、システムの実行は非常に遅くなります。

RAID-5構成でディスクが欠落している場合、リカバリ戦略はありません。別のディスクがダウンした場合、あなたはあなたのデータが失われます。歩いてはいけない、最寄りのベンダーまで走ってください。そこから、同日中の緊急宅配便で発送されるメーカーの保証の対象となる互換性のある部品を入手できます。アレイを購入したベンダーがすでに部品を入手している場合は、両方の部品を入手し、もう一方をスペアとして隠しておきます。

本番システムにRAID-5を使用している場合は、アレイ内のスペアディスクをホットスペアとして残すことを検討する必要があります。

追加-ログが個別のボリューム(物理的に個別のディスク)にない場合、単一のミラーペアであっても、個別のディスクセットにログを移動します。また、ログボリュームの競合がパフォーマンスに不釣り合いに悪い影響を与えるため、データベースに大きな負荷がかかっている場合にも、パフォーマンスが向上します。

これが可能な場合は、次を実行してデータベースをより堅牢にすることもできます。

  1. データベースをシャットダウンします。
  2. データベースをバックアップします。
  3. ログを物理的に別個のディスクセットに移動します(データベースがログの移動先を認識できるように、データベースを再構成してください)。
  4. データベースとアプリケーションを再起動します。

ログが別のボリュームにある場合、ディスク障害によってログが損なわれない場合にのみ、バックアップから復元およびロールフォワードできます。データベースログは、次の理由から(特に)別のディスクボリュームに置く必要があります。

  • ログの使用パターンは主にシーケンシャルであり、ファイルの最後にログエントリを追加します(ファイルは実際にはリングバッファーです)。これは、ディスクヘッドシークアクティビティがほとんどないため、多数のログエントリをすばやく書き出すことができることを意味します。

  • ランダムアクセスワークロードが非常に大きい物理ディスク(トランザクションテーブルやインデックスなど)を共有している場合、ヘッドシークアクティビティが順次書き込みを中断するため、不均衡に速度が低下します。

  • ログを別のボリュームに保持することは、ほとんど常にパフォーマンスの向上につながり、非常に重いワークロードをサポートするためにログに必要なミラーペアは1つだけです。これは、それを行うためのハードウェアが非常に安価であることを意味するため、大きなパフォーマンスと信頼性を得るためのコストはわずかです。

  • データ配列がダウンしても、ログは失われません。適切なバックアップ戦略がある場合は、バックアップから復元し、ログから先に進むことができます。つまり、単一障害点にならずに、アレイ全体がサーバー上でダウンする可能性があります。データ損失を引き起こすには、ログとデータの両方のアレイに同時に障害が発生する必要があります。


特にシステムの動作が遅い理由を説明してくれた回答をありがとう。
フィリップフォーリー

スポットオン。交換用ドライブを設置するまで、シャットダウンすることをお勧めします。ナイジェルが言うように、回復戦略はありません。別のドライブを失い、すべてを失います。
ストゥトンプソン

こんにちはNigel、時間をかけてあなたの専門知識を共有してくれてありがとう。それは確かに素晴らしいアドバイスです。復旧の結果については後で報告します。
フィリップフォーリー

5

1)バックアップ。

現在、データは失われていません。バックアップが最新のバックアップではない場合。

2)マニュアルを読み、ベンダーに電話するなど。

異なるRAIDシステムには、ディスクを交換するための異なるステップがあり、間違って実行するとアレイ全体を破壊する危険があります。使用しているRAIDハードウェア/ソフトウェアの種類がわからない場合、必要な手順だけを推測できます。

また、パフォーマンスが低下するのは、RAID 5の機能が低下した状態(つまり、1つのディスクが死んだ状態)の読み取りパフォーマンスがひどいためです。どのくらい恐ろしいのかは、パリティの保存方法とどのディスクが死んだかに依存しますが、「良い」ニュースは、1台のディスクがなくなってパフォーマンスが低下することは既知の問題であり、パニックの原因ではありません。


4

まず、使用しているハードウェア/ソフトウェアのマニュアルを読みます-障害回復のセクション:)

ただし、ディスクを交換し、アレイを再構築するだけの簡単な問題です。

そのような場合の最も重要な点は、別のディスクに障害が発生するとデータが失われる可能性があるため、できるだけ早くディスクを交換することです。また、障害の原因に対処する必要があります-ディスクが古くなっていたためですか?他のものも交換する必要がありますか?それとも、電力サージ、熱、または振動が原因でしたか?


1
おそらくデータを失いますか?アレイ上のすべてのデータは間違いなく失われます!刑務所に行き、囲passを渡さないでください。(もちろんバックアップは別として。)
ストゥトンプソン

1

RAID5を理解している限り、故障したドライブを交換すると、他の2つのドライブに保存されている情報から自動的に再構築されます。新しいドライブを所定の位置に「ホットスワップ」できるかどうかは、システムによって異なります。最初に電源を切る必要があります。どちらにしても、ドライブのコストが比較的低いことと、データの重要性を考慮して(そもそもRAID5を使用するという決定を反映)、実際には予備のドライブを用意し、引き出しに座って、そのような事態に備えてください。

私は最近、自分用に新しい開発用PCを構築し、メインデータドライブをRAID5でセットアップしました。緊急事態に備えて予備を用意するために、必要以上に1台のドライブを注文しました(発生しないことを望んでいます)

さて、あなたは質問をしました。私はこのテーマについてもう少し読んだ方が良いと思います。


通常、小さなデータボリュームの場合、ミラー化されたペアは、小さなRAID-5よりもシーケンシャルアクセス速度が優れているため、優れています。あなたはホットスワップにしたい場合は、scsi4me.comのようにどこかにホット・スワップ・ベイ・システムのいくつかを見て
ConcernedOfTunbridgeWells

0

完全にシステムに依存します。マニュアルには何と書かれていますか?お使いのハードウェアは、コントローラーからドライブベイへの新しいドライブのホットプラグを完全にサポートしていますか?最近のバックアップはありますか?


0

NXCの投稿はそれをうまくまとめています。2番目の障害が発生する前に障害のあるドライブを交換しない場合に備えて、ほとんどすべて(場合によってはすべて)が専用の回復サービスによって回復される可能性があります。データはまだディスク上にあり、故障したディスクは通常、適切な機器を備えた専門のラボで復活させることができます。しかし、このサービスの価格は非常に高いです。スペアディスクと適切なバックアップ(NXCの提案に従って)を用意することは、間違いなく今後の方法です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.