恐ろしい状況-複数の独立したOSインスタンスによって同時にマウントされたファイルシステム

この状況から安全に抜け出すにはどうすればよいですか？

詳細は次のとおりです。

xenサーバーには、VMにブロックデバイスが割り当てられています。ただし、これらのデバイスはXen内にもマウントされています。

実際、これらのブロックデバイスのうち44個がこのようにマウントされています。さらに悪いことに、各物理デバイスは4つのパス上にあり、それぞれが個別のマウントポイントにマウントされています。つまり、デバイスは実際に各5回マウントされます。

VMゲストOSは、PowerPath擬似デバイスを介してパスを認識します（phy：ブロックデバイスとしてdomUに割り当てられます）

一部のデバイスは、ext2およびreiserfsとしてフォーマットされています。

ここで関係するファイルシステム破損のリスクについて説明する必要はありません。

ファイルシステムをアンマウントするだけでも破損が発生する可能性があることを恐れており、この時点でホストから電源を引き出すことが最も安全なオプションであると感じています。

すべてのVMのアプリケーション（ほとんどの場合Oracleデータベース）は、まだ実行中で使用中であることに注意してください。

これは、dom0での高いCPU使用率を調査したときに発見されました。/ dev / emcpowerrに属する/ dev / sdf1からマウントされたcwd-> / media / disk-12を使用した、強制終了できない「検索」プロセスがあります。

誰かが尋ねる前に、一度プロセスを殺すことができず、CPUとRAMを使用し続けることができません（無効/ゾンビプロセスとは異なります）。。より一般的には、テープI / Oで発生します。

提案！？

PSこの種のことを防ぐために、デバイスがマウントされると「予約」されると予想していましたか？それともLinuxでは不可能ですか？

編集：まず、ハイパーバイザー内のKDEが原因だと確信しています。KDEは、ログに記録できるデバイスをマウントしてデスクトップアイコンを作成しているようです。ただし、他のXenサーバーでは同じことは起きていませんが、他のすべてのサーバーははるかに古いバージョンのSLESおよびKDEを実行しています...

さらに、2つの重要ではないVMがハングしました。それらをシャットダウンした後、ファイルシステムの破損のために再起動しませんでした。メイン/実稼働VMはまだ実行中で、その上のデータベースはまだ動作していますが、明らかにこれは時限爆弾です。お客様は、別のサーバー上の別のVMで環境を再構築しようとしていますが、一部のコンポーネントの構成に関する問題に固執しているため、お待ちしています...

いずれにせよ、これまでのところ「ベストプラクティスは常に適切にシャットダウンされる」以上の答えはなかったと感じています。考え。シャットダウンすると、未処理のIO、特にハイパーバイザーからのファイルシステムメタデータの更新が同期され、ファイルシステムが破損する可能性がありますか？

— ヨハン
ソース

現在、「シャットダウン」前に行われたバックアップは、おそらく破損したデータを単にバックアップする可能性がありますが、この状況では、ファイルの内容ではなくファイルシステムのメタデータが破損している可能性が高くなります。

— ヨハン

いずれにしても、少なくとも一部のデータが失われると思います。ホストを物理的にオフにしたり、VMを強制的に終了すると、すべてを台無しにするという望ましくない結果が生じる可能性があります（つまり、一度だけマウントされるファイルシステムも）。損失を最小限に抑えるために、すべてを可能な限りきれいに終了しようとするでしょう。そしてもちろん、それが二度と起こらないことを確認します。

— ペテルフ

それを防止するために、IIUC はゲストによって開かれた後、dom0のデバイスにアクセス許可を設定しようとするかもしれませんが、fsのアクセス許可（デバイスファイルに対する）はルートによって渡される可能性があるため（パッチを適用したカーネルがない場合）助ける必要はありません。

— ペテルフ

あなたの投稿スクリプトに関して：デバイスが複数のパスを通して見える場合、カーネルはおそらくそれらがすべて同じデバイスであることさえ知らないので、どうしてそれを「予約」できますか？デバイスをdom0から複数のdomUにエクスポートする場合、実際にデバイスをサポートしたい場合（たとえば、デバイスをサポートするファイルシステムを使用したり、どこでも読み取り専用でマウントしたい場合）に行うことができます。

— セラダ

@Celada私はそうは思いませんでしたが、デバイスを「ロック」する方法があります：PowerPathは（Solarisの場合は）デバイスのすべての親パスを予約する必要があります（初期化するとき）。さらに、SCSI「予約」コマンドはターゲットデバイスによって管理されるため、ターゲットが予約されると、そのデバイスのパスに対する予約の許可を拒否する必要があります。少なくともそれは私の限られた理解です。

— ヨハン

回答:

ディスクが単一のマウントポイントから書き込まれている場合、害はありません。クリーンシャットダウンを実行します（中断する場合は中断状態からバックアップします）。マウントを修正します。Dom0で必要なアプリ以外は実行しないでください。OTOHパーティションが複数のパスから書き込まれている場合、それは悪いことであり、1秒ごとに悪化します。プラグを抜く。

— エイリアンの生命体
ソース

私には具体的な理由はありませんが、私の直感は次のことが最善のアプローチかもしれないことを教えてくれます：

アプリケーションをシャットダウンします。
ネットワークを介してVMからすべてのデータをバックアップ場所にコピーします。
VM内からファイルシステムをアンマウントします。
VMをシャットダウンします。（現在、このホストで実行されているVMは1つだけです）。
domUが自動的に開始するように設定されていないことを確認します。
ホストの電源を切り、ハイパーバイザーが「クローズ」アクション、未処理のI / Oの同期などを実行しないようにします。
VMを起動し、ハイパーバイザー自体がパワーヤンクに耐えることを期待します。
失敗した場合は、環境を再構築します。（VMのブートディスクはファイルベースですが、データマウントポイントはブロックデバイスとして割り当てられた外部ディスクに存在します）
ハイパーバイザーがdomUに属するファイルシステムをマウントしているかどうかを確認します。domUを開始する前にこれらのマウントを解除してください）
KDEの自動マウントをオフにします。
VMを起動し、完全なFSチェックを強制します。

11の代替：VMを起動し、完全なfsckなしでファイルシステムをマウントします。

理由は、domUファイルシステムで破損を引き起こすために絶対に必要なXenハイパーバイザーにこれ以上のチャンスを与えたくないからです。

— ヨハン
ソース

私はXenの専門家ではなく、まだ経験がありません。しかし、私があなたの場所にいた場合の私のアプローチは、次のとおりです。次に、スナップショットを作成してからVMを一時停止し、安全な別の環境に復元します。
私はあなたに間違った希望を与えたくありませんが、何かを回復できれば幸運になると思います。

警告：これらのアドバイスに従うと、すべてのデータが失われる可能性があります。これは、リスクに見合うかどうかを判断するのはあなた次第です。

運が良ければ、使用しているデータはすべて揮発性メモリにあるため、アプリケーションはまだ動作しています。この状況を利用して（アプリごとにその可能性があるかどうかを評価してください）、アプリケーションがそのような機能を提供する場合は、ライブデータをネットワーク共有にエクスポートしてください。データがディスク上にある場合、このエクスポート機能findは、変更または破損したディスクデータのために、ステートメントのように「ロック」されるか、クラッシュ（およびアプリケーションまたはOSのクラッシュ）する可能性があります。

その後、ライブスナップショットを試すことができます。次の記事の指示に従ってください：Xenでのスナップショットの作成。あなたのfindコマンドのようにスタックする可能性はありますが、バイト単位のスナップショットに行きます...しかし、私はこれほど希望を与えません。

前のコマンドを実行する前に、Xen（PDF）のスナップショットの理解に役立つこのドキュメントをCitrixから読む必要があります。

がんばって。

— ホイヘンス
ソース

ありがとうございました。顧客にはデータベースのエクスポートがあります。FTPを使用してVMから取得しただけだと思いますが、ネットワーク共有をマウントし、そこに直接エクスポートすることは可能です。

— ヨハン

私はVMを一時停止してから別のホストにフルコピーを取得し、a）スリープ状態から再開するか、b）起動してから再起動とfsckを試みるというアイデアをいじっていました。アイデアは、元のホスト上に一時停止されたVMがあるため、コピーが他のホスト上で機能しない場合、そのVMを再開できる可能性があるということです。

— ヨハン

また、バックアップに戻る際の問題は、過去2か月間に行われたすべてのバックアップが破損していることが懸念されることです。

— ヨハン

@Johanこれはおそらく事実以上であり、ほとんどの場合（問題が発生したため）が破損しているとは限りません。同じことがデータベースのエクスポートにも当てはまる場合があります。幸運を祈ります、あなたはそれを必要とします！

— ホイヘンス