Unix & Linux xen

2

しつこいに関するいくつかのバグレポートと質問（stackexchangeなど）を見てきました"BUG: soft lockup - CPU#<n> stuck for <dt>s!"。これまでのところ、私は何をすべきか、または何をしようとするかについての手がかりを見つけていません（むしろ、私が見つけて従った手がかりはこれが起こるのを止めていません）。私はこれについてさらに心配しています：これらのイベントの頻度は、最近ゆっくりと増加しているようです（月に700以上）。 yum update 再起動すると少し遅くなりましたが、いくつかのロックアップが再び発生し始めています。いくつかのプロセス（ホスト全体ではないにしても、わかりにくい）、確かにすべてのインタラクティブシェルが含まれている場合、それが発生すると、しばらくの間フリーズします。それが関連しているかどうかはわかりませんが、ntpdに関連する多くのログ/メッセージが時計を更新できないことがわかります。以下は、の抜粋です$(grep 'soft lockup' /var/log/messages*)。 Mar 22 10:02:35 localhost kernel: BUG: soft lockup - CPU#15 stuck for 10s! [kjournald:1048] Mar 22 10:02:36 localhost kernel: BUG: soft lockup - CPU#0 stuck for 10s! [postgres:5372] Mar 22 10:02:36 localhost …

33 centos xen amazon-ec2

3

恐ろしい状況-複数の独立したOSインスタンスによって同時にマウントされたファイルシステム

この状況から安全に抜け出すにはどうすればよいですか？詳細は次のとおりです。 xenサーバーには、VMにブロックデバイスが割り当てられています。ただし、これらのデバイスはXen内にもマウントされています。実際、これらのブロックデバイスのうち44個がこのようにマウントされています。さらに悪いことに、各物理デバイスは4つのパス上にあり、それぞれが個別のマウントポイントにマウントされています。つまり、デバイスは実際に各5回マウントされます。 VMゲストOSは、PowerPath擬似デバイスを介してパスを認識します（phy：ブロックデバイスとしてdomUに割り当てられます）一部のデバイスは、ext2およびreiserfsとしてフォーマットされています。ここで関係するファイルシステム破損のリスクについて説明する必要はありません。ファイルシステムをアンマウントするだけでも破損が発生する可能性があることを恐れており、この時点でホストから電源を引き出すことが最も安全なオプションであると感じています。すべてのVMのアプリケーション（ほとんどの場合Oracleデータベース）は、まだ実行中で使用中であることに注意してください。これは、dom0での高いCPU使用率を調査したときに発見されました。/ dev / emcpowerrに属する/ dev / sdf1からマウントされたcwd-> / media / disk-12を使用した、強制終了できない「検索」プロセスがあります。誰かが尋ねる前に、一度プロセスを殺すことができず、CPUとRAMを使用し続けることができません（無効/ゾンビプロセスとは異なります）。。より一般的には、テープI / Oで発生します。提案！？ PSこの種のことを防ぐために、デバイスがマウントされると「予約」されると予想していましたか？それともLinuxでは不可能ですか？編集：まず、ハイパーバイザー内のKDEが原因だと確信しています。KDEは、ログに記録できるデバイスをマウントしてデスクトップアイコンを作成しているようです。ただし、他のXenサーバーでは同じことは起きていませんが、他のすべてのサーバーははるかに古いバージョンのSLESおよびKDEを実行しています... さらに、2つの重要ではないVMがハングしました。それらをシャットダウンした後、ファイルシステムの破損のために再起動しませんでした。メイン/実稼働VMはまだ実行中で、その上のデータベースはまだ動作していますが、明らかにこれは時限爆弾です。お客様は、別のサーバー上の別のVMで環境を再構築しようとしていますが、一部のコンポーネントの構成に関する問題に固執しているため、お待ちしています... いずれにせよ、これまでのところ「ベストプラクティスは常に適切にシャットダウンされる」以上の答えはなかったと感じています。考え。シャットダウンすると、未処理のIO、特にハイパーバイザーからのファイルシステムメタデータの更新が同期され、ファイルシステムが破損する可能性がありますか？

14 filesystems xen disk unmounting

3

スチールタイム（st）を監視するためのツール

私たちは仮想の「専用」サーバーで実行しています。これは、理論上、サーバー上にいるのは私たちだけであることを意味するはずです。実際には…。マシンを殺しているように見えますが、「スチール時間」は71％です。負荷に関する統計情報を取得していますが、この統計情報がグラフに表示されないことに失望しました。これを監視し、支援できるツールはありますか？追加情報： 4つのコア、モデルを実行しています： # grep "model name" /proc/cpuinfo | sort -u model name : Intel(R) Core(TM)2 Duo CPU E7500 @ 2.93GHz

12 xen top virtualization

2

KVMまたはXenのGPGPU / CUDA

KVMまたはXen（またはCitrix Xenserver）内でCUDA対応のGPUに直接アクセスできるようにしたいと考えています。具体的には、PCIパススルーを使用して、4つのTesla C2050デバイスで構成されるNVIDIA Tesla S2050ユニットにアクセスします。Xenserver 5.6がSLIマルチOS対応のGPUをサポートしていることは承知していますが、私の理解では、C2050はSLIマルチOSデバイスではありません。私が経験したパフォーマンスとメンテナンスの問題のため、RPCのようなソリューションは避けたいと思います。 Amazon EC2は、Tesla M2050 GPUを備えたXen VMを提供します。これは、C2050と非常によく似ているため、私がやりたいことは可能であると思われます。KVMまたはXenから非SLIマルチOS GPUをLinux VMに渡し、CUDAアプリケーションを正常に実行した人はいますか？その場合、どの仮想化ソリューションを使用し、どのGPUを使用しましたか？

8 kvm nvidia xen

2

KVM / Xenボックスを設定するための優れたチュートリアルとどちらが良いかについてのアドバイス

専用の仮想環境にしたい、デュアルxeon、2GB、75GBのhdサーバーがあります。現在、私はVirtualBoxをローカルで使用して、CassandraおよびNginx / Haproxyのモッククラスターを実行していますが、システムに過負荷がかかり始めています。このボックスでArchを実行し、すべてのVMを管理するKVMまたはXenを備えた最小限のデスクトップ環境を用意したいと思います。優れたチュートリアルを知っている人はいますか、それとも基本的なArchのインストールを実行してから、Xen / KVMのセットアップとマシンの管理のための優れたチュートリアルを見つけますか？また、このタイプの環境に適しています。セットアップと管理がはるかに簡単なのでkvmを使用する方法を読んだことがありますが、Xenでハードウェアをよりうまく利用できれば、セットアップが難しくなってもかまいません。

8 linux virtual-machine kvm xen

タグ付けされた質問 「xen」

タグ付けされた質問「xen」