HyperV VMの接続がランダムに失われるのはなぜですか?


10

約2週間に1回、奇妙な断続的な接続の問題が発生しています。

最初の構成:2つの物理ホスト(node01とnode02)を持つHyperVフェールオーバークラスターを実行しています。ホストは両方とも、SP1が適用されたWindows Server 2008 R2 HyperVサーバー(無料のサーバー)を実行しています。これらのホストでは、Windows Server 2008 R2 WebエディションSP1を実行する2つのVMを実行しています。ストレージサーバーは、iSCSIを介して接続されたWindows Storage Server 2008です。ホストとストレージサーバーの両方で、インテルのWebサイトから直接ダウンロードされた最新のネットワークドライバーが実行されています。

ここに問題があります:99.99%の時間、すべてが完全に動作します。2〜3週間に1回程度、VMは両方とも着信と発信の両方で同時にネットワーク接続を失います。これが起こるとき、

  1. どちらのVMにもRDPできません。
  2. どちらのホストにもRDPできます。
  3. ノードを右クリックして[仮想マシンに接続]を選択すると、フェイルオーバークラスターマネージャーからどちらのVMにも接続できます
  4. 上記の#3で説明したようにVMに接続すると、LAN上のWebサイトやマシンにアクセスできなくなります。VM内の仮想ネットワーク接続を無効にしてから再度有効にしても、問題は解決しません。
  5. VMを別のノードに移動すると、問題が修正されます(今後2週間)。
  6. ホストを再起動してVMをホストに戻すと、問題が修正されます(今後2週間)。
  7. この場合、フェイルオーバークラスターはVMを自動的にフェイルオーバーしません。
  8. ホストまたはVMのいずれにも異常なイベントログエントリはありません。

これは、上記と同じ症状で約5回発生しました。ネットワークドライバーまたはネットワークハードウェアの問題だと思いますが、既に最新のドライバーを実行しているので、どうすればよいかわかりません。

これは本当のスクラッチャーです...何かアイデアはありますか?

更新

私はここで非常に似たケースを見つけました:Virutal MachineがHyper V Clusterのネットワーク接続を失います

2011年7月29日更新

修正プログラムをインストールしてネットワークドライバーを更新した後も、同じ問題が発生します。ハードウェアの詳細を求めるコメントに応えて、サーバーはIntel SR1670HVです。これは、2つの独立したS5500HVマザーボードを含む1Uシャーシです。通信は、Intel 82574Lであるマザーボードの内蔵NICを介して行われます。ネットワークドライバはバージョン16.2.49.0です。


ハードウェアに関する詳細(nicsの数)を追加できますか
Jim B

サーバーにはどのブランド/モデルのNICがありますか?
クリスS

上記で追加されたハードウェアとNICに関する情報。
マイク

接続しているブランド/モデルスイッチは何ですか?
ErnieTheGeek

MS hyperVサーバー上のCentOSイメージで同様の問題が発生しました。各マシン専用のNICまたは共有NICはありますか?専用NICに切り替えると、この問題は解消されました...しかし、それは本当の修正ではありません...
n8whnp

回答:


7

私は今、このような問題を抱えていました。正確な詳細は覚えていませんが、最終的な解決策は、仮想ネットワークアダプターに動的に割り当てられた競合するMACアドレスに関するものでした。それらをそれらに固定することは、動的にはなりませんでした。仮想マシンを別のホストに移動するのが難しくなる可能性があるため、通常はそれを行いたくありませんが、この場合は役に立ちました。

もう1つは、物理NICがBroadcomによって作成され、以前の管理者がBroadcomユーティリティを使用して2つのNICをホスト上で一緒にトランクし、帯域幅/スループットを向上させようとしたときに、構成エラーが発生したことです。そのセットアップを削除してNICの1つを構成したので、ホストマシンにはIPがまったくありませんが、仮想ゲストへのパススルーには引き続き使用できます。次に、各仮想マシンが一方または他方のNICのみを使用するように設定し、履歴トラフィックに基づいて負荷を分散します。もちろん、これはアダプターまたは接続がダウンしてもフェイルオーバーが発生しないことを意味し、トラフィックが時間の経過とともにバランスが保たれているかどうかを確認できませんでしたが、それ以来、安定しています。


5

これは古い質問であることは承知していますが、同じ問題が発生し、解決に多くの時間を費やしたため、効果的な解決策を共有したいと思いました。私はここに私の問題の解決策を見つけました:

http://invendows.wordpress.com/2008/03/06/network-issue-with-hyper-v/

私の状況での解決策は、VMでTCPオフロードを無効にすることでした。リンクから関連セクションを引用します。

TCPオフロードを無効にするには、Broadcom 8507 Nextreme II NICに接続されている各VMで新しいレジストリ値を作成して設定する必要がありました。

次のレジストリ変更を使用して、TCPオフロードを無効にしました。

キー:HKLM \ SYSTEM \ CurrentControlSet \ Services \ Tcpip \ Parameters

値(DWORD):DisableTaskOffload = 1

この方法で各VMのTCPオフロードを無効にすると、すべての問題が解決し、Broadcom 5708 Nextreme II NICの1つのNICポートに複数のVMを接続できました。

私のサーバーにはBroadcom NetExtremeNICがあるので、この問題の原因は間違いなくドライバーに関連しているようですが、設定DisableTaskOffload= 1で問題は完全に解決されました。この情報が他の誰かの検索の時間を節約することを願っています!


1
+1、このヒントをありがとう、問題なく数日間ランニングを続けてきました。
m0dest0 2013

1
問題ありません、m0dest0。それがあなたを助けてくれてうれしいです。:)
BruceHill 2013

3

より単純なHyper-V環境で同様の問題に遭遇し、Microsoftでこの記事に遭遇しました。Webサーバーが頻繁に使用されている場合、状況に合うようです。

http://support.microsoft.com/kb/974909-実行中のHyper-V仮想マシンのネットワーク接続が、Windows Server 2008 R2ベースのコンピューター上の大量の送信ネットワークトラフィックの下で失われる


あなたが参照しているKB記事はSP1より前のものでしたが、期待どおりのSP1より後の記事を作成
Mike

1
修正プログラムをインストールしたので問題を解決できないため、これを回答から削除しました。したがって、この質問は未回答のままです...
Mike

2

私たちの場合は24〜48時間ごとでしたが、同じ問題がありました。お使いのアンチウイルス/ファイアウォール製品がHyper-Vを搭載したServer 2008を特別にサポートしていることを再確認します。そうでない場合は、問題が解消するかどうかをテストするために、別の(または可能であれば一時的に削除する)アンチウイルス/ファイアウォール製品を試してください。 。

マイクロソフトに電話をかけ、後でいくつかのダンプ/ログファイルをアップロードした後、彼らはTrendMicro OfficeScanが私たちの事件の犯人であると判断しました。Hyper-Vでは明示的にサポートされていないことが判明したバージョンを使用していたため、最新のリリースにアップグレードすると、問題は解消しました。


2

これはハードウェアの問題であることが判明しました-問題をNetgear GSM7224v2マネージドスイッチに特定し、D-Link DGS-1024Dに置き換えました。それ以来、すべてが正常に機能しています。

「教訓」として、この場合、診断作業の99%をハードウェアの問題であることが判明したソフトウェア設定のトラブルシューティングに費やした可能性があります。マイクロソフトサポートに259ドルも支払って(そして電話で長い時間を費やして)、ソフトウェアの設定をざっと調べてそれを理解できるようにしました。この話の教訓は、ソフトウェアと同じくらいハードウェアを疑うことだと思います。


1

VMゲストのネットワークアダプターのプロパティで、ジャンボパケットとラージセンドオフロードを無効にしましたか?これらの設定に関する私の経験に基づいて、私は間違いなくそれを試します。


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.