単方向パケット損失


8

最近、いくつかのMetroE回路(L2接続)を100Mbpsから1Gbpsにアップグレードした後、一部のサイト間で大きなファイル転送が失敗することに気付きました。ただし、転送は方向にのみ失敗します。たとえば、次の例を考えてみましょう。

から->へ

A-> B =失敗

B-> A =成功

A-> C =成功

C-> A =成功

B-> C =成功

C-> B =成功

各サイトは、サイトにあるL3スイッチの背後にあるルーティングされたセグメントです。L3スイッチはプロバイダーのCPEメディアコンバーターに接続し、CPEメディアコンバーターはファイバーを介してプロバイダーのネットワークに接続します。静的ルーティングは、L3スイッチ間で使用されます。

            *Site A*                      *Site B*
    L3 Switch <-> CPE <--- Provider ---> CPE <-> L3 Switch
                               |
                              CPE
                               |
                           L3 Switch
                            *Site C*

プロバイダーはCPEからの回線のエンドツーエンドのテストを実行し、損失は報告していません。ただし、転送が失敗する前に、ホスト上のパケットキャプチャに重複したACKが多数表示されます。

式からL3スイッチを削除し、2つのホストを各サイトのCPEデバイスに直接接続すると、ファイル転送は正常に完了します。

    Host A <-> CPE <--- Provider ---> CPE <-> Host B

L3スイッチのどちらかの側にホストを配置すると、VLAN間ルーティングが問題なく機能し、ファイル転送が正常に完了します。

    Host A1 <-> L3 Switch <-> Host A2

この問題は、データが2つのルーティングされたセグメント間でプロバイダーを通過するときにのみ発生するようです。

    Host A <-> L3 Switch <-> CPE <--- Provider ---> CPE <-> L3 Switch <-> Host B

私はいくつかのことを確認しました-インターフェイスの統計情報はクリーン(エラーなし)、CPUとメモリの使用率が低い、速度とデュプレックスの一致(クライアントとCPE)、MACとARPテーブルが正しい、などです。

問題は何でしょうか?

アップデート1

ホストAおよびBからのパケットキャプチャは、次のURLにあります。

https://www.dropbox.com/sh/5m2yohgxieelo59/AADed-0EWOkdmFIe0qT45_uQa

この問題は、元々12.3R6.6を実行するJuniper EX3200スイッチを使用して発生しました。その後、スイッチを11.4R6.6にダウングレードしましたが、これで問題は解決しませんでした。

12.3R6.6および11.4R6.6を実行しているJuiper EX2200スイッチを使用して問題を再現できました。3.3.11.2を実行しているDell 6224スイッチを使用して問題を再現することもできました。

現在、各サイトでCPE(ge-0 / 0/0)と単一のホスト(ge-0 / 0/1)のみがJuniper EX3200に接続されています。問題のトラブルシューティング中に、無関係なパラメータの構成を削除したため、構成はかなり基本的です。構成は基本的に同じですが、IPアドレスが異なります。以下はスニペットです。

    # show interfaces
    ge-0/0/0 {
        unit 0 {
            family ethernet-switching {
                port-mode access;
                vlan {
                    members WAN;
                }
            }
        }
    }
    ge-0/0/1 {
        unit 0 {
            family ethernet-switching {
                port-mode access;
                vlan {
                    members LAN;
                }
            }
        }
    }
    vlan {
        unit 10 {
            description WAN;
            family inet {
                address 192.168.X.X/27;
            }
        }
        unit 100 {
            description LAN;
            family inet {
                targeted-broadcast;
                address 172.X.X.1/22;
            }
        }
    }

    # show vlans
    WAN {
        vlan-id 10;
        l3-interface vlan.10;
    }
    LAN {
        vlan-id 100;
        l3-interface vlan.100;
    }

アップデート2

今日、サイトAのL3スイッチJuniper EX3200からサイトBのL3スイッチJuniper EX3200にファイルをscpすると、scp転送も問題の影響を受けることに気付きました。

転送はWAN VLANのCPEに面するインターフェイスから発信されているため、これは特に興味深いと思います。EX3200スイッチを介して影響を受けるサイト間でVLANをトランキングすると、スイッチドファイル転送がサイトAとBのホスト間で正常に完了するためです。


1
こんにちはマイク、提案をありがとう。私はプロバイダーと話すことで、9000を超えるMTUを構成していることを知っています。双方向で1472バイトを渡すことができます。これは、事実上の1500 MTUを期待しています。mturouteを使用してこれを確認しました。1472を超えるpingは、フラグメントしないビットセットで失敗します。
ポールギャレット

両側から同時に失敗したファイル転送をスニッフィングして、結果をcloudsharkに投稿してください。また、質問の「L3スイッチ」の部分に関する詳細も必要です。製造元、モデル、ファームウェアバージョン、構成、接続先のポート番号など...
マイクペニントン2014

ファイル転送が失敗するまでに、キャプチャは約19MBでしたが、これはクルードシャークには大きすぎるため、ドロップボックスにキャプチャをアップロードしてリンクを共有しました。投稿を更新して、リクエストされた追加情報を含めました。
Paul Garrett

質問に詳細を追加することを検討してください
マイクペニントン2014

プロバイダーのネットワークに問題がありました。追加の詳細情報はありませんでした。
Paul Garrett、

回答:


1

ファイアウォールでSRXを使用している場合は、セキュリティフローセッションが何に設定されているか、およびそれが制限に達しているかどうかを確認します。

#show security flow session summary 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.