tcpdumpはudpのパフォーマンスを向上させます

13

一連の負荷テストを実行して、次のセットアップのパフォーマンスを判断しています。

Node.js test suite (client) --> StatsD (server) --> Graphite (server)

つまり、node.jsテストスイートは、x秒ごとに一定量のメトリックを別のサーバーにあるStatsDインスタンスに送信します。次に、StatsDは、メトリックを毎秒同じサーバーにあるGraphiteインスタンスにフラッシュします。次に、テストスイートによって実際に送信されたメトリックの数と、グラファイトによって受信されたメトリックの数を調べて、テストスイートとグラファイトの間のパケット損失を判断します。

しかし、20〜50％の範囲の非常に大きなパケットドロップ率（UDPプロトコルで送信されていることに注意してください）が得られることがあることに気付きました。そのため、これらのパケットがドロップされる場所を調べ始めたのは、StatsDのパフォーマンスの問題の可能性があるからです。そこで、このドロップが発生した場所を追跡するために、システムのすべての部分でメトリックの記録を開始しました。そして、これは物事が奇妙になる場所です。

私が使用していtcpdumpのを、私は、テストの実行が行われた後、検査キャプチャファイルを作成します。しかし、tcpdumpを実行してテストを実行すると、パケット損失はほとんどありません。tcpdumpがテストのパフォーマンスを何らかの形で向上させているように見えますが、これがなぜ、どのように行われるのかわかりません。次のコマンドを実行して、サーバーとクライアントの両方でtcpdumpメッセージを記録しています。

tcpdump -i any -n port 8125 -w test.cap

特定のテストケースでは、40000メトリック/秒を送信しています。tcpdumpの実行中のテストでは約4％のパケット損失がありますが、テストなしでは約20％のパケット損失があります。

両方のシステムは、次のセットアップでXen VMとして実行されています。

Intel Xeon E5-2630 v2 @ 2.60GHz
2GB RAM
Ubuntu 14.04 x86_64

潜在的な原因についてすでに確認したこと：

UDPバッファーの受信/送信サイズを増やします。
テストに影響するCPU負荷。（クライアント側とサーバー側の両方で最大負荷40〜50％）
「any」の代わりに特定のインターフェイスでtcpdumpを実行します。
「-p」を指定してtcpdumpを実行し、混合モードを無効にします。
サーバーでのみtcpdumpを実行します。これにより、20％のパケット損失が発生し、テストには影響がないようです。
クライアントでのみtcpdumpを実行します。これにより、パフォーマンスが向上しました。
netdev_max_backlogおよびnetdev_budgetを2 ^ 32-1に増やします。これは違いはありませんでした。
すべてのNICで無差別モードの可能な設定をすべて試しました（サーバーのオンとクライアントのオフ、サーバーのオフとクライアントのオン、両方のオン、両方のオフ）。これは違いはありませんでした。

— ルーベン・ホムス
ソース

3

tcpdumpがデフォルトで行うことの1つは、ネットワークインターフェイスを無差別モードにすることです。-pオプションを渡して、それをスキップして違いが生じるかどうかを確認することができます。

— ゾレダチェ

クライアントとサーバーの両方でtcpdumpを実行していますが、パケット損失率は低下しますか？クライアントでのみ実行するとどうなりますか。サーバーでのみ実行するとどうなりますか？（そして、はい、またオフプロミスキャスモードをオンにしてみてください、そしておそらくもどうかを確認するために、テストのために使用される特定のネットワークインタフェースではなく、「任意の」デバイス上でキャプチャしてみてくださいそれが違いになります。）

コメントしてくれてありがとう。両方の推奨事項を試し、試した内容を反映するように質問を編集しましたが、これは問題に影響しませんでした。

— ルーベンホムス

両方のマシンのnicを無差別モードにすると、tcpdumpを実行したのと同じ効果がありますか？eth0で無差別モードをifconfig eth0 promisc有効またはifconfig eth0 -promisc無効にします。違いがある場合は、両方のマシンで無差別オン/オフの4つの可能な組み合わせを比較してみてください。それは問題の原因を特定するのに役立つかもしれません。

— フォックス

@Fox返信ありがとうございます！すべてのnicに対して可能な組み合わせをすべて試しましたが、結果に違いはありませんでした。これを反映するために質問を更新しました。

— ルーベンホムス

10

tcpdumpの実行中は、着信フレームの読み取り時にかなりプロンプトが表示されます。私の仮説は、NICのパケットリングバッファ設定が小さなサイズに少しあるかもしれないということです。tcpdumpの実行中は、よりタイムリーに空になります。

Red Hatサブスクライバーの場合、このサポート記事はパケット受信の概要に非常に役立ちます。そこには、あなたがまだ検討していないと思うものがいくつかあります。

システムがIRQをどのように処理しているかを検討してください。ネットワークインターフェイスの「dev_weight」を増やすことを検討してください（NICからユーザー空間に読み込まれるパケットが増えることを意味します）。アプリケーションがソケットを読み取る頻度を確認します（専用スレッドを使用できるかどうか、スケーラビリティに関する既知の問題/回避策があります）。

NICフレームバッファーを増やします（ethtoolコマンドを使用して- --set-ringなどの引数を確認します）。

「受信側のスケーリング」を見て、少なくともその数の受信スレッドを使用してトラフィックを読み取ります。

tcpdumpは、パケットリングバッファーのカーネルサポートを使用するなど、何かクールなことをしているのだろうか。それはあなたが見ている行動を説明するのに役立つでしょう。

— キャメロン・カー
ソース

これはXen環境であるため、おそらくXenホスト上で（少なくとも一部を）実行する必要があります。

— キャメロンカー

これは以前は考えもしなかったことですが、非常に興味深いものです、ありがとう！Xenホストにアクセスできたらこれを試してみて、その方法をお知らせします。

— ルーベンホムス

2

どのパワーガバナーを使用していますか？「オンデマンド」または「保守的」ガバナーで同様の動作を見てきました。

「パフォーマンス」ガバナーを使用し、サーバーBIOSの省電力機能を無効にしてみてください。

それは何かを変えますか？

— ショーダンショク
ソース

私が使用しているパワーガバナーを見つけるのに問題があります。走ってみましcpufreq-infoたが、というメッセージが表示されますno or unknown cpufreq driver is active on this CPU。また、使用cpupower frequency-infoする場合はを返しますno or unknown cpufreq driver is active on this CPU。私は、現時点ではこれを確認することはできませんが、VMの製造元のWebサイトを、私はインテルのCPUを持っているので、リードは、私はそれが「パフォーマンス」モードで実行されていると信じてする...

— ルーベン・ホムスに

次のコマンドの出力を表示できますか？1）cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor2）cat /proc/cpuinfo3）lsmod | grep cpu

— -shodanshok

ここに行く

— ルーベン・ホムス

1

別の方法はip_conntarckモジュールです。あなたのlinux-boxは新しい接続を受け入れることができますか？経由でテスト：

root@debian:/home/mohsen# sysctl net.ipv4.netfilter.ip_conntrack_max
net.ipv4.netfilter.ip_conntrack_max = 65536
root@debian:/home/mohsen# sysctl  net.ipv4.netfilter.ip_conntrack_count
net.ipv4.netfilter.ip_conntrack_count = 29

あなたはテストする必要があります

net.ipv4.netfilter.ip_conntrack_max >  net.ipv4.netfilter.ip_conntrack_count

max == countの場合、最大接続は一杯であり、linux-boxは新しい接続を受け入れることができません。
ip_conntrackがない場合は、経由で簡単にロードできますmodprobe ip_conntrack

— ペルシャ湾
ソース

2

その場合は、「raw」テーブルのNOTRACKターゲットを調べて、そのための接続追跡を防止する必要があります。最近、ビジー状態のDNSサーバーに対してこれを行いました。これにより、iptablesがボトルネックになり、DNS解決タイムアウトが発生しなくなりました。

— キャメロンカー

そして、ここに、IPTablesがUDP DNSの接続追跡を実行しないようにNOTRACKルールを使用した例があります。distracted-it.blogspot.co.nz/2015/05/...

— キャメロン・カー

1

私は、受信側がパケットレートを処理できないことを疑っています。その理由は次のとおりです。

クライアントで tcpdump を使用すると、ドロップされるパケットが減ります。tcpdumpはクライアントの速度を低下させるため、サーバーは、部分的に処理できるより低いパッカーレートを認識しています。クライアントとサーバーの両方でRX / TXパケットカウンターを確認することで、この仮説を確認できるはずです。
UDPバッファーの受信/送信サイズを増やしたとおっしゃいましたが、詳細を教えてください。サーバー上でrmem_max と rmem_defaultの両方を変更することが重要です。例： sysctl -w net.core.rmem_max=524287 sysctl -w net.core.wmem_max=524287 sysctl -w net.core.rmem_default=524287 sysctl -w net.core.wmem_default=524287

設定をテストする

statsdとノードアプリケーションを停止し、アイドル状態のシステムでiperfを使用して、ネットワーク/カーネルが処理できるパケットレートをテストします。iperfで40Kパケット/秒をストリーミングできるが、statsdではできない場合は、statsdのチューニングに集中する必要があります。

その他の調整可能パラメータ

また、net.core.netdev_max_backlogを調整することも忘れないでください。特定のインターフェースが、カーネルが処理できるよりも速くパケットを受信した場合、キューに入れることができるパケットの最大数。

— ユニコレッティ
ソース