10GigEでのDRBDのひどい同期パフォーマンス


15

RAIDアレイ(8コア、16GB RAM、12x2 TB RAID6)、3つの10GigEインターフェイスを備えた同一サーバーのペアをセットアップして、可用性の高いサービスをホストしました。

システムは現在Debian 7.9 Wheezy旧安定版を実行しています(corosync / pacemakerは8.x安定版でもテスト版でも利用できないため)。

  • ローカルディスクのパフォーマンスは、書き込み約900 MB /秒、読み取り1600 MB /秒です。
  • マシン間のネットワークスループットは700MB / s以上です。
  • iSCSIを介して、各マシンは700 MB / s以上で相手のストレージに書き込むことができます。

ただし、DRBDの設定方法に関係なく、スループットは100MB /秒に制限されます。本当にハードコーディングされた制限のように見えます。設定を微調整することで確実にパフォーマンスを低下させることができますが、1Gbitを超えることはありません(一度に数秒で122MB / sに達します)。私は本当にこれで髪を引っ張っています。

  • プレーンバニラカーネル3.18.24 amd64
  • drbd 8.9.2〜rc1-1〜bpo70 + 1

構成は2つのファイルに分割されますglobal-common.conf

global {
        usage-count no;
}

common {
        handlers {
        }

        startup {
        }

        disk {
                on-io-error             detach;
         #       no-disk-flushes ;
        }
        net {
                max-epoch-size          8192;
                max-buffers             8192;
                sndbuf-size             2097152;
        }
        syncer {
                rate                    4194304k;
                al-extents              6433;
        }
}

およびcluster.res

resource rd0 {
        protocol C;
        on cl1 {
                device /dev/drbd0;
                disk /dev/sda4;
                address 192.168.42.1:7788;
                meta-disk internal;
        }

        on cl2 {
                device /dev/drbd0;
                disk /dev/sda4;
                address 192.168.42.2:7788;
                meta-disk internal;
        }
}

cat /proc/drbdスレーブからの出力:

version: 8.4.5 (api:1/proto:86-101)
srcversion: EDE19BAA3D4D4A0BEFD8CDE 
 0: cs:SyncTarget ro:Secondary/Secondary ds:Inconsistent/UpToDate C r-----
    ns:0 nr:4462592 dw:4462592 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:16489499884
        [>....................] sync'ed:  0.1% (16103024/16107384)M
        finish: 49:20:03 speed: 92,828 (92,968) want: 102,400 K/sec

vmstat 2マスターからの出力(両方のマシンはほぼ完全にアイドル状態です):

procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa
 0  0      0 14952768 108712 446108    0    0   213   254   16    9  0  0 100  0
 0  0      0 14952484 108712 446136    0    0     0     4 10063 1361  0  0 99  0
 0  0      0 14952608 108712 446136    0    0     0     4 10057 1356  0  0 99  0
 0  0      0 14952608 108720 446128    0    0     0    10 10063 1352  0  1 99  0
 0  0      0 14951616 108720 446136    0    0     0     6 10175 1417  0  1 99  0
 0  0      0 14951748 108720 446136    0    0     0     4 10172 1426  0  1 99  0

iperf2つのサーバー間の出力:

------------------------------------------------------------
Client connecting to cl2, TCP port 5001
TCP window size:  325 KByte (default)
------------------------------------------------------------
[  3] local 192.168.42.1 port 47900 connected with 192.168.42.2 port 5001
[ ID] Interval       Transfer     Bandwidth
[  3]  0.0-10.0 sec  6.87 GBytes  5.90 Gbits/sec

どうやら初期同期はやや遅いと思われますが、これほど遅くはないはずです...さらに、のような同期レートを調整しようとしても実際には反応しませんdrbdadm disk-options --resync-rate=800M all


1
非同期でビルドしてから停止して、再同期して再構築しようとしましたか?
ザビエルニコレット

回答:


11

DRBDの新しいバージョン(8.3.9以降)には、チューニングが必要な動的再同期コントローラーがあります。古いバージョンのDRBD設定では、これsyncer {rate;}で十分でした。現在では、動的再同期速度の軽く提案された出発点としてより多く使用されています。

動的同期コントローラーは、DRBDの構成のディスクセクションにある「c-settings」で調整されます($ man drbd.confこれらの各設定の詳細については、を参照してください)。

これらのノード間で10Gbeを使用し、プロトコルCが使用されているためレイテンシーが低いと仮定すると、次の設定で物事がより速く動くはずです。

リソースrd0 {
        プロトコルC;
        ディスク{
                c-fill-target 10M;
                c-max-rate 700M;
                c-plan-ahead 7;
                c-min-rate 4M;
        }
        cl1で{
                デバイス/ dev / drbd0;
                ディスク/ dev / sda4;
                アドレス192.168.42.1:7788;
                メタディスク内部。
        }

        cl2で{
                デバイス/ dev / drbd0;
                ディスク/ dev / sda4;
                アドレス192.168.42.2:7788;
                メタディスク内部。
        }
}

それでも満足できない場合は、max-buffers最大12kまで変えてみてください。それでも満足できない場合はc-fill-target、2Mずつ増やしてみてください。


実際、この構成ではパフォーマンスは3 MB /秒に低下します。私はこれらの設定をいじろうとしていますが、見通しは厳しいです。
wazoox

これまでのところ、c-plan-aheadをゼロに設定し、max-epoch-sizeとmax-buffersを増やすことで無効にするのは、トリックを行うようです。
wazoox

2
max-buffersを20kに、c-fill-targetを20Mに増やすとどうなりますか?これらの2つの値を徐々に大きくすると、最終的には目的の結果が得られると思います。
マットケレツマン

それははるかに良いです!リンクを飽和させることはありません(専用であり、いっぱいにするのは問題ありませんが)が、私はすでに400MB / sです。私はこれらの設定で少し遊んだ...
wazoox

1
max-buffersを250から2500にアップすると、私にとっては夜間と夜間の違いが生じました(重要ではないパフォーマンス設定で)
davidgo

7

他の誰かが私がこれらの設定を使用することを提案しました:

        disk {
                on-io-error             detach;
                c-plan-ahead 0;
        }
        net {
                max-epoch-size          20000;
                max-buffers             131072;
        }

そして、パフォーマンスは優れています。

編集: @Matt Kereczmanおよび他の提案に従って、私は最終的にこれに変更しました:

disk {
        on-io-error             detach;
        no-disk-flushes ;
        no-disk-barrier;
        c-plan-ahead 0;
        c-fill-target 24M;
        c-min-rate 80M;
        c-max-rate 720M;
} 
net {
        # max-epoch-size          20000;
        max-buffers             36k;
        sndbuf-size            1024k ;
        rcvbuf-size            2048k;
}

再同期速度が速い:

cat /proc/drbd
version: 8.4.5 (api:1/proto:86-101)
srcversion: EDE19BAA3D4D4A0BEFD8CDE
 0: cs:SyncSource ro:Primary/Secondary ds:UpToDate/Inconsistent C r---n-
    ns:133246146 nr:0 dw:2087494 dr:131187797 al:530 bm:0 lo:0 pe:5 ua:106 ap:0 ep:1 wo:d oos:4602377004
        [>....................] sync'ed:  2.8% (4494508/4622592)M
        finish: 1:52:27 speed: 682,064 (646,096) K/sec

これらの設定での再同期中の書き込み速度は優れています(ローカル書き込み速度の80%、フルワイヤ速度):

# dd if=/dev/zero of=./testdd bs=1M count=20k
20480+0 enregistrements lus
20480+0 enregistrements écrits
21474836480 octets (21 GB) copiés, 29,3731 s, 731 MB/s

読み取り速度は問題ありません:

# dd if=testdd bs=1M count=20k of=/dev/null
20480+0 enregistrements lus
20480+0 enregistrements écrits
21474836480 octets (21 GB) copiés, 29,4538 s, 729 MB/s

後で編集:

完全に再同期した後、パフォーマンスは非常に良好です(ワイヤ速度の書き込み、ローカル速度の読み取り)。再同期は迅速(5/6時間)であり、パフォーマンスをあまり害しません(ワイヤスピードの読み取り、ワイヤスピードの書き込み)。私は間違いなくゼロでc-plan-aheadのままにします。ゼロ以外の値では、再同期が長すぎます。


max-buffersを131Kに増やすことは、問題を解決するための最も優雅なアプローチではありません。基本的に、DRBD 512MiBのシステムバッファーを再同期に使用しますが、これは多くのバッファースペースです。80kを超えるmax-buffersで問題が発生するのを見てきました。再同期コントローラーの設定を調整することを強くお勧めしますが、満足するまでmax-buffersを少しずつ増やしてください。
マットケレツマン

@MattKereczman設定を変更しますが、プロダクション設定でプレイする前に、最適な(同期された)クラスターを可能な限り高速にしたいです。...デフォルト設定では、同期には少なくとも数日以上かかります数週間まで、これは単に受け入れられません。必要な生産スループットは500MB / sです。
wazoox

4

c-plan-aheadは、動的同期レートコントローラーを有効にするために正の値を設定する必要があります。ディスク c-plan-ahead 15; // 5 * RTT / 0.1s unit,in my case is 15 c-fill-target 24; c-max-rate 720M;

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.