タグ付けされた質問 「numa」

1
まだ最新のハードウェアでirqbalanceを使用していますか?
この質問は以前に尋ねられたことがありますが、世界は再び質問されるほどに変化したと思います。 irqbalanceは、コア間でメモリを共有するNUMA対応CPUを備えた今日のシステムで使用できますか? 実行irqbalance --oneshot --debugすると、最新のVMware ESXi環境の仮想ゲストがコア間でNUMAノードを共有していることがわかります。 # irqbalance --oneshot --debug 3 Package 0: numa_node is 0 cpu mask is 0000000f (load 0) Cache domain 0: numa_node is 0 cpu mask is 0000000f (load 0) CPU number 0 numa_node is 0 (load 0) CPU number 1 numa_node is 0 (load 0) …

1
Xeon Skylake SMPでの予期せぬ原因不明の低速(および異常な)メモリパフォーマンス
Supermicro X11DPH-Iマザーボードを搭載した2x Xeon Gold 6154 CPUと96GB RAMを使用してサーバーをテストしましたが、1 CPU(1ソケットが空)、同様のデュアルCPU Haswell Xeon E5-2687Wv3(この一連のテスト用ですが、他のBroadwellは同様に動作します)、Broadwell-E i7s、およびSkylake-X i9s(比較用)。 さまざまなmemcpy関数やメモリ割り当て(回避策が見つかったため、以下のテストではカバーされていません)に関しては、メモリが高速なSkylake XeonプロセッサはHaswellよりも高速に実行されることが予想されますが、代わりに両方のCPUがインストールされています、Skylake XeonsはHaswell Xeonsのほぼ半分の速度で動作し、i7-6800kと比較するとさらに遅くなります。さらに奇妙なのは、Windows VirtualAllocExNumaを使用してメモリ割り当て用のNUMAノードを割り当てる場合です。プレーンメモリコピー機能は、リモートノードとローカルノードではパフォーマンスが低下すると予想されますが、SSE、MMX、AVXレジスタを使用するメモリコピー機能は、多くの場合実行しますローカルNUMAノードよりもリモートNUMAノードの方が高速です(何?)。上記のように、Skylake Xeonsでは、 これがマザーボードまたはCPUのバグなのか、UPI対QPIのバグなのか、上記のどれなのかはわかりませんが、BIOS設定の組み合わせはこれを利用していないようです。BIOSでNUMA(テスト結果に含まれない)を無効にすると、SSE、MMX、AVXレジスタを使用するすべてのコピー機能のパフォーマンスが向上しますが、他のすべてのプレーンメモリコピー機能も大きな損失を被ります。 テストプログラムでは、インラインアセンブリ関数と_mm組み込み関数の両方を使用してテストしました。アセンブリ関数を除くすべてに対してVisual Studio 2017でWindows 10を使用しました。msvc++はx64のasmをコンパイルしないため、-c -O2msvc ++リンカーに含まれているフラグを使用して、objファイルをコンパイルします。 システムがNUMAノードを使用している場合、各NUMAノードに対してVirtualAllocExNumaを使用して新しいメモリ割り当て演算子をテストし、各メモリコピー機能ごとに16 MBのメモリバッファコピーの累積平均を100回行い、どのメモリ割り当てをオンにするかを切り替えますテストの各セット間。 100個のソースバッファと100個の宛先バッファはすべて64バイトに揃えられ(ストリーミング機能を使用したAVX512までの互換性のため)、ソースバッファの増分データと宛先バッファの0xffに一度初期化されます。 一部の構成でははるかに高速で、他の構成でははるかに低速だったため、各構成で各マシンで平均されるコピーの数は異なりました。 結果は次のとおりです。 Haswell Xeon E5-2687Wv3 32GB DDR4-2400(10c / 20t、25 MBのL3キャッシュ)を搭載したSupermicro X10DAi上の1つのCPU(1つの空のソケット)。ただし、ベンチマークは100ペアの16MBバッファーを循環するため、L3キャッシュヒットはおそらく発生しません。 --------------------------------------------------------------------------- Averaging 7000 copies of 16MB of data per function …


1
古いアプリケーションを実行しているVMで仮想NUMAを無効にする必要があるかどうかはどうすればわかりますか?
VMwareのドキュメントから: 仮想NUMAトポロジは、ハードウェアバージョン8の仮想マシンで使用でき、仮想CPUの数が8を超えると、デフォルトで有効になります。詳細構成オプションを使用して、仮想NUMAトポロジに手動で影響を与えることもできます。 それで、8つのCPUを割り当てたVMがあり、その実行中の仮想NUMAがあるとします。サーバー上でNUMA対応でない古いアプリケーションを実行している場合、非V-NUMAモードで実行した場合と比べて、アプリケーションの実行が非常に悪くなることはありませんか。 私はV-NUMAがこのように有効になっていると思います。アプリベンダーが8個以上のコアを推奨する場合、ソフトウェアはNUMAに対応している可能性が高いためです。または、マルチコアサポートが組み込まれているがNUMAサポートが組み込まれていないアプリケーションはたくさんありますか? この考えられる問題が原因のボトルネックを特定するにはどうすればよいですか? 編集:vCenterにリモートNUMAコールを監視するためのメトリックがあると思いましたか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.