Intel Knights LandingのワークロードとNVIDIA GeForce


8

新しく発売されたIntel Xeon Phiが競合他社からHPC \ Super Computerの市場シェアを奪う方法について書かれた記事はたくさんあります。Intel Knightsには72コアと4ソケットが搭載されており、288コアシステムとなっています。一方、単一のGtx980には2048のCUDAコアがあります。これら2つはどのようにしてコンピューティング能力の点で競争できますか(GTXがはるかに進んでいるように見えます)?または、それらは完全に異なる作業負荷を対象としていますか?その場合、いくつかの例は何ですか?

ありがとう。


1
ここで違いの比較を見ることができます。しかし、これは当面のタスクに多少依存しています。
user189035

1
そのリンクは非常に有益です。共有いただきありがとうございます。
Chandan 2015

回答:


8

ブライアンが言ったように、Xeon PhiコアはCUDAコアにまったく匹敵しません。Phiの問題は、2頭の馬の間のどこかにあることです。

高度な並列浮動小数点計算を実行している場合、NVIDIAは1/4の価格で3倍のパフォーマンスを提供します。倍精度の場合、ギャップは小さくなりますが、同じパフォーマンスでもNVIDIAは依然として20%安くなります。

問題の並列化が非常に難しい場合、Phiはまったく役に立たず、代わりにIntel Xeonのようなものが最高のパフォーマンスを提供します。

この場合、Phiのスイートスポットは非常に平行ですが、発散性があります。つまり、各スレッドは異なる何かを行う必要があります。この例は、モンテカルロシミュレーションです。これらは、たとえば、GPUが標準のCPUよりもわずかに(〜2倍)高速化する放射線治療のシミュレーションで使用されます。

Intelはまた、コードを最小限に書き換えるだけでよいという事実に基づいてXeon Phiを販売しようとしています。ただし、並列化が簡単でないものについては、作業はGPUの場合と同じになります。


また、OpenACCツールキットを無料で入手できる学者にとって、NVIDIAカードのコードの書き換えは必ずしもそれほど難しくありません。
dr.blochwave 2015

CUDAで書き直す必要がないだけでなく、Xeon Phiは他のプラットフォームで実行されるプログラミングモデルをサポートします。最新のXeonとXeon Phiのチューニングにはほとんど違いがありません。どちらも慎重なスレッド化とベクトル化が必要です。そして、Xeonでうまく動作するものは、AMD、ARM、IBMのCPUでうまく動作するはずです。一方、NVIDIAのモデルでは、ハードウェアに固定されます。
Jeff

私は敬意を払いません。22コアのXeonとXeon Phiは似ているかもしれませんが、4コアのAMDとは非常に異なり、まったく異なる命令セットを備えたARMプロセッサではさらに異なります。NVIDIAをハードウェアに固定することに関しては、AMPとOpenCLの両方で、AMDデバイスと実際にCPUでコードを実行できます。
LKlevin

アセンブリを記述しない限り、命令セットは重要ではありません。PowerPC、POWER、AMD Opteron、あらゆる種類のXeon、およびKNCとKNLの両方のコードを調整しました。手法は、メモリ階層のニュアンスを除いてほとんど同じです。私のOpenMP C / Fortranは、コンパイラーのバグまで完全に移植可能です。
Jeff

7

CUDAコアは、Xeon Phiコプロセッサーの個別のプロセッサーコアとまったく同等ではありません。Phiコプロセッサコアは、CUDAコアがすべてデータのさまざまなスライスで同じ操作を実行している間、独自のループや分岐などを持つことができる本格的なプロセッサです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.