GPGPUアクセラレーション用のNvidia K20XとGeForce Titan


10

アカデミックコンピューティング、特にDGEMMコンポーネント用のこれら2つのグラフィックカードの違いを理解しようとしています。

生の統計を見ると、どちらも同じGK110チップを備えており、事実上すべてのカテゴリで同等の統計があり、コアアーキテクチャも同じだと思います。割引前のK20Xは、タイタンの約4倍のコストです。効率の観点からは、K20XよりもTitanを使用する方が理にかなっているようです。

ここで違いを理解するのに苦労しています、誰かが状況を解明できますか?

メモとして、私はこれらのカードをラックサーバー用に購入し、基本的にカードが死ぬまで完全に傾けて実行することを検討しています。ただし、1つのジョブで複数のGPUを使用する効率が特に重要だとは思いません。

回答:


13

いくつかの違いはありますが、必ずしもハードウェアや仕様にあるとは限りません。これは私がフォーラムやニュースリリースから得たすべての情報であることに注意してください。そのため、すべてを詳細に理解してください。

1つは「スケーラビリティと信頼性」です(ソース)。K20は、クラスターシステムに配置され、24時間365日フルチルトで動作するように設計されています。Titanはゲーム向けに設計されているため、このデューティサイクルで動作しますが、この方法で使用すると、長期的な寿命の問題が発生する可能性があります。

ドライバーも異なりますが、大きな違いはわかりません。カードのデザインの焦点の違いは、この前面にあるテスラカードのパフォーマンス向上を比較的小さくする可能性があります。

「テスラ独自の機能には、次のものがあります。

  • InfiniBandパフォーマンスのためのNVIDIA GPUDirect RDMA
  • Hyper-Q for MPI(Hyper-Q for CUDAストリームはGeForce GTX TITANでサポートされています)
  • すべての内部および外部レジスタとメモリに対するECC保護
  • GPUおよびクラスター管理用にサポートされているツール(Bright Computing、Gangliaなど)。」(ソース

これは、主な違いが拡張性であるという事実を示しています。あなたがあなたのオフィスのデスクトップで走ろうとしているならば、価格差のためにK20以上のタイタンに反対することは難しいでしょう。複数のK20の追加のパフォーマンスが必要な場合は、自分でHPCセンターを見つけて、サーバーで時間を購入してください。

編集:

ECCについてもう少し詳しく調べた後、この回答を更新して、タイタンではなくK20でそれが持つ意味を指摘します。次の情報は、ここにある情報の言い換えです

ECCは、DRAMとGPUのレジスタのエラーチェックです。ソフトエラーは、ビットが誤って転送/保存された場合です。回路が高速で接近しているほど、ソフトエラーの可能性が高くなります。結合されたODEのセットを解く場合、または線形システムを解く場合、1つの数値が1ビットずれていると、結果を再現できない方法で大幅に変更する可能性があります。CPUのほとんどの標準RAMとキャッシュは、ECCを使用してこれらのエラーについてエラーチェックされます。

一方、GPUのメモリバスはCPUのメモリバスよりもはるかに高速ですが、一般に、ECCはありません。これは、画面上のピクセルが1フレーム少しずれても、プログラムの品質が低下しないためです。これらのエラーも伝播しません。したがって、この機能をスキップすることで、多くのチップ面積(およびコスト)を節約できます。この余分な複雑さにより、Teslaラインの追加コストの大部分が発生する可能性があります。


3
すばらしい答え+1!それらの機能がそれほどコストがかかるとは信じがたいです。リンクされたNvidiaサイトの「GeForceで開発し、Teslaで配備する」という行は、重要な問題を要約していると思います。今のところ最良の解決策は、いくつかのGeForceを購入して、いわば青い煙を放棄するまで一生懸命実行することです。
Ophion 2013

3
「しかし、これは彼らがオークリッジで使用されるのを止めなかった。」「Titan」という名前のOLCFのCray XK7は、GTX TitanではなくTesla K20 GPUを使用します。NVidiaは、GTX TitanにはOLCF Titanの「テクノロジー」があると述べています。これは、エコノミーカーがFormula-1カーの「テクノロジー」を持っていると言うときに使用される語彙と同じです。(GTX Titanのパフォーマンスはかなり良いですが、ECCがなく、私が知っている主要なインストールでは使用されていません。)
Jed Brown

1
私の間違い、私は記事を誤って解釈した。誤解を招かないように答えを更新します。
Godric Seer 2013

2

私の意見では、違いは主に市場の細分化であるようです。あなたが科学者である場合、NVidiaは、K20Xで利用できるほど多くのエラー修正RAMなしでGPGPUを使用しているため、論文が拒否されることを恐れてほしいと考えています。同様に、企業の場合、計算が可能な限りエラー修正されていないという疑いで訴えられる可能性が低いことを意味する場合は、4倍の支払いが必要になることがあります。個人のゲーマーや愛好家のGPGPU'erは、お金が少なく、これらの方法で説得することが難しいため、タイタンで販売されています。


2
私はECCでのみ計算を実行しましたが、ECC以外のシステムの障害と論理ブレークポイントを実証する優れた記事があり、そのメリットはありますか?
Ophion 2013

2
@Ophion GPUで加速された分子動力学シミュレーションに対するエラー修正コードの影響の調査 --->これは、いくつかの興味を引くかもしれません。
BenC 2014年

BenCによる非常に優れたリンクのエグゼクティブサマリーが必要な場合:ECCが修正するソフトエラーは非常にまれであり、このペーパーでは、速度を上げるためにTeslaでECCをオフにすることを推奨しています。警告:これは実際にはコンシューマーGPUでテストされていません。
的な

0

実際に実行するアプリケーションによって異なります。GPUGRID.netは、ECCがオンになっていないマシンで実行され、すべて正常です。結果は、他のどのプラットフォームでも同じです。AcelleraはGeForceカードを搭載したハードウェアも販売しており、GPUが故障したのはごくわずかなケースです。GeForceで十分です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.