多くのRPから構築されたスーパーコンピューターは本当に実用的ですか、それとも単なる目新しさですか?


13

この質問は、この記事に触発されています

現在、Rでデータを分析するために多くの時間を費やしています。Rで実行するスクリプトの一部は、時間を節約するために並列計算の恩恵を受ける可能性があります。多分約$ 300でベアボーンの「本物の」コンピューターを構築でき、その同じ$ 300で6個のPi(電源ケーブルとSDカードを含む)を入手できるとしましょう。並列化に適したタスクがあると仮定すると、Pisまたは「実際の」コンピューターの方が良いでしょうか?

「実際の」コンピューターのハードウェアを1000ドルかかるものに増やした場合、20 Piに対してどのように料金がかかりますか?


Piは小さなRAMを搭載した低速のコンピューターですが、GPUは優れています。あなたのタスクがそれから利益を得るなら、それは理にかなっているかもしれません。
トールビョールンラヴンアンデルセン14年

GPUは、既にコードがあるものを実行したい場合、または独自のGPUプログラミングドキュメントへのアクセスをネゴシエートできる場合にのみ役立ちます。
クリスストラットン14年

回答:


10

これを分析するには、20 rpis対$ 1000を超えて、実際に取得して$ 1000で使用できるものを自分で決める必要があります。 これはショッピングチャネルではないことに注意してください。

マザーボード、電源、8 GBのRAM、6コアの3.4 Ghz i7プロセッサ、および古いハードドライブ(SDカードよりも高速)を1,000ドルで入手できるとします。1秒あたりの合計サイクルは、6 * 3.4e9 = 20.4e9であるのに対し、piスーパーコンピューターでは20 * 0.7e9 = 14e9です。

ここで、マルチコアプロセッサがマルチコアプロセッサであるという事実を考えてみましょう。一方、pisのI / Oは(これが重要な要因になる場合)桁違いに遅くなります。

私はpiスーパーコンピューター(またはその知識)に深刻な関心はありませんが、実験や教育を目的としていると思います。それは間違いなく安価なクラスターですが、(実験や教育とは対照的に)数値を高速に処理することを目標とする場合、piクラスターは通常のPCよりもコストやエネルギー効率が高くなることはありません


「毎秒の合計サイクルは6 * 3.4e9 = 20.4e9であるのに対し、パイスーパーコンピューターの場合は20 * 0.7e9 = 14e9です。」基本的に私が求めていたものですが、何を探すべきかわかりませんでした。
ディーンマクレガー14年

1つのPiは5ワットのみを使用します。20のPISだけ少ないあなたがそうである記述PCよりも100ワットを使用すること。これは、平均より多くのコストとエネルギー効率(あまりCPUと:))である
するThorbjörnRavnアンデルセン

私の経験から、@ThorbjørnRavnAndersen、8 Core i7 + SSDドライブ+ 16GBのRAMは、ヘッドレス(モニターなし)インストールのプロセッサ負荷に応じて、約50〜70Wtを使用します。
レニック14年

RPi2を使用すると、サイクルの量は20 * 4 * 0.9e9 = 72e9に増加し、オーバークロックでは、1秒あたり20 * 4 * 1.1e9 = 88e9サイクルに達することさえあります。さて、このpiの計算能力の向上により、RPi-Clusterを構築する価値があると思いますか?
シラク

1
@goldilocks 1)スーパーコンピューターに関する私の知識は、Mbps速度について議論するのは良くありません。2)全体として、Intel-CPUは同じ価格のARMv7のセットよりも高速である可能性があります。これに関するより良い見方を得るために、いくつかの統計を調べる必要があります。3)RPi2でカーネルをコンパイルするのに何時間もかかります。私はそれを試してみましたが、将来は二度としないことを望みます。要約すると、RPi2でなくても、RPiはスーパーコンピューターにとって完璧な選択ではないかもしれません。しかし、RPiは非常に安価であり、それらのいくつかを簡単に組み合わせることができるため、確かに良いプロジェクトになります。することができますので、私は...、ネットワークシミュレーションを考えています
Sirac

2

これにはやや複雑な答えがあります-答える必要がある重要な質問は、「マシンにどのような作業を依頼していますか?」です。

異なるマシン間での命令セット(ARM対Intel対他の誰でも)およびコンパイラーの品質は、実際のパフォーマンスに大きな違いをもたらします。求めている作業が1台のマシンでハードウェアアクセラレーションを使用し、別のマシンでは使用していない場合、その要因だけでクロックレートの大幅な変更よりも大きな違いが生じます。

最も一般的な言葉で言えば、価格/性能の面で最大の価値は、AMDまたはIntelの適度にクロックされたマルチコア汎用CPUによるものだと思います。周囲温度が低い制御された環境にいる場合、これらのチップを少しオーバークロックしてパフォーマンスを向上させることができます。

rasPiはこの種のもののために設計されたものではないので、物事の仕組みを学ぶことや、非常に手頃な価格で真の「分散」システムを構築することの価値を奪うべきではありません。しかし、深刻なデータや数値の計算が必要な場合、rasPiは正しい選択ではないでしょう。


1

電力不足のCPUをpiに置いておくと、努力に値するパフォーマンスの向上を確認するために、数十pisでCPUにデータを十分に高速で取得する方法がわかりません。CPUの速度と同様に、クラスター化されたスーパーコンピューティングではバスの速度があらゆる点で重要であり、piはここでは非常に不十分です。

ネットワークとディスクアクセスの両方が同じ60 MBのUSB2バスを共有します。SDカードは、せいぜい20 MBの速度範囲でパフォーマンスを発揮します。

150 MBのSATAと2 GBのPCIバス上のイーサネットを備えたローエンドのPCハードウェアは、帯域幅が桁違いに大きくなります。


3
これはアプリケーションに完全に依存します-一部のアプリケーションは「作業」と「通信」の比率が非常に高く、他のアプリケーションは作業量ごとにより多くの通信を必要とします。
クリスストラットン14年

0

ノード間のスーパーコンピューティングを学びたい場合。.. piを設定します。安価で強力なものが必要な場合は、使用済みのキセノンベースのマルチコアIntel Server / Workstationを購入し、1つ以上の使用済みTeslaカード、Cuda gpuカード、またはIntel Phiカードを入れてください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.