スーパーコンピューターの目的


15

昨秋、私はイリノイ大学でブルーウォーターズスーパーコンピューターのツアーに参加しました。コンピューター全体を使用した人はいないかと尋ねました。常に複数のプロジェクトに取り組んでいると言われました。そのため、スーパーコンピューターの有用性について疑問に思いました。おそらくブルーウォーターズは、産業界と大学で共有しなければならないという点で珍しいでしょう-私は知りません。単一のスーパーコンピューターのプロセッサーとメモリーの管理には、いくらかのオーバーヘッドがあると思います。小型のコンピューターを構築する方が費用対効果が高いでしょうか?スーパーコンピューターの価値を理解するのを手伝ってくれる人はいますか?それとも、時々彼らは単一のプロジェクトに専念しているのですか?


これがコンピューターサイエンスの質問であることを説明できますか?Afaik、スーパーコンピューターのほとんどのユーザーは自然科学と科学計算の人々です。
ラファエル

@Raphael:これは、コンピューターシステムの設計におけるリソース割り当てに関する質問です。あらゆる種類のコンピューターシステムのユーザーがコンピューター科学者になることはめったにありません。
さまようロジック

1
Blue Watersの使用方法について詳しく教えてください。たとえば、通常、1つのプロジェクトでコンピューターの90%を使用し、別のプロジェクトで残りの10%を削除するとします。その場合、コンピューターは適切なサイズのように見えます。しかし、通常10個のプロジェクトがそれぞれ10%を使用している場合、それはまったく異なる魚のケトルです。
デビッドリチャービー

2
私にはコンピュータサイエンスのように聞こえます。コンピューターアーキテクチャ、クラスターコンピューティング、グリッドコンピューティングなど。すべて関連するすべてのコンピューターサイエンス。
デイブクラーク

回答:


9

Blue Watersの一般的なジョブは、マシンの約10%を使用し、合計75 ノード時間を消費します。Blue Watersには約27500のノードがあるため、これらの「75ノード時間」ジョブの一部はわずか数分で実行されます。これにより、科学者はマシンをある程度インタラクティブに使用できます。(移動平均はここで見ることができます:http : //xdmod.ncsa.illinois.edu/#tg_usage : group_by_Jobs_none

スーパーコンピューターは、小さなコンピューターの単なる大きなコレクションです。1つの場所にまとめて収集する主な理由は、その方法で最も効率的にコストを共有できるからです。多くの作業を実行できるコンピューターを作成しようとしていますが、そのために総所有コスト(コンピューター、電力、およびメンテナンスの総コスト)がコンピューターの寿命にわたって最小化されます。

総所有コストには、いくつかの要因が関係します。機器のコストは1つです。所有コストを最小限に抑えるには、機器が燃え尽きるまで、可能な限り多くの時間(理想的には100%、現実的にはやや少なく、95%が良いと見なされるなど)、機器が有用な作業を行うようにします。または廃止されます。対照的に、ラップトップまたは携帯電話のコンピューターは、実際に所有している時間の10%未満しか実際に使用されていません(眠っている時間は33%、起きている時間の約半分を食べてリラックスしている、コンピュータを「使用」しているときでも、ほとんどの時間プロセッサはアイドル状態です。)

2つ目は電力のコストです。これにはいくつかの部分があります。最初は電力自体のコストです。そのコストの一部は、発電所からコンピューターへの電力輸送に費やされます。その一部は、コンピューターの「電源」(AC電源をDC電源に変換するだけ)で失われます。通常、より大きなAC-> DCコンバーターをより効率的にすることができます。さらに、コンピューターは有用な電力を廃熱​​に変えます。そのため、熱を除去するための支払いも必要です。繰り返しますが、通常、大型のエアコンは、複数の小型エアコンよりも効率的にすることができます。

3番目は、メンテナンスのコストです。多数のコンピューターをまとめて、残りのコンピューターが稼働し続けるように設計することにより、ノードがすべて異なり、異なる建物に配置されている場合よりもはるかに多くのコンピューターノードでメンテナンススタッフのコストを償却できます(または都市)。

詳細:ブルーウォーターズには288のキャビネットがあります。各キャビネットには96個の「ノード」があります。各ノードはごく普通のハイエンドコンピューターです。ほとんどのノードには、2.3GHzで動作する2つのAMD Opeteron 6276プロセッサーと64GバイトのDRAMが搭載されています。代わりに、ノードの約1/6に、単一のAMD Opteron 6276、NVidia K20 GPU、および38GByteのDRAMがあります。あなたが望んでいた場合は、程度のために、「ノード」に似た何かを買うことができる$ 3000 $ 4000およびビデオゲームをプレイするあなたのリビングルームに置きます。Blue Watersには約27648のノードがあります。 https://bluewaters.ncsa.illinois.edu/hardware-summary

各ノードはおそらく500ワット以上を消費し、その電力を熱に変えます。リビングルームにビデオゲームをプレイするノードがあれば、それほど大したことではないでしょう。それは壁のコンセントからいくらかの電気を消費し、小さな個人用スペースヒーターと同じくらいの熱を発生します。冬には、それは一種の素敵で居心地の良いものになるでしょう。夏には、家を快適に保つために、より頻繁にエアコンを運転する必要があります。毎日一日中フルパワーで稼働していると、電気代が大幅に上がり、おそらく現在消費している電力の2倍になります。

しかし、27648個を組み合わせると、約15メガワットを消費し、それに応じて大量の熱が発生します。Blue Watersの真のエンジニアリングの驚異は、他の大規模なデータセンターと同様、建物そのものです。それは巨大な冷蔵ボックスです。ブルーウォーターズの建物は、非常に効率的であるため、特に興味深いものです。建物に入る電力の約85%が実際にノードの実行に使用されます。私はどこかを読んでいると信じています(現時点では見つかりません)。電力変換と廃熱の除去で失われるのは15%だけです。これは、リビングルームの500 Wゲーミングコンピューターから得られるものよりもはるかに優れています。エアコンを作動させるには、おそらく750Wの「電源」と数百ワットが必要でしょう。

TL; DR

すべてまとめましょう。数千台の小さなコンピューターをまとめ、多くの人々に使用を広げることで、ほとんどの時間、それらのコンピューターを実行し続け、非常に効率的な方法でリソースを共有します。ほとんどの場合、アイドル状態のコンピューターを使用するには多くの費用がかかります。計算でお金を節約する最良の方法は、ほとんどの場合コンピューターが混雑するようにコンピューターを共有することです。

Blue Watersは、内部のコンピューターだけではありません。可能な限り電力効率がよくなるように特別に設計されています。その一部には、送電線の電力損失を減らすために発電所の近くに置くことが含まれます。以下は、シャンペーンイリノイ州のブルーウォーターズを含む一部の衛星写真です。 ここに画像の説明を入力してください


4

スーパーコンピューターは現代の研究において非常に重要です。それらは、供給/需要/管理の動的性、および継続的なアップグレード/交換サイクルに応じて、常に総容量で使用されるとは限りません。防衛産業で武器シミュレーションに使用される大規模なスーパーコンピューターがあります(第二次世界大戦におけるコンピューターの発明の初期の理論的根拠/衝動の1つに一致し、発射体の軌道を計算します)。この使用法はあまり公表されていません。現代の兵器シミュレーションは核兵器用であり、高度に分類されています。シミュレーションにより、新しい武器の設計を計算シミュレーションのみで正確に「テスト」できます。米国は、この理由から中国などの先進国への高度なコンピューティング技術の輸出さえ拒否しています。

他にも多くの用途があります。製品設計のダイナミクスをシミュレートするために使用できます。たとえば、タイド社は、洗濯石鹸のさまざまな成分を最適な方法で混合する方法を見つけ出す必要があり、最適な混合の計算を支援するためにスーパーコンピューターが使用されました。

ほとんどのスーパーコンピューターでは、複数の異なるプロジェクトを実行します。それらは共有リソースとして使用され、管理者は全体的な負荷、研究価値などに基づいてプロジェクトを選択するための戦略を持っています。

スーパーコンピューターの基本的な価値は、非常に大規模な計算を、全体的なCPU容量が少ない「より小さい」コンピューターで実行できないことです。しかし、過去10年間で、「市販の」技術(別名COTS)を搭載したスーパーコンピューターの構築に大きな変化があり、価格が下がり、非常に高いパフォーマンスが維持されています。

ウィキペディアでは、スーパーコンピューターの基本的な使用方法について言及していますが、これは部分的なリストです。

  • 1970年代/天気予報、空力研究(Cray-1)。[83]
  • 1980年代/確率的分析、[84]放射線遮蔽モデリング[85](CDC Cyber​​)。
  • 1990年代/ブルートフォースコードの破壊(EFF DESクラッカー)。[86]
  • 法的行為核不拡散条約(ASCI Q)の代替としての2000年代/ 3D核実験シミュレーション。[87]
  • 2010s /分子動力学シミュレーション(Tianhe-1A)[88]

1
最近ではスーパーコンピュータは、上の作業に強い絆持つビッグデータ深い学習
vzn

3
これは、質問の主な側面と思われるものに対処します。常に複数のプロジェクトを同時に実行する場合、特定のサイズのスーパーコンピューターを持つことのポイントは何ですか?容量C / 2だけが必要で、1台の大きなコンピューターよりも2台の小さなコンピューターを構築する方が安価である場合、容量Cのコンピューターを使用する意味は何ですか?
デビッドリチャービー
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.