CPU速度を制限するものは何ですか?


102

最近、友人とLaTeXのコンパイルについて話しました。LaTeXは1つのコアのみを使用してコンパイルできます。そのため、LaTeXコンパイルの速度については、CPUのクロック速度が最も重要です(最高のLaTeXコンパイルパフォーマンスのためのハードウェア選択のヒントを参照)

好奇心から、最高のクロック速度を持つCPUを探しました。最高のクロック速度を持っていたのは、4.4 GHz(source)のIntel Xeon X5698だったと思います。

しかし、この質問は販売されるCPUに関するものではありません。あなたが価格を気にしない場合、どれくらい速く得ることができるか知りたいです。

1つの質問は次のとおりです。CPU速度に物理的な制限はありますか?どのくらいの高さですか?

もう1つの質問は、これまでに到達した最高のCPU速度とは何ですか?

冷却()が非常に困難になるため、CPU速度が制限されていると常に考えてきました。しかし、私の友人は、これが理由だと疑っています(たとえば、科学実験などで従来の/安価な冷却システムを使用する必要がない場合)。

[2]では、伝送遅延がCPU速度の別の制限を引き起こすことを読みました。しかし、彼らはそれがどれくらい速く得ることができるかについて言及しません。

私が見つけたもの

私について

私はコンピューターサイエンスの学生です。CPUについては知っていますが、あまり知りません。そして、この質問にとって重要かもしれない物理学についてはさらに少ない。可能な場合は、そのことを覚えておいてください。


10
あなたの質問は素晴らしいものです。非常に優れた教育された答えを期待してください。私の2セント:「1つのコアのみで動作する」->「クロックが最も重要」という意味は当てはまりません。
ウラジミールクラベロ14

12
オーバークロックされたCPUの現在の記録は、8.4 GHz動作するAMDブルドーザーです。液体窒素を使用して冷却しました。
tcrosley

2
質問のタイトルは「CPU速度を制限するものは何ですか?」「LaTeXは1つのコアのみを使用してコンパイルできます。そのため、LaTeXのコンパイル速度のために、CPUのクロック速度が最も重要です」という記述は必ずしも当てはまりません。CPUキャッシュも違いを生むことができます。最新のCPUがどのように機能するかと、同じ周波数で異なるキャッシュサイズを持つ異なるCPUが存在するという事実と、ソフトウェアの作成および使用方法により、CPUキャッシュは実行速度に大きな影響を与える可能性がありますCPU周波数。
シヴァンドラゴン14

2
シングルスレッドのパフォーマンスは、クロック速度に直接比例しません。関係はより複雑です。これは、最近のIntel x86マイクロアーキテクチャと、周波数の増加に伴うコストの一部を補うマイクロアーキテクチャの改善との類似性によって部分的に隠されている可能性があります。
ポールA.クレイトン14

9
2004年の2GHzプロセッサと2014年の2GHzプロセッサを比較することをお勧めします。シングルスレッドのタスクでも同じボールパークにないこと、そして両方が同じ命令セットを実装している場合でも、それらが供給されるCISC命令は1つですが、これらの細かな操作は分解されることがわかります。まったく別のものです。
チャールズダフィー14

回答:


76

実際には、CPU速度を制限するのは、発生する熱とゲート遅延の両方ですが、通常、熱は後者が作動する前にはるかに大きな問題になります。

最近のプロセッサーは、CMOSテクノロジーを使用して製造されています。クロックサイクルがあるたびに、電力が消費されます。したがって、プロセッサ速度が速いほど、より多くの熱放散を意味します。

http://en.wikipedia.org/wiki/CMOS

以下にいくつかの図を示します。

Core i7-860   (45 nm)        2.8 GHz     95 W
Core i7-965   (45 nm)        3.2 GHz    130 W
Core i7-3970X (32 nm)        3.5 GHz    150 W

ここに画像の説明を入力してください

CPUの遷移電力がどのように増加するかを実際に見ることができます(指数関数的に!)。

また、トランジスタのサイズが縮小すると、いくつかの量子効果が発生します。ナノメートルレベルでは、トランジスタゲートは実際に「漏れやすく」なります。

http://computer.howstuffworks.com/small-cpu2.htm

ここではこのテクノロジーの仕組みについては触れませんが、Googleを使用してこれらのトピックを検索できると確信しています。

さて、今、伝送遅延について。

CPU内の各「ワイヤ」は小さなコンデンサとして機能します。また、トランジスタのベースまたはMOSFETのゲートは小さなコンデンサとして機能します。接続の電圧を変更するには、ワイヤを充電するか、充電を解除する必要があります。トランジスタが小さくなると、それを行うのが難しくなります。これが、実際にメモリアレイトランジスタが非常に小さくて弱いため、SRAMに増幅トランジスタが必要な理由です。

密度が非常に重要な一般的なIC設計では、ビットセルには非常に小さなトランジスタがあります。さらに、それらは通常、非常に大きなビット線容量を持つ大きなアレイに組み込まれています。これにより、ビットセルによるビットラインの放電が(比較的)非常に遅くなります。

From:SRAMセンスアンプの実装方法

基本的に、ポイントは、小さなトランジスタが相互接続を駆動しなければならないことです。

また、ゲート遅延があります。最新のCPUには10を超えるパイプラインステージがあり、最大で20まであります。

パイプライン処理のパフォーマンスの問題

誘導効果もあります。マイクロ波周波数では、それらは非常に重要になります。クロストークなどを調べることができます。

さて、たとえ3265810 THzプロセッサーを動作させることができたとしても、他の実用的な制限は、システムの他の部分がそれをサポートできる速度です。RAM、ストレージ、グルーロジック、および同様に高速に動作する他のインターコネクトが必要です。または、膨大なキャッシュが必要です。

お役に立てれば。


1
あなたはどのようにクロック速度と消費電力の良い参照のためこの議論へのリンクを含めることができますが関連していますphysics.stackexchange.com/questions/34766/...
Emiswelt

2
伝送遅延について話すときに考慮する電気の速度もありますen.wikipedia.org/wiki/Speed_of_electricity
ryantm 14

実際に指数関数的に増加するのですか、それとも二次関数的に増加するのですか?実際、このビデオはそれを言っていPower = Frequency ^ 1.74ます。
ポールマンタ

2
ただし、CPU設計の大きな問題の1つは相互接続です。物理的に大きなチップが可能かもしれませんが、これらはギガヘルツの範囲で機能していることに注意してください。ワイヤを短くしたい。
fuzzyhair2

2
質問は理論的であるため、ヒ化ガリウムなどの他の半導体がより高い周波数を可能にすることを追加できます。
イアコポ14

32

熱の問題はファジーヘアで十分にカバーされています。伝送遅延を要約するために、これを考慮してください:電気信号がマザーボードを通過するのに必要な時間は現在、最新のCPUの1クロックサイクル以上です。そのため、より高速なCPUを作成しても、多くのことは達成されません。

超高速プロセッサは、膨大な数を処理するプロセスでのみ有益であり、コードがチップ上で動作するように慎重に最適化されている場合にのみ有効です。データのために頻繁に他の場所に行かなければならない場合、その余分な速度はすべて無駄になります。今日のシステムでは、タスクの大部分を並行して実行でき、大きな問題は複数のコアに分割されています。

ラテックスコンパイルプロセスは次のように改善されるようです。

  • より高速なIO。RAMdiskを試してください。
  • 異なるコアで異なるドキュメントを実行する
  • 200ページの画像集約型のジョブが2秒で完了することを期待していない

2
残念ながら、私は1つの賛成票しか許可されていません。あなたの答えは、クロックレートがOPの問題のボトルネックではないかもしれないことを指摘するに値します。
ソロモンスロー

17

物理的制限には、熱、ゲート遅延、電気伝送速度の3つがあります。

これまでで最高のクロック速度の世界記録は(このリンクによると)8722.78 MHzです。

電気伝送の速度(光の速度とほぼ同じ)は絶対的な物理的限界です。これは、媒体よりも高速にデータを伝送することはできないためです。同時に、この制限は非常に高いため、通常は制限要因ではありません。

CPUは膨大な数のゲートで構成されており、そのうちのかなりの数が(次々に)直列に接続されています。高状態(1など)から低状態(0など)へ、またはその逆への切り替えには時間がかかります。これがゲート遅延です。したがって、100個のゲートをシリアルに接続しており、1つのゲートが切り替わるのに1 nsかかる場合、有効な出力を得るには、少なくとも100 ns待つ​​必要があります。

これらのスイッチは、CPUで最も電力を消費するものです。これは、クロック速度を上げるとスイッチが増えるため、より多くの電力を使用するため、熱出力が増えることを意味します。

過電圧(=>より多くの電力を供給する)は、ゲート遅延を少し減少させますが、熱出力を増加させます。

3 GHz前後のどこかで、クロック速度に使用される電力が非常に増加します。これが、1.5 GHz CPUをスマートフォンで実行できるのに対し、ほとんどの3〜4 GHz CPUはラップトップでも実行できない理由です。

ただし、CPUを高速化できるのはクロック速度だけではありません。また、パイプラインまたはマイクロコードアーキテクチャでの最適化により、大幅な高速化が可能になります。これが、3 GHz Intel i5(デュアルコア)が3 GHz Intel Pentium D(デュアルコア)の何倍も高速である理由です。


1
オーバークロックすると、CPUの消費電力が直線的に増加します。したがって、クロック速度を2倍にすると、電力が2倍になります。しかし、より高いクロック速度では、そのクロック速度で動作するにはゲートが非常に遅くなり、計算エラー->ランダムクラッシュが発生し始めます。したがって、ゲートを高速化するには電圧を上げる必要があります。電力使用量は、電圧と比較して二乗します。したがって、電圧を2倍にすると、電力が4倍になります。それを追加してクロックを2倍にすると、8倍の電力が消費されます。また、必要な電圧はクロック速度とともに指数関数的に増加します。en.wikipedia.org/wiki/CPU_power_dissipation
ダッカロン14

1
ここでのもう1つの問題は、過電圧はCPUを揚げるだけで、それに対してできることは何もないということです。CPUが3.3Vなどに指定されている場合、3.7または4Vにまで上昇する可能性がありますが、高くするとチップが破壊されます。読む価値のある別のリンク:en.wikipedia.org/wiki/CPU_core_voltage
ダッカロン14

3
伝送速度問題です。3Ghzでは、10cm /サイクルしか得られません。現在、一般的なプロセッサダイのサイズは300m²であるため、1サイクルでチップのすべての部分に到達できるとは限らないため、10 Ghz以降はプロセッサ設計を再考する必要があると思います。
マーティンシュレーダー14

1
@MartinSchröder:それはそれほど問題ではありません。なぜなら、(a)CPUは10 GHzに達する前に熱とゲートの遅延により死に、(b)世代ごとにプロセッサーが小さくなるからです。たとえば、ハイパースレッディングを備えた6コアのi7は、シングルコアPentium 4とほぼ同じサイズです。ただし、i7には、ハイパースレッディング用に6つのフルコアと6つの「ハーフコア」があります。キャッシュもあります。また、これらのコアはパイプラインフェーズに分割されます。1つのサイクルで1つのコアと1つのパイプラインフェーズ(およびL1キャッシュ)にあるCPUの部分のみに到達する必要があります。
ダッカロン14

1
@ com.prehensibleあなたがリンクした投稿は、この500GHzトランジスタがアナログRF処理に使用されるアナログトランジスタ「のみ」であるという事実について具体的に語っています。決してコンピュータープロセッサではありません。
ダッカロン

5

r=5.291×1011
c=3×108,
F=1t=c2πr=9.03×1017Hz
8×109Hz

LaTeXをいくつか編集しました。周波数の編集が正しいかどうか確認してください。
マーティントーマ14

現在の技術限界をどのようにして思いついたのですか?
マーティントーマ14

現在の制限は「8x 10 ^ 9 Hz」であると書きます。xとは何ですか?最終的に乗算ドットを書きたいと思いましたか?
マーティントーマ14

1
また、最大の効果を得るために、ブラックホールのシュワルツシルト半径上に、最速のコンピューターを構築します。ボーア半径は、高速で作業するための大きな方法です。:)
ゴスウィンフォンブレダロー

3

1つの質問は次のとおりです。CPU速度に物理的な制限はありますか?

それはCPU自体に大きく依存します。製造公差の結果、物理的限界は、同じウェーハであってもチップごとに少し異なります。

伝送遅延により、CPU速度に別の制限が生じます。しかし、彼らはそれがどれくらい速く得ることができるかについて言及しません。

それは、チップの設計者が選択するtransmission delayspeed path length、選択するためです。一言で言えば、それはロジックが1クロックサイクルでどれだけの仕事をするかです。ロジックが複雑になると、最大クロックレートが遅くなりますが、消費電力も少なくなります。

これが、ベンチマークを使用してCPUを比較する理由です。サイクルごとの作業数は大きく異なるため、生のMHzを比較すると、間違った考えが得られる場合があります。


2

実際に、それは電圧の二乗にほぼ比例する火力発電definiteleyある:http://en.wikipedia.org/wiki/Thermal_design_power#Overview すべての材料は、冷却効率を制限し、その比熱容量を有します。
冷却と伝送遅延に関する技術的な問題を考慮しないと、信号が1秒あたりのCPU内を移動できる距離を制限する光の速度がわかります。したがって、CPUは、動作が高速になると、サムラーを取得する必要があります。最後に、特定の周波数を超えて動作しているため、CPUは電子波動関数(シュレーディンガーの方程式に従って波動関数としてモデル化された電子)に対して透過的になります。
2007年、一部の物理学者は、動作速度の基本的な制限を計算しました。http://journals.aps.org/prl/abstract/10.1103/PhysRevLett.99.110502


0

他のすべての答えと同様に、CPU速度に直接影響を与えないかもしれないが、そのCPUの周りに何かを構築することを非常に困難にするかもしれないいくつかの他の考慮事項もあります。

つまり、DCを超えると、無線周波数が問題になります。あなたが速く行くほど、すべてが巨大なラジオとして振る舞う傾向があります。これは、PCBトレースがクロストーク、隣接するトラック/グランドプレーンとの固有の静電容量/インダクタンスの影響、ノイズなどを受けることを意味します。

あなたが速く行くほど、これはすべて悪化します- コンポーネントの脚は、例えば許容できないインダクタンスを導入する可能性があります。

ある種のDDR RAMを備えたRaspberry Piのレベルの「基本」PCBをレイアウトするためのガイドラインを見ると、データバスなどのすべてのトレースは同じ長さである必要があり、正しい終端などが必要です。 1GHzを大幅に下回ります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.