CPUにそれほど多くの電流が必要なのはなぜですか?


37

単純なCPU(IntelやAMDなど)は45〜140 Wを消費し、多くのCPUは1.2 V、1.25 Vなどで動作することを知っています。

したがって、CPUが1.25 Vで動作し、TDPが80 Wであると仮定すると、64アンペア(大量のアンペア)を使用します。

  1. CPUの回路に1 Aを超える電流が必要な理由(FinFETトランジスタを想定)ほとんどの場合、CPUはアイドリングしており、CPUにはクロックがあるため60 Aはすべて「パルス」ですが、CPUが1 Vおよび1 Aで動作できないのはなぜですか。

  2. たとえば、小型で高速なFinFETトランジスタ:3.0 GHzで動作する14 nmは、(およそ)何アンペア必要ですか?

  3. 電流が大きいと、トランジスタのオン/オフが速くなりますか?


27
最新のCPU(どれも「シンプル」ではない)は、すべて独自の電力要件を持つ複数の電圧レールを必要とします。あなたの質問には多くの仮定があり、多くの誤った記述があります。単一のレールの要件だけでなく、すべての電源要件を考慮する必要があります。
Wossname

8
最新のCPUでFinFETトランジスタカウントを実行します。すべての FETがVddからグランドに電流を流すわけではありませんが、そうであっても、64 AがこれらのスイッチングFETの*非常に多数*に分配されます。
glen_geek

9
@EricLippert「壁から64アンペアを引き出す必要があります」-CPUが110 Vで動作しないのではないかと疑っています。
Andrew Morton

6
節約される量はエネルギーであり、平均して電力でもあります。CPUが64ワットを消費する場合、電源装置はソケットから少なくとも 64ワットを消費する必要があります。110Vでも1A未満です。
MSalters

6
@EricLippertコンピューターのマザーボードには、電源電圧(デスクトップの場合は12V、ラップトップの場合はおそらく12〜19V)をコア電源電圧まで下げるマルチフェーズDC / DCコンバーターが含まれています。これは一定のPOWERで行われるため、出力電流は最終的に入力電流の10〜20倍になります。言うまでもなく、デスクトップコンピューターの12V電源は、一定の電力で変換するスイッチング電源からも供給されます。コンピューターのCPUには、おそらく電流を処理するための少なくとも100の電源ピンと接地ピンがあります。
alex.forencich

回答:


70
  1. CPUは想像力の広がりによって「単純」ではありません。それらには数十億個のトランジスタがあり、各トランジスタにはアイドル時にわずかなリークがあり、スイッチング時に他のトランジスタのゲートと相互接続容量を充電および放電する必要があります。はい、それぞれに小さな電流が流れますが、それにトランジスタの数を掛けると、驚くほど大きな数になります。64Aはすでに平均電流です...スイッチング時、トランジスタは平均よりも多くの電流を引き込むことができ、これはバイパスコンデンサによって平滑化されます。64Aの数値はTDPから逆方向に動作して実際に64A RMSになっていることを思い出してください。多くの時間スケールで大きな変動が生じる可能性があります(クロックサイクル中の変動、異なる操作中の変動、スリープ状態間の変動など)。 )。また、1.2ボルトで3 GHzで、1ボルトと1アンペアで64アンペアで動作するように設計されたCPUを実行することで逃げることができるかもしれません。その時点で、チップが最小クロック周波数のダイナミックロジックを使用するかどうかを心配する必要がありますが、数百MHzからGHzで実行し、定期的にディープスリープに切り替えて平均を取得する必要があるかもしれません現在のダウン。一番下の行は、電力=パフォーマンスです。最新のCPUのパフォーマンスは、実際には熱的に制限されています。そのため、平均電流を下げるために、数百MHzからGHzで実行し、定期的にディープスリープにサイクルする必要があります。一番下の行は、電力=パフォーマンスです。最新のCPUのパフォーマンスは、実際には熱的に制限されています。そのため、平均電流を下げるために、数百MHzからGHzで実行し、定期的にディープスリープにサイクルする必要があります。一番下の行は、電力=パフォーマンスです。最新のCPUのパフォーマンスは、実際には熱的に制限されています。
  2. これは、比較的容易で計算することである- Iは電流であるが、Cは負荷容量であり、Vは電圧であり、αは、活性因子であり、fはスイッチング周波数です。FinFETのゲート容量の球数を取得して編集できるかどうかを確認します。 =CvαfCvαf
  3. 並べ替え。ゲート容量の充電または放電が速いほど、トランジスタの切り替えは速くなります。充電を高速化するには、容量が小さい(ジオメトリによって決まる)か、電流が大きい(相互接続抵抗と電源電圧によって決まる)必要があります。個々のトランジスタがより速くスイッチングするということは、より頻繁にスイッチングできることを意味し、その結果、より多くの平均電流が流れます(クロック周波数に比例)。

編集:そのため、http://www.synopsys.com/community/universityprogram/documents/article-iitk/25nmtriplegatefinfetswithraisedsourcedrain.pdfには、25nm FinFETのゲート容量の図があります。物事を単純にするために、0.1 fFと呼ぶことにします。どうやらそれはバイアス電圧によって変化し、トランジスタのサイズによって確実に変化します(トランジスタは回路内の目的に応じてサイズが決まりますが、すべてのトランジスタが同じサイズになるわけではありません!しかし、それらはまた、より高いゲート容量を持ち、駆動するためにより多くの電流を必要とします。

α=10.375μA。それに10億を掛けると、375 Aになります。これは、3 GHzで10億個のトランジスタをスイッチングするのに必要な平均ゲート電流(1秒あたりのゲート容量への充電)です。これは、CMOSロジックの切り替え中に発生する「シュートスルー」をカウントしません。これは平均値でもあるため、瞬間的な電流は大きく変化する可能性があります。RC回路が充電されるにつれて、消費電流が漸近的に減少することを考えてください。基板、パッケージ、および回路基板上のバイパスコンデンサは、この変動を滑らかにします。明らかにこれは単なる大まかな数字ですが、それは正しい規模のようです。また、これは、他の寄生要素(配線など)に蓄積されたリーク電流や電荷も考慮しません。

αα=1αα=0.25αα=0.000061α。そのため、キャッシュメモリの電力消費は通常、リーク電流によって支配されます。つまり、スイッチングの代わりにリークの周りに座っているアイドルトランジスタがたくさんあります。


4
1V 1Aは奇妙なターゲットではなく、ARM CPUはmW / MHzとして一般的に指定されています。比較として、Raspberry Pi A +全体は700 Mhz CPUを含む1 Wを使用します
-MSalters

2
クロックサイクルごとに実行される作業量は大きく異なるため、「ワットあたりのMIPS」を参照する方が便利です。
pjc50

1
まあ、それはチップが何をするように設計されているかに依存します。1.2 GHzで3 GHzで動作するように設計された80 WのTDPを搭載したチップは、1 Vおよび1 Aで動作する可能性があります...さらに速度を落とす必要があります。その場合、3 GHz付近には到達しません。ただし、自分で試したことはないので、実際に何を達成できるかはわかりません。たぶん、3 MHzは、1Vおよび1Aのi7に対して少し悲観的です。あなたが言及したように、今では、その電力レベルで動作するチップを設計することは確かに可能です。
alex.forencich

6
それらは単純ではありません。実際、これらは私たちがこれまでに構築した中で最も複雑なものの1つです。
joojaa

2
最新のIntel / AMD CPUは、クロックがすぎると実際に機能しなくなる少なくともいくつかの動的ロジックを使用します。Intel Skylake(たとえば)には、最小の効率的な周波数/電圧ポイントがあります。SoCのさらに低い電力/スループットレベルを達成するために、可変デューティサイクルでスリープとコアの切り替えが行われます(1 GHzで800us以上(最も効率的なf)、スリープ状態で休止)。参照EfraimロテムのIDF2015 Skylakeマイクロアーキテクチャのパワー-MGMTトークで約53分で
ピーター・コルド

17

ウィキペディアによると、2011年にリリースされたトップCPUには、約5億から25億個のトランジスタがありました。10億個のトランジスタを搭載したCPUが64Aの電流を消費すると仮定すると、平均電流はトランジスタあたりわずか64nAです。数GHzの動作周波数を考慮すると、実際には驚くほど少ないです。


CPUの動作周波数を高くするには、より高い電流が必要ですか?
呂カー

2
0+kfCV2 fcはクロック周波数、kは定数であり、Vは動作電圧であり、I0は漏れ電流です。kは、特定の時間にスイッチングするトランジスタの数とチップ設計によって異なります。
スペロペファニー

4
この時点で、CPUを溶かすことなく同時に使用できるよりも多くのトランジスタをCPUに配置できます。したがって、常にチップの大部分はダークシリコンです。電源が投入されていませんが、チップの他の部分(異なる特殊機能を備えた)の電源が切れている間、使用されるのを待っています。たとえば、ベクトル浮動小数点ハードウェア、ベクトル整数乗算器、およびベクトルシャッフルユニットを一度にすべて飽和させることはできませんが、それぞれを単独で使用すると高いスループットが得られます。また、大きなキャッシュはあまり切り替わりません。
ピーターコーデス

1
これは、AESやSHA暗号化命令、IntelのBMI2(特にPEXT / PDEPビット抽出/デポジット)など、より多くの特殊なハードウェアをCPUが獲得する大きな要因です。一部のワークロードを高速化できますが、使用していないときに電源を入れる必要がないトランジスタバジェットと関係があります。
ピーター
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.