チップが過熱すると、正確に誤動作し始めるのはなぜですか?


26

チップが過熱すると、誤動作を開始する可能性があります。たとえば、コンピューターの一部またはすべての部品が過熱すると、多くのプログラムが失敗し始める場合があります。

チップが過熱したときにチップが誤動作する原因は何ですか?

回答:


26

他の答えを展開します。

  1. より高い漏れ電流:これは、より多くの加熱問題につながる可能性があり、簡単に熱暴走を引き起こす可能性があります。
  2. 熱雑音が増加すると、信号対雑音比が低下します。これにより、ビットエラーレートが高くなり、プログラムが誤読され、コマンドが誤って解釈される可能性があります。これにより、「ランダム」操作が発生する可能性があります。
  3. ドーパントは熱により動きやすくなります。完全に過熱したチップがある場合、トランジスタはトランジスタでなくなる可能性があります。これは不可逆的です。
  4. 不均一な加熱は、Siの結晶構造を破壊する可能性があります。普通の人は、ガラスを温度衝撃にさらすことで経験できます。それは少し極端に粉砕されますが、ポイントを示しています。これは不可逆的です。
  5. 帯電した絶縁プレートに依存するROMメモリは、温度が上昇するとメモリを失う可能性があります。熱エネルギーは、十分に高い場合、電子機器が帯電した導体から逃げることができます。これにより、プログラムメモリが破損する可能性があります。これは、誰かがチップを過熱したときにすでにプログラムされているICをはんだ付けする際によく起こります。
  6. トランジスタ制御の損失:十分な熱エネルギーがあれば、電子はバンドギャップをジャンプできます。半導体は、バンドギャップが小さく、ドーパントで容易にブリッジされますが、必要な動作温度ではギャップが材料の熱エネルギーよりも小さい導体にならないほど大きい材料です。これは単純化しすぎており、別の投稿の基礎となっていますが、私はそれを追加して自分の言葉で書きたかったのです。

他にも理由がありますが、重要なものはいくつかあります。


タイミング障害が「より多くの理由」の1つである可能性が高いと思われます(ワイヤ抵抗は温度とともに増加する傾向があるため、抵抗容量が制限されたタイミングパスは保証されたワーストケースタイムに違反する可能性があります)。もちろん、DRAMはより高い温度でより速く(フラッシュメモリのように)電荷をリークします。リフレッシュレートの補正なしでは、データが失われる可能性があります。
ポールA.クレイトン

13

高温でのIC動作の主な問題は、個々のトランジスタのリーク電流が大幅に増加することです。リーク電流は、デバイスのスイッチング電圧レベルが影響を受けるほど大きくなる可能性があり、そのため、信号はチップ内で適切に伝搬できず、機能しなくなります。通常、冷却すると回復しますが、常にそうとは限りません。

高温動作(最大300°C)の製造プロセスでは、非常に広い温度範囲でリークが少ないため、シリコンオンインシュレーターCMOSテクノロジーが採用されています。


9

優れた答えの1つに過ぎません。技術的には、ドーパントの移動度を高めるのは、固有のキャリア濃度の増加です。熱エネルギーの増加によりシリコン結晶格子が「振動」し始め、電子と正孔がデバイスを流れにくくなるため、ドーパント/キャリアの可動性が低下した場合-光学フォノン散乱間違っている。

固有のキャリア濃度がドーピングレベルを超えて増加すると、デバイスの電気制御が失われます。シリコンをドープする前に存在するのは真性キャリアです。半導体の考え方は、pn接合やトランジスタが行うその他の興味深いことを生成するために独自のキャリアを追加することです。シリコンは約150℃を超えており、実際には150℃はそれほど難しくないため、ヒートシンクRFおよび高速プロセッサは非常に重要です。固有のキャリア濃度とデバイスのオフリーク電流との間には直接的なつながりがあります。

他のチャップスが示しているように、これはチップが失敗する理由の1つにすぎません-ワイヤボンドが熱くなりすぎてパッドから飛び出すような単純なものにさえなる可能性があり、物事の膨大なリストがあります。


ドーパントの移動性が向上すると言うとき、キャリアではなく物理原子を意味します。PN接合はドリフトし、時間と熱によりダイオードになることがなくなります。第二に、電子と相互作用する高エネルギーフォノンと構造内のはるかに高いIRレベルの両方を作り出す熱エネルギーを十分に高くすると、伝導層と価電子層の間のバンドギャップをジャンプするのに十分なエネルギーを電子に与えることができます。Siは、150℃で電子にジャンプ能力を与えるようなバンドギャップがあるため、トップになります。
-Kortuk

ええ、違う出発点から同じことを言っていると思います。
サイモンバーカー

1
あなたがそれを説明している方法は、デバイス物理学を取った後、適用された量子デバイスと固体デバイスをいくつか取った後、私が望む方法とまったく同じように聞こえますが、私たちはこれらの説明がいかに単純化されているかを知っています。私はそれが非常に重要だと思うので、この影響について少し答えに追加しました、あなたに値するあなたの最初の+1を与えました。これは非常に急速に熱暴走につながるため、重要な影響です。
-Kortuk

8

リーク電流は増加しますが、多くのMOSベースのデバイスでは、「オン」状態のMOSトランジスタを通過する電流量がデバイスが熱くなるにつれて減少するという大きな問題が予想されます。デバイスが正しく動作するためには、ノードを切り替えるトランジスタは、そのノードが切り替えられることに依存する前に、回路のその部分の潜在的な静電容量を充電または放電できる必要があります。トランジスタの電流通過能力を低下させると、ノードを充電または放電できるレートが低下します。回路の別の部分がそのノードの切り替えに依存する前に、トランジスタがノードを十分に充電または放電できない場合、回路は誤動作します。

NMOSデバイスの場合、パッシブプルアップトランジスタのサイズを決める際に設計上のトレードオフがあったことに注意してください。パッシブプルアップが大きいほど、ノードは低から高にすばやく切り替わることができますが、ノードが低である場合はより多くの電力が無駄になります。そのため、このようなデバイスの多くは、正しい動作の限界近くで動作しており、熱に基づく誤動作はかなり一般的でした(そして、ビンテージエレクトロニクスの場合も残っています)。一般的なCMOSエレクトロニクスでは、このような問題は一般にそれほど深刻ではありません。実際には、マルチGHZプロセッサのようなものでそれらがどの程度の役割を果たすのか分かりません。


2
これは非常に重要な効果です。Kortukに彼の答えに追加するように頼もうとしていました。プロセッサの最大Tj仕様の背後にある要因の1つは、そのTjを超えるとプロセッサが定格速度で動作しない可能性があることです。これはまた、より良い冷却がオーバークロックに役立つ理由です。
アンディ

最初の段落は、コンピューターが熱くなったときに動作を停止する理由です。クロック周波数に対応するには速度が低下しすぎます。
W5VO

実際、NMOSデバイスで役割を果たしている可能性がある別の要因がありますが、ほとんどの典型的なデザインでは期待していません。多くのNMOSデバイスには、ダイナミックストレージノードでデータを使用または更新する要件によって課される最小クロック速度がありました漏れによって排出される前。リーク電流が温度とともに増加すると、最小クロック速度も増加します。ほとんどのデバイスは最低クロック速度を超えて十分に動作していたので、最低速度を上げても問題はないと思いますが、よくわかりません。
-supercat

@アンディ、@ W5VO、昨夜私の答えを書いていて、途中でそれを忘れていました。夜勤は脳にダメージを与えます。
Kortuk

2

既存の答えを補完するために、今日の回路は次の2つの経年変化の影響を受けやすくなっています(これらだけでなく、150 nm未満のプロセスでの主な影響です)。

温度はキャリアの移動性を高めるため、HCIとNBTIの効果が増加しますが、NBTIとHCIの主な原因は温度ではありません。

  • HCIは高周波によって引き起こされます
  • 高電圧によるNBTI

これら2つのシリコンエージング効果により、トランジスタに可逆的および不可逆的な損傷が発生し(絶縁体基板に影響/劣化することにより)、トランジスタの電圧しきい値(Vt)が上昇します。結果として、同レベルの性能を維持するためにデバイスはより高い電圧を必要とします。これは、動作温度の上昇を意味し、他の投稿で述べたように、トランジスタのゲートリークが増加します。

要約すると、温度は実際には部品をより古くするのではなく、部品を古くするのはより高い周波数と電圧(オーバークロック)です。しかし、トランジスタの経年劣化は、部品をより熱くするより高い動作電圧を必要とします。

冠動脈:オーバークロックの結果は、温度と必要な電圧の上昇です。


1

ICが不可逆的に故障する一般的な理由は、さまざまな要素間の相互接続を作成するために使用される内部のアルミニウム金属が溶けてデバイスが開くか、ショートするためです。

はい、漏れ電流は増加しますが、一般に問題となるのは漏れ電流そのものではなく、これが引き起こす熱と、それに伴うIC内部の金属の損傷です。

電源回路(電源、高電流ドライバーなど)が破損する可能性があります。高電圧では、トランジスタドライバーがすぐにオフになると、デバイスのラッチアップを引き起こす内部電流が発生するか、ローカルでの不均等な電力分布が発生するためです。加熱とそれに続く金属の故障。

多数の(1000の)繰り返しの熱サイクルは、ICとパッケージの機械的膨張の不一致により故障を引き起こし、最終的にはボンディングワイヤがはがれたり、プラスチックパッケージ材料の境界が定められたり、その後の機械的故障が生じたりします。

もちろん、多数のICパラメトリック仕様は特定の温度範囲でのみ規定されており、これらはこの範囲外の仕様にはない可能性があります。設計によっては、これにより故障が発生したり、許容できないパラメトリックシフトが発生したりする可能性があります(ICが温度範囲外にある場合)-これは極端な高温または低温で発生する可能性があります。


アルミニウムは660°C(1220°F)で融解します。ICは、この温度に達する前に死にます。
ドミトリーグリゴリエフ

基本的にいいえ。これより低い温度では、望ましくない電気的動作が発生する可能性があります。過剰な加熱と熱暴走がありますが、実際には、回路の一部がAl(または他の金属)がシリコンに拡散する温度に達するまで、永続的な障害は発生しません。これ(共晶点)は約500〜600 Cです。他のほとんどの障害は回復可能です。追加の故障は、トランジスタのゲートに過電圧が印加されることを可能にする電気的な誤動作または熱サイクル(機械的故障の原因)によって引き起こされる場合があります。
jp314

まだ疑問があります。たとえば、ICは通常、最大はんだ付け温度を約300°Cに指定しているため、その制限を超えると永久的な損傷を引き起こすのに十分なようです。
ドミトリーグリゴリエフ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.