アプリケーションでグラフィックカードが破損することはありますか?


15

クイックノート:これはゲーム開発の Q&Aサイトであることは知っていますが、グラフィックカードの知識が豊富で経験があると思いますので、この質問に答えます。これが完全にトピック外であると思われる場合は、適切なサイト/フォーラムを参照してください。編集:実際、それ gamedevに関連しています:悪いコードがカードの過熱や破壊を引き起こす可能性がある場合、ゲーム開発者はそれを認識し、アプリケーションがそれをしないことを確認する必要があります。

これは奇妙な、または愚かな質問のように思えるかもしれませんが、グラフィックカードを(何らかの形で)破壊するようなグラフィックレンダリングアプリケーションを実際に作成することは可能ですか?

この質問をするようになった直接的な理由は、(驚くことではないが)自分の壊れたグラフィックカードです。修理を行った後、サービスマンは、さまざまなアプリ(ゲーム)をテストし、正常に動作したと言いました。しかし、自分のアプリ(シェーディングデモの延期)を起動すると、100℃以上に加熱されました。したがって、私のカードは結局修正されませんでしたが、ここで重要なことは、問題が自分のアプリを実行しているときにのみ発生するように見えたことです。

さまざまなGPU要求ゲーム(Crysisなど)をプレイし、しばしば限界までプッシュしました(ゲームが5 FPSで動作するほど高い設定をしていた)、いくつかのベンチマークも...だから私は与えました私のカードは何度も作業負荷がかかりすぎて追いつくことができませんでした(したがってFPSが低い)が、危険な温度に達することはありませんでした。しかし、私自身のアプリケーションはそれを達成することができました(少なくともv-syncがオフのとき)。:Pそれは私自身のアプリでしかなかったので、悪い冷却システムが犯人だとは思いません。

だから、私は尋ねます-悪意のあるコードによってグラフィックカードを(何らかの方法で、過熱するだけで)破ることが可能かどうかを考えていますか(またはおそらく知っていますか)?

更新:

ジョー・スウィンデルは、過熱が問題になるかもしれないと言った(まあ、それは間違いなくカードを壊す可能性がある)。しかし、適切な冷却システムは、(どんな状況でも)その発生を防ぐべきではありませんか?

Borealは別の問題を指摘しました。正しく理解すれば、FPSはCPUとGPUの両方に拘束されます(そうですか?)。そのため、FPSが低いと、CPUの負荷が高いか、GPUの負荷が高いことを示す場合があります。しかし、再び-カードが「常に100%使用されている」場合でも、適切な冷却システムはGPUの過熱を防ぐべきではありませんか?


ほとんどのゲームでは、GPUを最大限に活用することはできません-多くの点でCPUに制約されます。ただし、独自のアプリケーションはCPU側で何も実行していない可能性があり、GPUの使用率がはるかに高くなります。簡単に言えば、GPUは常に100%で使用するためのものではありません。これが、使用済みGPUを今すぐ購入したくない理由です。おそらく、ビットコインマイニングに使用されているでしょう。
jmegaffin

6
@Boreal私はこれに強く反対します。あなたが高品質のボードメーカーからGPUを購入した場合、される 100%で、すべての時間を使用するように設計されており、冷却およびクロック速度は、それがこれらの条件の下で安定して確保するために設定されています。正しく取り付けられていないアフターマーケットヒートシンクがある場合、またはカードを危険なレベルまでオーバークロックする場合、それは別の話です。
ネイサンリード

「しかし、適切な冷却システムは、(どんな状況でも)それが起こるのを防ぐべきではありませんか?-GPUのファン、ヒートシンク、排気口がほこりだらけになっていると言います。これは、コンピューターの世話をしなかったためです。その後、ハイエンドの部品であっても、間違いなく過熱して破損する可能性があります。うまくいけば、熱を検出してシャットダウンし、損傷する前に自動的に再起動することを願っていますが、あなたは本当にそれに賭けたくありません。
ショーンミドルディッチ

参考までに、危険なほど過熱した場合、コンピュータは実際にシャットダウンする必要があります。これはコンピューターで無効になっている可能性がありますか?
リチャードティングル

SeanMiddleditch、「適切な」とは、とりわけ、クリーンで完全に機能する冷却システムを意味しました。RichardTingle、私は少なくとも自分でそれを無効にしていません。しかし、私の質問は一般的な問題であり、具体的なケースの解決策を探すことではありませんでした。
NPS

回答:


32

GPUが過熱しないことを保証するのはアプリの責任ではなく、過熱した場合のアプリの責任ではありません。

GPUに適切な冷却機能がない場合、はい、3Dアプリを実行すると危険なレベルまで加熱される可能性があります。アプリがそれをしてCrysisがそれをしない理由はわかりませんが、カードの冷却が不十分である、または乱れている(オーバークロックされている、または他の工場設定/ドライバーが変更されている)ことを意味します。

過熱以外に、ソフトウェアが実行中のチップに物理的に損傷を与える可能性のある他の方法は知りません。それは実際には可能ではないはずです。設計の非常に重大な失敗になります。


1
あなたの言ったことに基づいて、(プログラマーとして)私のアプリケーションが生成するGPUの負荷(および加熱)を(それがスムーズに実行される限り)まったく気にするべきではないでしょうか?
NPS

11
@NPSそう。フレームレート(およびモバイルデバイス、バッテリー寿命)に影響を与える限り、GPUの負荷を気にしますが、温度への影響を気にすることはあなたの責任ではありません-それはドライバー/ OSが心配することです。アプリがGPUを過熱した場合、アプリは適切に冷却されず、ドライバーの動的周波数スケーリングに問題があります。
ネイサンリード

4
+1、ユーザーのハードウェアが要件を満たしていること(および「ゲームプレイ中に溶けないこと」が要件としてカウントされること)と、カードを損傷から保護するために最善を尽くすハードウェア/ドライバーのジョブを確認するのはユーザーの仕事です。アプリケーションはそれに依存する必要があります(そして、そうしなければなりません)、他にできることは何もありません。
トーマス

メーカー倫理のマニフェストを書きたい:特定の仕様のハードウェアを購入すると、パッケージに記載されているすべての条件の下でこの仕様にアクセスできるはずです(通常、0から40℃が記載されています)。馬鹿げたサーマルスロットリングに苦しむことはありません。さもなければ、良い試験は、パッケージの虚偽の主張によってお金を奪われたことを証明するはずです。
v.oddou

@NPS「あなたの言ったことに基づいて、(プログラマーとして)私のアプリケーションが生成するGPUの負荷(および加熱)をまったく気にすべきではありません(スムーズに実行される限り)?」-はい、負荷に注意する必要がありますが、過熱には注意しないでください。設定値が低いほど負荷が小さくなり、冷却ノイズが少なくなることを確認してください。バッテリーでプレイすることもあるので、何もせずにCPUとGPUを100%消費するSteamでゲームに投票しますが、私だけではありません。
ピーター-アンバンロバートハーヴェイ

24

それは野生で起こりました。

2010年のStarcraft IIでは、メニュー画面のフレームレートが上限に達し、グラフィックカードに負荷がかかり、熱保護が不十分なベンダーのカードが破壊されるという問題がありました。

GPU自体の設計および製造上の欠陥により、負荷がかかった状態でカードが解体される可能性もあります。G84 / G86モバイルGPUには、許容可能な温度負荷の下で破損し、最終的に破損するはんだ接合がありました。また、XBox 360の悪名高いレッドリングオブデスもあります。これには、はんだと膨張に似た熱問題があります。

上記はすべて、ハードウェアの欠陥と不十分な熱設計が混在しており、ソフトウェアの負荷によって増幅されます。


6
スタークラフトは、私がこれについてすぐに考えた例でした。ほぼ間違いなく、スタークラフトは多くのグラフィックカードのバグを公開し、スタークラフトが実際に故障しているのではなく、そのバグの回避策を提供しました。破壊されたカードを持っている人がその区別を気にしすぎないということではありません
リチャードティングル

1
むかしむかし、スマートでないモニターの世代は、CRTCレジスターに悪い値を突っ込むソフトウェアによってフライバックトランスフォーマーを破壊することができました。追加の失敗の第三の理由は、スピードレースは100%のため、多くのmanufactuersカットコーナー、何回もカードが内蔵されていなかった頑丈なのは十分になされていることである
パトリック・ヒューズ

9

あなたの質問はあなたが書いたものよりもはるかに複雑です。一般的な質問は「ソフトウェアはハードウェアを破壊できるか?」であり、その答えは確かに「はい」です。

念頭に置いて、すべてのハードウェアがソフトウェアコマンドによって理論的に壊れるわけではありませんが、最終的にソフトウェアが行うのは、非常に繊細なハードウェアコンポーネントに電気信号を送信することです。通常、ハードウェアコンポーネントがデリケートであるほど、設計されていない方法でハードウェアコンポーネントを扱うと破損する可能性が高くなります。

ハードウェアを破壊する方法はたくさんありますが、過熱を考えてみましょう。処理作業は熱を発生させ、その熱はどこかに行かなければなりません。カードの消散特性、ケース内の空気の流れ、および部屋全体の温度に応じて、システムから除去される熱の量は、それによって生成される熱量よりも多い場合も少ない場合もあります。

ビデオカードに、効率的に放散できる以上の熱を発生させる作業を行うように要求すると、チップの温度が上昇します。そのままにしておくと、温度が安全な動作レベルを超えて上昇し、チップが破損し、魔法の煙を失い、おそらく火災の危険さえ引き起こします。あなたはビデオカードを壊したばかりです、あなたが幸せであることを願っています。

さて、これを行うソフトウェア作成できますか?私はそうは思わないでしょう。作成する(ユーザーレベルの)プログラムは、ビデオカードと直接対話しません。この状況を防ぐために設計された多くのセーフガードがあり、それらはすべて失敗する必要があるため、レンダリングプログラムは最終的に家を燃やします。

  1. 一般的に、放熱器とファンは、暑い気候(メーカーが指定した動作範囲内)で換気が不十分な場合でも、カードが生成する最大量の熱を快適に除去できるように設計されています

  2. 熱発生が熱放散よりも大きい場合、最初の防衛線はドライバーになります。ほとんどのドライバーはGPUのコア温度をチェックし、上昇する場合、ドライバーはGPUに送信する命令の量を制限して、熱の発生を防ぎます。

  3. それが失敗した場合、グラフィックカードのファームウェアは、熱が危険なほど蓄積していることを検出する必要があります。したがって、発熱を減らすためにクロック速度を下げます。

  4. それでもやはり熱が蓄積している場合、最新のCPUおよびGPUで利用可能なサーマルダイオードがビデオカードを完全にシャットダウンし、発熱が停止します。

そのため、システムを最大限に負荷するソフトウェアを構築することに加えて、過熱によってユーザーレベルのアプリケーションから高価なビデオカードを破壊したい場合は、次のものが必要になります。

  1. 熱放散システムの故障または破損。ファンに(ブレードではなく常に中央に)指を刺すだけでうまくいくはずです。難易度:簡単

  2. スロットル機能が無効または破損したカスタム(またはバグのある)ドライバー。難易度:通常

  3. クロック削減機能が無効または破損したカスタムファームウェア。難易度:ハード

  4. 破損したサーマルダイオード。熱ダイオードを絶えずトリガーしていると、熱ダイオードが損傷する可能性があります。難易度:非常に難しい

...しかし不可能ではない!お気軽に試してみてください*。ただし、消防署の電話は必ず手元に置いてください。

*:これは皮肉です。私は、火災の危険性、またはあなた、あなたの家族、犬、地域社会に何らかの損害を与える可能性のある行為を決して容認しません。この投稿を読むことにより、あなたの行動がもたらす責任を完全に放棄します。


1
多くのことに対して+1。ただし、特に犬について考える場合。:)
アンドリュートンプソン

2

VSYNCがオフの場合でも、多くのゲームは98%のGPU使用率に達することもできません。実際にゲームプレイを実装するほど、ステージングできるフレームが少なくなり、GPUが十分に活用されなくなる可能性が高くなります。マルチコア向けに最適化された優れたゲームは、GPUの使用率を100%に大幅に近づけることができますが、通常、ゲームプレイロジックは他のタスクでCPUを十分にビジーに保ち、GPUを完全なワークロードで飽和させることができません。純粋なレンダリングアプリケーションは100%のGPU負荷に簡単に到達できますが、ゲームはレンダリング以上のことを行います。

ちなみに、私の自宅のマシンでは、GPUが高負荷下でかなりのEMIを生成し、マザーボードの安価な統合オーディオに干渉します。周波数が負荷に応じて変化するアナログオーディオで、高音が聞こえます。私はそれを楽しんで、設計上の欠陥ではなく機能と考えています。GPUパフォーマンスカウンターをサンプリングしなくても実際に負荷レベルを聞くことができるので、プロファイリングは興味深いものになります。ただし、EMIに非常に敏感でシールドが不十分なデバイスがある場合、これが問題になる可能性があります。GPUの負荷が高いと、別のデバイスで障害が発生する可能性があります。


0

過熱するとグラフィックカードが破損します。あなたが見てきたように、処理できないデータの巨大なループを投げると、確かに、クラッシュし、カードに永久的な損傷を与える可能性があります。


4
しかし、どんなアプリケーションでも、カードが噛むよりも多くを与えることができます(ほとんどのゲームは、カード自体よりも数年若いです)。適切な冷却システムは、それを防ぐ必要があることではないはず、(何のアプリケーションに関係なく)?
NPS

あなたはゲームがそれを行うことができるという点で正しいです...しかし、ほとんどのコードはGPUを100%で詰まらせることはなく、もしそうなら、通常は長期間100%ではありません。とはいえ、適切な冷却システムがそれをすべて防止するはずであることに、100%同意します。
ジョースウィンデル

2
これは狂気のようです。クロック速度はCPUと同様に安全なレベルに設定する必要があります
リチャードティングル

0

はい、できます。

  • 明らかな例としての過熱は、極端なワークロードによって引き起こされる可能性があります。通常、オーバークロックにより達成されます。これは、意図的に引き起こすのが最も簡単です。

優れた冷却システムで回避できます。これを避けるには、V-syncを有効にすることも良い方法です。V-syncは、モニターが処理できるよりも速い速度でGPUがフレームを出力するのを防ぎます。これは、通常は表示されないフレームです。

少ないフレーム=少ない処理=極端なワークロードが少ない。

GPUの能力を追跡することも重要です。Crytekのプログラマーは、誰かがグラフィックカードの能力を過大評価する準備ができるようにコードを書いたと思います。もしそうなら、それは多くのGPUを節約し、多くの知らないGPU所有者をフラストレーションから救った機能だと確信しています。

  • 少し壊れた(または不適切にコード化された)データは、ポインターが想定外の場所を指すようになり、あらゆる種類のデータを破壊する可能性があります。永続的ではないかもしれませんが、動作にさまざまな程度の障害を引き起こす可能性があります。このようなCPUの障害は通常、OSによってキャッチされて回避されます。回避できない場合は、BSOD(死のブルースクリーン)が呼び出されます。

実行時の注意深いコーディングと二重チェックにより回避できます。(ただし、バグは常に存在します。存在しない場合は、彼らがあなたをいじっているからです。)

  • また、GPUにはドライバーがあり、問題が発生する可能性のある別の場所が追加されます。データの一部が破損したり、バグなどが発生したりする可能性があります。そのドライバーに追加するには、一般に、BSODを引き起こすリスクがあります。OSのフォールバックシステムは、何かがひどく間違っており、損害を最小限に抑える、または防止するために緊急シャットダウン操作を実行する必要がある場合。慎重にコーディングされたドライバーは(できれば)これを行いませんが、バグが発生する可能性は常にあります。緊急シャットダウン手順を含む。

これは、実行時に慎重なコーディングと二重チェックを行うことで回避できます。


3
幸いなことに、ディスプレイドライバは長い間BSODの重要なソースではありませんでした。Microsoftは、Windows NT 6.0(Vista)のドライバーモデルを完全に見直し、多くのドライバーをユーザーモードにプッシュしました。BSODは、カーネルモードのクラッシュによってのみ発生します。ユーザーモードのディスプレイドライバーがクラッシュした場合、最悪の事態はドライバーがそれ自体をリセットすることです-D3Dゲームではコンテキストの損失に対処し、リソースのリロードにしばらく時間を費やす必要がありますが、GLではこれから完全に透過的に回復できる場合があります。BSODを取得するには、重大な低レベルの障害が発生します。
アンドンM.コールマン

0

一言で答えます:はい。

詳細な回答:はい。(特定の状況で)可能です。GPUにデータを無限ループに劇的に転送するプログラムを作成するとします。過熱することは確かです。繰り返しますが、冷却システムがそれを処理する責任はありませんか?もちろん。ただし、冷却システムにはいくつかのしきい値レベルがあることも忘れないでください。発生した熱が冷却システムの動作範囲外である場合、冷却システムはほとんど使用されません。私はあなたのアプリが何をするのかわかりませんが、プログラマーの観点から言えば、このような状況につながるようなプログラムを書くかもしれません。


私が知る限り、これはすべて既に述べられています。それはあなたが意図したものですか?
アンコ

0
  1. 使用されている実際のカードと一致しないドライバーをインストールすると、簡単に永久的な損傷を引き起こす可能性があります。私の友人は、OSを繰り返し再インストールし、HDDを物理的に変更することで、なんとかしてそれを実現しています。

  2. PCを何度もオン/オフにします。それが失敗を引き起こす可能性があるかどうかはわかりませんが、それは非常に可能です。とにかく、softwareそれを行う非常に方法のように聞こえません。

  3. 電力を消費するUSB​​デバイスのオンとオフを切り替えて、システムの電力レベルを操作します(例:独自の電力を使用しない外部HDD)。これを行うと、次の再起動までキーボードとマウスが常に使用できなくなり、(3台のHDDを毎日2年以上挿抜して)RAMチップの1つでいくつかのセルを焼き付け、10〜20分ごとにBSODが発生しました。


1
よく分からないので、ソフトウェアでできることについて話していますか?
NPS

WRT#3、USBで使用される5Vレールは、12Vレールとは独立して電源によって調整されます。12Vレールは、CPU、GPU、およびシステムメモリに電力を供給するためにマザーボードおよびグラフィックスカードでさらに調整されます。マザーボードは多くの場合、ポリフューズを使用してUSBポートを流れる電流を制限します。これは、同じポリフューズを共有している場合、ハードドライブが接続されている場合のキーボード/マウスの問題を説明できます。プラッターをスピンアップさせる突入電流は、USB電源レールの電圧降下を引き起こし、キーボードのマイクロコントローラーの電圧低下を引き起こす可能性があります。ただし、RAMの故障はほぼ確実に偶然の一致です。
bcrist

0

私の個人的な経験:

私はかつて2008年8月頃にQuadro FX570Mを搭載したLenovo Thinkpad T61pを使用していましたが、このバッチはいつかは故障するGPUの故障を知っていました(はんだ付けはGPUピンの一部で最適ではありませんでした)。

XCOM The Bureau(実際に最適化されていないことで知られているゲーム)を実行するまで、約5年間はすべて問題ありませんでした。ラップトップは熱く、ファンは全速力で、約1時間ゲームはフリーズしましたが、通常はフリーズしませんでした。

何だと思う ?ラップトップの電源を切ってから入れ直しましたが、ビデオ障害を示す関連BIOSビープコードで死にました。

あなたの質問に答えるために:はい(他の人が指摘したように)、前者が何らかの方法で保護されいない場合、ソフトウェアは間違いなくハードウェアを壊す可能性があります。たとえば、GPUファンがオフになっている場合、間違いなく爆発し、100%の成功率で成功します:D


私の質問は、適切で機能する冷却と組み込みの安全システムを備えたハードウェアに関するものです。それ以外の場合は、ソフトウェアで障害が発生する可能性のある障害のあるハードウェアについて話しているだけです。
NPS

0

私はかつてGeForce 4 MX 440グラフィックスボードを持っていたので、プリンスオブペルシャ、サンドオブタイムをプレイしたかったのです。しかし、期待されるPixel Shaderサポートが見つからなかったため、ゲームは起動しませんでした。後のプリンスオブペルシャ:内なる戦士がうまく働いたので、これは私にとって少し予想外でした。

結局、3Dアナライザー(http://www.tommti-systems.com/main-Dateien/files.html)を見つけて、ゲームを数日間強制的に実行してプレイしました。数日後、私のビデオカードが壊れました-もう何も表示しませんでした。私は約5〜6か月間新しいコンピューターを使用していたので、この方法でゲームを強制的に実行すると、ビデオカードが実際に壊れたと思います:(


-1

はい、私はいくつかを壊しました。グリッドgpu計算アプリをもう実行しません。一部のアプリは、特にマシンがスリープモードになったときにそれらを壊す傾向がありますが、ブロワーが作動している/液体が冷却している通常の状況では、冷却が小さすぎない限り問題はありません。


「スリープモード」とはどういう意味ですか?「スリープモード」とは、通常、RAMへのサスペンド、つまりランダムアクセスメモリのみに電力が供給されているコンピューターの電力状態を指します。グラフィックカードはどのように壊れますか?
アンコ

@Anko、ここから持って行ってください。en.wikipedia.org/wiki/Sleep_mode
Anssi

OK、それは私があなたが意味したと思ったことです。ただし、アプリケーションがスリープモードのために中断された場合、どのように損傷を引き起こす可能性があるのか​​という理由で混乱しています。
アンコ

-2

カードの回路が短絡した場合でも可能ですが、特定の高温になるまでシステムが隔離されるため、これは起こりそうにありません。場合によっては、カードの熱力学システムが実際に別のシステムに近い場合、またはシステムではない別の材料に触れている場合でも、そのシステムが乱される可能性があります。


3
そのシナリオはアプリケーションによってどのように引き起こされますか?これは問題に対処していないようです。
セスバティン

私は、論理ゲートあなたは、ANDに精通していないと信じて、OR、NOT
Orenrocco

5
そして、私はあなたが二度目にその点を見逃したと信じています。
セスバティン

1
ソフトウェアコマンドはありません。sendShortCircuitこのような短絡はグラフィックカードの欠陥になるためです。ソフトウェアはこれに対して責任を負いません。この質問は、たとえばグラフィックスカードが評価された場合、「1秒までのための100%の使用率、90%の使用率長期平均」とソフトウェアがその定格を超えないように義務づけられた程度である
リチャード・チンクル

3
@ user3643191、私たちはあなたを攻撃していません。投稿を改善および明確化できる場所を示しています。これらのコメントはすべて(最終的に)最終的に削除されます。あなたの投稿が残ります。投稿はいつでも編集および改善できますので、より良い回答をする機会を利用してください。それを行うと、おそらくいくつかの賛成票(または誰かが反対票を削除するかもしれません)を拾うでしょう、これらのコメントは最終的に消え、あなたの啓発的な答えは何年もの間教育されます。
PotatoEngineer
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.