ラップトップは、通常よりも30°高温です。報告によると、CPU /負荷は正常です。何が原因で、どのように診断できますか?


10

ThinkPad t420ラップトップで最新のArch Linuxを実行していますが、温度が通常の〜45°Cから〜75-90°Cに上昇し、再起動するまでそこにとどまる、断続的な熱の問題があります。

私はいくつかの診断ツールを実行しました。これにはhtop、グーグルで提案された明白なものや他のもの、などpowertopiostats確かに私が覚えていない他のものも含まれます。これまでのところ、明らかな問題は発生しておらず、マシンが正常に実行されているか、このホットな状態で実行されているかにかかわらず、表面的には読み取り値に違いはありません。

私はまた、最も疑わしいプロセスを1つずつ(データベースや他のデーモン)殺し、隠された犯人を見つけようとしても役に立たなかった。

これらの試み以外に、トラブルシューティングをどこから始めればよいかわかりません。誰かが私をより正しい方向に向けて、より深い問題を探し始めることを望んでいます。

正確には、私の質問は、マシンを冷却する方法ではなく、CPUと負荷が正常であると報告されているシステムで、一貫して30度以上の熱変化を引き起こす可能性があるのはなぜですか?そして、それを診断するためにどのようなツール/プラクティスを使用できますか?

役立つかもしれないいくつかのメモ:

  • 私がすることができます(完全にファン制御を解除することにより、例えば)システムを冷却し、それだけで放置すれば、それはすぐに再びヒートアップ。これは保温性は問題ではなく、何かが継続的に熱を発生していることを示唆しているようです。
  • CPU使用率と負荷は、htopこのホット状態に入った後、通常どおりに報告されます。これにはカーネルスレッドが含まれます。によるとhtop、システムは基本的にアイドル状態です(システム全体で1〜2%のCPU使用率、0.10の負荷)。
  • 私のマシンはIntel HD統合グラフィックスを使用しており、他のグラフィックスカード搭載していません。@braiamが指摘したように、nVidiaカードはこのモデルのオプションでした。私はそれを選びませんでした。
  • @terdonがCPUガバナー設定を呼び出しました。私のCPUはpowersave
  • 私の特定のプロセッサは2.7GHzコアi7-2620Mです。

編集:この質問を書いている時点で、私のファンコントロールは適切に機能せず、高温でも、中程度のRPM範囲(3900 RPM)で継続的に動作していました。@Alexと@JustDanyulの提案により、これは修正されました。ただし、根本的な問題は依然として残っています。


1
slmが示すように、CPUがアイドルであるがコアの温度が高すぎる場合、唯一の説明は、何らかのイベントの後に過剰な熱が放散されなかったということです-かなりの熱を発生させることができるのはCPUだけです。ストーブバーナーを完全に回して水を沸騰させてから、蓋をしてからバーナーを低くします。水が永続的に沸騰し続けるのは、蓋同じ長さの低バーナーが熱を放散できないためです。オンです。それを分解して、それが悪い場合はそれをきれいにします。空気を吹き付けるだけでは、現時点ではおそらくあまり役​​に立ちません。
goldilocks 2013

空気の流れに問題があると思われるので、分解してきれいにしますが、CPUは、極端な温度変化を引き起こすイベントが発生した後も、一定の高温を無期限に維持します。鍋にフタをしたままでも、ある時点で水温が下がります。私の臨時雇用者はある数値に到達し、再起動するまで永遠に、その数値に一貫してとどまります。散逸の問題があることを示唆するような熱の漸進的な増加はありません。私は午前中はフルワークロードで実行しており、41度で座っています。
numbers1311407 2013

別の言い方をすると、私の体温は予想されるストレスの下で正常に調節されます。ハードコンパイルを行っている場合、60、70度に加熱される可能性がありますが、完了すると冷却されます。
numbers1311407 2013

ファンのほかに、サーマルペーストを再塗布することもできます。安価なサーマルペーストは時間が経つと消えます。
BlueRaja-Danny Pflughoeft 2013

1
多分これは愚かな質問ですが、たぶんあなたはACPIを無効にしましたか?以前、古いPCで同様の問題がありました。このオプションを有効にしても起動しませんでした。無効にすると、最終的に起動しましたが、過熱していました。
アルコ、2013

回答:


6

ファン

私もこれを行い、Fedora 14を実行します。圧縮された空気の缶を入手し、ケースの背面と側面の通気孔を吹き飛ばしてみてください。

また、定期的にキーボードを取り外して、ファンのブレードに直接圧縮空気を吹き付けます。彼らはほこりで固まり、それを重み付けすることによってその効果に影響を与え始めます。

Thinkpadの最も良い点は、サービスマニュアルです。彼らはあなたのラップトップを分解し、それを元に戻す方法を示します。

悪いプロセス

私が気づいたもう1つのことは、誤って実行されてコアの1つを100%消費するプロセスが時々発生することです。このプロセスを終了すると、通常は温度が正常に戻ります。

htopまたはtopを使用して、これがどのプロセスであるかを確認し、それをを使用して、または端末から強制終了できますPID

ほかに何か?

ラップトップのさまざまなコンポーネントの温度読み取りを取得する方法のヒントについては、このU&L Q&Aに対する私の回答を参照してください。Q&Aのタイトルは、「i3statusでhaswell i7コアのコア温度を取得する方法」です


これは間違いなく私がやるべきことですが、奇妙なのは、それが時々ホット状態になるだけで、再起動するまで持続するので、すぐに問題が修正されます。熱が持続的に変化する原因となっている何かが起こっているに違いないようです。htopを実行しても無駄になりました。CPU使用率は正常です。
numbers1311407 2013

たぶん、いくつかのウェイクはカーネルでシグナルを出しますか?
Braiam 2013

1
@slmありがとう、私はそれを試していません。次回の起動時にそうし、結果を報告します。
numbers1311407 2013

1
@ numbers1311407:再起動によって問題がすばやく解決する理由は、これによりCPUが数秒間オフになり、温度がカットオフポイントを下回ることができるためです。「アンビエント」が何であれ、CPUは常にアンビエントよりも高温です。
goldilocks 2013

1
topコマンドで「1」を押すと、個々のコアの負荷を確認できることに注意してください。
クリスチャンスチュワート

3

これは、より長いコメントのですが、見ている必要がありthinkwiki.orgそれがあるのThinkPad上のLinux用のリソースを。温度については、t4500でも同様の問題があり、

  1. CPU周波数スケーリングを制御するCPUガバナー。選択肢は次のとおりです。

    • パフォーマンスはCPUを可能な限り高い周波数に保ちます
    • PowersaveはCPUを可能な限り低い周波数に保ちます
    • ユーザ空間は、(/ SYSファイルシステムを介して)ユーザレベルの利用可能な周波数情報をエクスポートし、CPU周波数のユーザ空間制御を可能にします
    • Ondemandは、CPU使用率に従ってCPU周波数をスケーリングします(ユーザー空間周波数スケーリングデーモンと同様ですが、カーネル内)。
    • 保守的はオンデマンドのように動作しますが、頻度は段階的に増加します

    オンデマンド必要なときに、あなたのCPUは最高速度で動作します。理想的には、これは完全に透過的であり、マシンは現在のタスクで必要なだけ速く動作します。それをアクティブにするには

    sudo echo ondemand > /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
    
  2. ファン制御。「シンプルなThinkPadファンコントロール」と呼ばれる非常に優れたユーティリティがあり、ファンの速度を変化させるトリガー温度を微調整できます。こちらの情報もご覧ください


ありがとうございます。私は以前にそのwikiに出会ったことがありますが、それが正確に何であるかを実際にメモしたことはありません。
numbers1311407 2013

ちょうど注意してください、私のCPUはすべて稼働していますpowersave
数字1311407

1

自分が「暑い」と感じることには問題があると思います。Thinkpadの場合(フォーラムによれば)は約80〜85℃であり、温度の上昇を引き起こす可能性のあるnVidiaカードを忘れてしまいます(実際、Optimusの構成はうまく機能せず、CPUにGPUの動作を強制します)。つまり、CPUの最大許容温度は100Cであり到達するとシステムはシャットダウンします)、雰囲気は約10.0°C〜35.0°Cです。とはいえ、ラップトップが範囲内であれば問題ありません(バッテリーとラップトップの寿命を除く)。

次に、容疑者を指摘したいと思います。この側面では、LinuxでのnVidiaの貧弱な実装では、悪名高いオンデマンドシステムOptimusが原因でhtop(またはどこでも)に表示されない作業がCPUにスローされる可能性があります。それは一瞬までうまく機能し、それは制御なしで加熱を開始します)。Bumblebeeが完全に設定されるまで、インストールを更新する必要があります。を使用しbbswitchて、nVidiaカードを自由に無効にして、その状態を確認できます。

Bumblebee for Archをインストールするには、パッケージをリポジトリで見つけることができます。まだインストールしていない場合。


このマシンではnVidiaカードを選択しませんでした。申し訳ありませんが、質問ではそれについてより明確である必要があります。そして、80-85はそれほど熱くはありません、それでも40代半ばよりも高温です。これは、私のコンピューターが通常の軽いワークロードで実行しているものです。私の問題は、どのファントム状態が「キックイン」するかを判別しようとしているため、私の一貫性のある45を一貫性のある80-85にすることです。
numbers1311407 2013

1

センサーがファンを3900 RPM程度で鳴らしている

〜75-90°Cのような温度でも?

ファンを手動でランプアップすると、マシンが一時的に冷却されます

つまり、1つの問題は、ファンの速度が自動的に機能しないことだけです。

自動車のことは忘れてください。温度を正しく読み取ることができ、ファンの速度を手動で制御できますよね?もしそうなら、あなたがする必要があるのは、動作しているファン制御スクリプトを見つけるか、あなた自身のものを展開することです(温度をポーリングし、表に従って速度temp[i]=speed[i]を設定します、より高い速度を設定すると、温度が下がってもしばらくそれを保ちます、速度を遅くする必要がある場合は、ゆっくりと段階的に実行してください)。

世論調査については、熱変化イベントをトリガーする温度モニターデーモンと、それらのイベントをリッスン/待機するファン制御スクリプトを用意するのが最善でしょうacpid

どちらの場合(独自のスクリプトまたは既存のスクリプト)でも、ソリューションに自信がなくても、温度とRPMに常に注意を払い、ファンが停止してはなりません。

auto最初にこの問題を解決し、過熱が続く場合は、原因に集中できます。

編集する

lttng時間全体でシステム全体の統計情報を収集するようなツールを試してみるとよいかもしれませんが、セットアップが簡単でなく、長期間収集する必要がある場合は、ストレージの点で高価になる可能性があります。


私のファンコントロールがまったく機能していないとしても、あなたは正しいです。私はそれを適切に応答させることを検討しますが、それを修正しても根本的な原因を解決することはできません。私は一日中最大6400ish rpmで物を緩めて少し冷やすことができましたが、それが私が対処しようとしている原因です。
numbers1311407 2013

1

ファンを手動でランプアップすると問題が解決するので、自動ファン制御が機能していないことを示唆しているように思われるため、トラブルシューティングを開始するのに最適な場所です。

今、あなたは素晴らしいwikiで素晴らしいディストリビューション(はい、私もそれを実行しています)であるarch linuxを実行します。それで、私は尋ねなければなりません、あなたはRTFMでしたか?; p

https://wiki.archlinux.org/index.php/Lenovo_ThinkPad_T420#Fans

私が見る限り、次のことが必要です。

  1. thinkpad_acpiカーネルモジュールを有効にする
  2. AURからthinkfanアプリケーションをインストールして設定します
  3. thinkfanシステムサービスを有効にする

これはすべて完了しましたか?

更新 ファンが正常な媒体で回転するだけでなく、正常に動作していると聞いてうれしいです。(これにより、80度を超える温度で動作するマシンの問題が解決したと思いますか?)

30度の温度変化の根本的な原因についての回答については、よく聞かれます。それは、ファンが正常に動作していなかったことが原因ではないでしょうか。

それを仮定しましょう

  • プロセッサーが通常よりもハードに動作していない
  • 温度の変動はファン速度の変動に置き換えられました

まったく問題がない可能性があり、問題は、ファンがほとんど対処できないレベルで稼働していたことだけであると想定しても安全ではないでしょうか。そして、周囲温度などの小さな変化は、その能力の限界を超えていますか?

たとえば、私はAcerラップトップを持っていて、暖かい日にはファンが「常に」上下に回転していました。私のファンが実際にそれを自動調整できなかったとしたら、かなり大きな温度変動も見られただろう:)


thinkfanをインストールしました。頭を上げてくれてありがとう。うん、詳細なarch wikiはディストリビューションの素晴らしい特典です。私はそこに1000回行ったことがありますが、つまずいたり、自分の正確なモデル専用のページを探すつもりはありませんでした。素敵な小さなスクリプト。 そうは言っても、これは私の実際の問題を解決しません:異常に高い温度の原因をどのように診断しますか? 私がファンコントロールを外して最大RPMで物を緩めても、それは謎の熱の本当の問題に絆創膏を置いているだけです。
numbers1311407

いいえ、問題は変わりません。私は今、42度でここに座っています。私の熱状態が発生したとき、同じプロセスを実行します。周囲は同等であり、表面的には何も変化しませんが、温度は一貫した42から一貫して75+に上昇します。私それ冷やすことができます:ラップトップのクーラーに置いて、ファンコントロールを外して、6500 RPMで回転できるようにします。しかし、停止すると、すぐに75以上に加熱されます。最高速度でのファンは、とにかくそれがやっていたことよりわずかに速いだけです。それを修正することは良いことでしたが、根本的な問題の解決策ではありませんでした。
numbers1311407 2013
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.