Ubuntu 17.04でのCPUハードウェアエラー


12

私がdmesgを調べたときに受け取ったこれらのエラーメッセージについて誰かに説明してもらえますか?UbuntuとLinuxの世界は初めてです。

[ 7.802351] CPU4: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802352] CPU0: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802353] CPU5: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU0: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU4: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] CPU1: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] mce: [Hardware Error]: Machine check events logged
[ 7.802362] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802363] mce: [Hardware Error]: TSC 99561677c
[ 7.802385] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.802387] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802387] mce: [Hardware Error]: TSC 995616be4
[ 7.802388] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.802389] CPU2: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802390] CPU6: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802391] CPU3: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802392] CPU7: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.826359] CPU4: Core temperature/speed normal
[ 7.826359] CPU0: Core temperature/speed normal
[ 7.826360] CPU2: Package temperature/speed normal
[ 7.826361] CPU6: Package temperature/speed normal
[ 7.826361] CPU0: Package temperature/speed normal
[ 7.826362] CPU4: Package temperature/speed normal
[ 7.826363] mce: [Hardware Error]: Machine check events logged
[ 7.826367] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826368] mce: [Hardware Error]: TSC 99916f004
[ 7.826369] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.826369] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826370] mce: [Hardware Error]: TSC 99916f2ca
[ 7.826370] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.826400] CPU1: Package temperature/speed normal
[ 7.826401] CPU5: Package temperature/speed normal
[ 7.826402] CPU3: Package temperature/speed normal
[ 7.826402] CPU7: Package temperature/speed normal
[ 467.922330] CPU4: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922331] CPU0: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922332] CPU7: Package temperature above threshold, cpu clock throttled (total events = 86)
[ 467.922333] CPU3: Package temperature above threshold, cpu clock throttled 

4.10.0-29-generic kernalでUbuntu 17.04を実行しています


または、ソフトウェアのバグです。新しいLenovo T480Sのログに同じです。バグを参照してください。launchpad.net/ ubuntu / + source / linux / + bug / 1781924
Rolf Schumacher

回答:


8

CPUが過熱してMCE(マシンチェックイベント)に入ります...つまり、クラッシュします。syslogに他の温度関連イベントが表示されない場合は、CPUクーラー/ファン/サーマルパイプ/サーマルペーストが機能していないことが原因と考えられます。

  • このterminalコマンドでsyslogを確認してください...

    grep -i -e temp -e therm /var/log/syslog*
    
  • マシンが非常に汚れている/ほこりっぽい場合は、マシンの過熱に大きな役割を果たす可能性があります。掃除してください。

  • マシンにIntelプロセッサintel-microcodeが搭載されている場合は、それがインストールされていることを確認してください。

    sudo apt-get update
    sudo apt-get install intel-microcode
    reboot
    
  • thermald温度を制御するためにインストールしてください。

    sudo apt-get update
    sudo apt-get install thermald
    reboot
    
  • BIOSバージョンを確認します。電源投入時にBIOSに入り、バージョン番号を書き留めます。コンピュータの製造元/モデルを記載した製造元のWebサイトにアクセスします。サポート/ダウンロードセクションに移動し、新しいBIOSがあるかどうかを確認します。

  • 最後に、おそらくこれが古いマシンである場合、プロセッサとそのヒートパイプ/ファンクーラーの間にあるサーマルコンパウンドを再度適用する必要があります。これには、ある程度の技術的な経験が必要です。


1
intel-micorocode温度にどのような影響がありますか?
gene_wood

@gene_wood先ほど申し上げたように、これはおそらく、ほこり、ファン、またはサーマルコンパウンドの問題であり、マイクロコードのチェックは、リモートで問題を診断するのに役立つもう1つのステップです。CPUが古いマイクロコードを実行していると、さまざまな問題が発生する可能性があります。それをチェックする秒。
heynnema
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.