Ubuntu 14.04が長期間後にランダムにフリーズし、自動的に再起動できない(crontab)


1

しばらくの間、組み立てられたPCでのubuntu 14.04のインストールに問題がありました。主なコンポーネントは、マザーボード、ASRock Q1900M Pro3、4gb ram、および2つのpci sataコントローラーです。

私はこのコンピューターをホームサーバーとして使用します。主な機能は、ファイル共有(samba)、ローカルWebサーバー(LAMP)、bittorrentダウンローダー(Tixati)、および「多重化ステーション」です(必要ないので、尋ねないでください)。それに加えて、メインPCの電源を入れる必要がないと感じるときはいつでもWebブラウジングに使用します。メインPCはアイドル状態で3倍の電力を消費します。

Tixatiが動作せず、インターネットの閲覧と多重化が難しいため、サーバーバージョンのubuntuをインストールできません。また、一般的なデスクトップ環境は、コマンドラインよりも使いやすい方法です。

私には2種類の問題があります:

  • 電源を入れて実行すると、かなりの時間が経過した後、マシンがランダムに動作を停止します(約24時間以上のアップタイムの後、場合によってはさらに早く問題が発生します)。フリーズは、ほとんどの場合、PCを直接使用していないときに発生しますが、入力を行っている間に2〜3回フリーズしました。その結果、画面は処理する最後のフレームまでフリーズし(推測)、どのタイプの入力も無視されます。また、ローカルネットワークから切断されますが、イーサネットLEDは引き続き機能し、緑色のリンクLEDは常にオンになり、オレンジのアクティビティは特定の周波数なしで数回点滅します(ランダムに言うこともあります)。dd-wrtルーターから、ホストが切断されていることがわかり、pcをpingしようとすると、100%のパケット損失が発生します(samba共有がダウンしている)。ハードディスクのアクティビティも主導しません この状態ではtはまったく点滅します。マシンをリブートできる唯一の方法は、ハードな方法です(電源ボタンを押したままにする)。dmesgログファイルを確認すると、フリーズする前に疑わしいエントリが見つかりません。前回の最後のエントリは、crontabで自動ジョブを実行していました。画面が非アクティブになることはありませんので、フリーズする前に最後のものを見ることができます。どんな種類のエラーメッセージも見たことがありませんでしたが、気付いた唯一の奇妙なことは、一度画面が完全に灰色になったことで、そのままにしておきませんでした。前回、最後のエントリは自動ジョブを実行するcrontabでしたが、他の場合はufwブロッキングのような他の何かを実行していました。画面が非アクティブになることはありませんので、フリーズする前に最後のものを見ることができます。どんな種類のエラーメッセージも見たことがありませんでしたが、気付いた唯一の奇妙なことは、一度画面が完全に灰色になったことで、そのままにしておきませんでした。前回、最後のエントリは自動ジョブを実行するcrontabでしたが、他の場合はufwブロッキングのような他の何かを実行していました。画面が非アクティブになることはありませんので、フリーズする前に最後のものを見ることができます。どんな種類のエラーメッセージも見たことがありませんでしたが、気付いた唯一の奇妙なことは、一度画面が完全に灰色になったことで、そのままにしておきませんでした。
  • この問題を解決するために、crontabを使用して1日に1回自動的に再起動すると問題が解決する可能性があると考えましたが、ここで2番目の問題に遭遇しました。2番目の問題は、ほとんどの場合、crontabがPCを再起動し、正常にシャットダウンしますが、結果的なブートに失敗し、grubの終了とハードディスクからの読み込みの開始との間でシステムがぶら下がります羊。grubで「テキスト」オプションを使用する(または静かなスプラッシュを削除する)場合でも(メッセージの変更後にファイルgrubを更新します)、メッセージは表示されず、紫色の画面がそのまま表示されます。おもしろいのは、その状態からハードな方法でシャットダウンする必要があることです。再度オンにすると、ブートシーケンスが正常に機能し、grubが起動します。10秒後に選択されたオプションに入り(ubuntuを正常に起動します)、システムはすべてのカーネルメッセージが正しくかつ高速に表示されて起動します。修復ブートツールの自動修正オプションを試してみました。4〜5回の自動再起動で機能しましたが、何らかの理由で、もう一度実行しても機能しません。

ブート修復の初期分析はこちらですhttp://paste.ubuntu.com/12589606/

これがdmesgログファイルです。http://paste.ubuntu.com/12632375/

  • 1192行目:システムのフリーズ強制再起動->エラーのログなし
  • 2399行目:自動再起動が失敗し、grubとRAMへのファイルのロードの間でシステムがハングする->エラーが記録されない
  • 5423行目:手動で再起動して更新プログラムをインストールします。grubとRAMへのファイルのロードの間でシステムがハングします->エラーは記録されません

BIOS設定のギャラリー:作業中

フリーズ状態でのpcの動作のビデオ:作業中

自動再起動に失敗したPCのビデオ:作業中

追加情報が必要な場合はお知らせください。ご協力いただきありがとうございます。


好奇心からmemtestを実行しましたか?
ダニエル

@Danielは「起動memtest86+して、少なくとも2つの完全なパスを実行しましたか?」という意味です。
ワルチネーター

^はい、それはより完全な文です。
ダニエル

ここでの結果は、エラーなし
Alduin NDC

回答:


0

これは完全な答えではありません。自作のシステムを持っているのでdmesg、ParanoiaをHighに設定し、Confusion filterをLowに設定して(非常に偏執病で、仮想環境で簡単に混乱する)ダンプを読み、いくつかの興味深いアイテムを見つけました。

これ問題になる可能性があるため、調査する必要があります。

623 Sep 30 07:43:26 ubuntu-server kernel: [    0.907105] hpet: number irqs doesn't agree with number of timers

のインストールを検討してくださいthermald

672 Sep 30 07:43:26 ubuntu-server kernel: [    0.998865] Consider also installing thermald for improved thermal control.

これは本当に疑わしいものです。どのプロセスを「リアルタイム」で実行していますか?リアルタイムプロセスが気に入らない場合、すべてのCPUを消費し、報告された問題のように見えます。(突然のH / Wスパズもそうです)。rtkitなしでしばらく実行できますか?

1086 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Successfully called chroot.
1087 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Successfully dropped privileges.
1088 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Successfully limited resources.
1089 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Running.
1090 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Watchdog thread running.
1091 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Canary thread running.

1093 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Successfully made thread 2010 of process 2010 (n/a) owned by '1000' high priority at nice level -11.
1094 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Supervising 1 threads of 1 processes of 1 users.

1097 Sep 30 07:43:42 ubuntu-server rtkit-daemon[2012]: Successfully made thread 2083 of process 2010 (n/a) owned by '1000' RT at priority 5.
1098 Sep 30 07:43:42 ubuntu-server rtkit-daemon[2012]: Supervising 2 threads of 1 processes of 1 users.
1099 Sep 30 07:43:42 ubuntu-server rtkit-daemon[2012]: Successfully made thread 2084 of process 2010 (n/a) owned by '1000' RT at priority 5.
1100 Sep 30 07:43:42 ubuntu-server rtkit-daemon[2012]: Supervising 3 threads of 1 processes of 1 users.

ロギングシステムに問題がありますか?これを一般原則に基づいて修正します。

3293 Oct  1 08:02:11 ubuntu-server rsyslogd-2039: Could no open output pipe '/dev/xconsole': No such file or directory [try http://www.rsyslog.com/e/2039 ]

これは通常のシャットダウンです。

3935 Oct  1 08:10:42 ubuntu-server rsyslogd: [origin software="rsyslogd" swVersion="7.4.4" x-pid="967" x-info="http://www.rsyslog.com"] exiting on signal 15.

最後のクラッシュ前のログエントリの表示に近づくには、これをシェルで起動します(したがって、自動的に再起動しません)。

# set nap to sleep time (GNU sleep takes floating point values)
nap=2.5
# forever, or until the world ends
while [[ : ]] ; do
    dmesg -T >logfile
    sleep $nap
done

クラッシュ後、変更日との内容を確認しlogfileます。$napこれによりシステムの負荷を減らすには値を増やし、値を減らしdmesgてクラッシュ時の近くに格納します(より多くの負荷がかかります)。ただし、これは一時的なデバッグであるため、負荷についてはあまり気にしません。間陶器なるdmesg -T >logfileデータの前にシステムがクラッシュすると、それが失われますディスクにすべての方法を取得しますが、ハードウェアのデバッグおよび/またはリアルタイムでは困難である場合は、データがディスク上に保存され、オーバーヘッドがあります、バッファリング、など。


これに時間を割いてくれてありがとう、本当に感謝しています。現時点でthermaldは、温度の問題ではないと確信していても、をインストールしました。また、rtkitデーモンを停止し、そのスクリプトをあなたが提案した設定で実行させました。これで、PCは自動的に再起動しなくなります。次のクラッシュまでにどれだけの時間を維持できるかを見てみましょう。ご協力ありがとうございます。
アルドゥインNDC

更新:今朝、pcは8.37でフリーズしましたが、提供されたスクリプトはログファイルを適切に作成できませんでした。0kbのファイルを作成しました。とにかく興味深い事実は、Tixatiが通常7:43に自動的に閉じられることですが、システムは8:37に凍結し、CPU使用率は0%で、端末ウィンドウは1つしか開きません。
Alduin NDC

待って、あなたは見知らぬ人のスクリプトを解雇し、それが何かをしたかどうか見ませんでしたか?$ nap秒ごとにログファイルが作成されるはずです!ハードウェア/ソフトウェアのハイゼンバグのデバッグが非常に新しい、または睡眠不足の方、または管理者です。変更のログを保持していますか?
ワルチネーター

私はそのスクリプトが何をするのかを知っていて、それを試してみると、すべてのシステムログエントリでファイルを正しく作成しましたが、再起動時に何らかの理由でファイルが破損したか何かがあり、最終的に0kになりました。そして、はい、私は睡眠不足であり、ハードウェア/ソフトウェアのデバッグに非常に新しいですが、あなたはどこかから始めなければなりません。ご協力いただきありがとうございます。
アルドゥインNDC
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.