現在、いくつかのVMおよび「ベアメタル」サーバーを実行しています。Javaは高稼働しています-時折400%以上。サーバーが「java-120秒以上ブロックされています」-kjournaldなどのコンソールのエラーでランダムにハングします。
何らかの理由でこのエラーはコンソールにのみ書き込まれるため、dmesgの出力を取得できません。これはリモートでホストされているためアクセスできません。したがって、完全なトレースをコピーすることはできません。
私はこれがオンになっている環境を変更しました-物理サーバーであっても、それはまだ起こっています。
これがhttp://docs.redhat.com/docs/en-US/Red_Hat_Enterprise_Linux/6/html/Technical_Notes/deployment.htmlに従って誤検知である場合に備えて、hung_task_timeout_secsを0に変更しました。
また、irqbalanceはインストールされていません。おそらく役立つでしょうか。
これはUbuntu 10.04 64ビットです。最新の2.6.38-15-serverおよび2.6.36と同じ問題です。
CPUまたはメモリの問題/スワップなしがこの問題を引き起こす可能性がありますか?
コンソールメッセージは次のとおりです。
[58Z?Z1.5?Z840] INFUI task java:21547 blocked for more than 120 seconds.
[58Z?Z1.5?Z986] "echo 0 > /proc/sgs/kernel/hung_task_timeout_secs" disables this
message.
[58Z841.5?Z06Z] INFUI task kjournald:190 blocked for more than 120 seconds.
[58Z841.5?Z336] "echo 0 > /proc/sgs/kernel/hung_task_timeout_secs" disables this
message.
[58Z841.5?Z600] INFUI task flush-202:0:709 blocked for more than 120 seconds.
[58Z841.5?Z90?] "echo 0 > /proc/sgs/kernel/hung_task_timeout_secs" disables this
message.
[58Z841.5?3413] INFUI task java:21547 blocked for more than 120 seconds.
[58Z841.5?368Z] "echo 0 > /proc/sgs/kernel/hung_task_timeout_secs" disables this
message.
[58Z961.5?ZZ36] INFUI task kjournald:60 blocked for more than 120 seconds.
[58Z961.5?Z6Z5] "echo 0 > /proc/sgs/kernel/hung_task_timeout_secs" disables this
message.
[58Z961.5?31ZZ] INFUI task flush-202:0:709 blocked for more than 120 seconds.
[58Z961.5?3393] "echo 0 > /proc/sgs/kernel/hung_task_timeout_secs" disables this
message.