理由はわかりませんが、Ubuntu 10.04LTSマシンでps
またはw
コマンドを実行できません。私は両方についてトレースを行いましたが、同じファイルの一部を読み取るときに両方とも停止しました。
これが実行結果ですps
そして、ここでは「の結果ですw
...自体を読み取るときにファイルも停止しましたか?http://pastebin.com/9qRB5eHh
何が起こっている?
理由はわかりませんが、Ubuntu 10.04LTSマシンでps
またはw
コマンドを実行できません。私は両方についてトレースを行いましたが、同じファイルの一部を読み取るときに両方とも停止しました。
これが実行結果ですps
そして、ここでは「の結果ですw
...自体を読み取るときにファイルも停止しましたか?http://pastebin.com/9qRB5eHh
何が起こっている?
回答:
NFSサーバーがダウンしたときに、私は一度それが起こりました。
pid 17398に関する情報を読み取ろうとしてハングし、pid 17398がD
(ディスク待機)状態にあるという事実は、それも原因である可能性を示唆しています。
read(6, "Name:\tconvert\nState:\tD (disk sle"..., 1023) = 664
open("/proc/17398/cmdline", O_RDONLY) = 6
NFSマウントがある場合は、NFSサーバーを再起動することをお勧めします。
そうでなければ、umount -f <mount>
助けになるかもしれません。
mount
言うの?ハングする可能性もあることに注意してください(そうすべきではないと思いますが、100%確実ではありません)。
ため息閉じた質問の処理はかなり貧弱です、これは私がこれをタイプするのを試みる3回目ですので、簡潔さを許してください。
まず、intr
NFSマウントを使用します。デフォルトのhard
NFSマウントは永久にハングします。soft
タイムアウト後にNFSマウントエラーが発生すると(一時的なエラーの場合は愚かになるintr
ことがあります)、ハングしたNFS操作を中断するかどうかを決定できます。ちょうどいい。
第二に、この愚かな問題を修正するために、私は以前に愚かなトリックを使ったことがありますが、おそらくまだ機能します。上のインターフェイスエイリアスを起動lo
NFSサーバーのIPアドレスを持つ(編集:ifconfig eth0:0 <ipaddress>
)。/etc/exports
ハングしているファイルシステムをエクスポートする行を含むファイルを作成します(編集:「ハングした」ファイルシステムと同じ名前のファイルシステムをエクスポートします。マウントしたものと同じパス名を作成する必要があります) 。ローカルマシンでNFSサーバーを起動すると、ハングしたプログラムが「ファイルが見つかりません」または「ディレクトリが見つかりません」などのエラーでエラーが発生し、再起動せずに作業を続行できます。
終了したら、NFSサーバーを再びオフにし、インターフェースのエイリアスを削除することを忘れないでください。
hard
マウントタイプを使用していると想定しました。:)
なぜNFSに重点を置いているのかわかりません。質問者はNFSを実行していますか?それについては何も見ませんでした。
とにかく、これは/ proc以来非常に奇妙な問題です。次のことを試して、問題の詳細を確認してください。
再起動することをお勧めします。procからデータを読み取ることができない場合、他の方法で何を見つけることができるかわかりません。それが再び起こるなら、心配し始めてください。