5
うるう2日目にLinuxサーバーのクラッシュが頻繁に発生する人はいますか?
*注意:混乱したカーネルが原因でサーバーにまだ問題があり、再起動できない場合-システムにインストールされているgnu dateで提案される最も簡単な解決策はdate -s nowです。これにより、カーネルの内部「time_was_set」変数がリセットされ、Javaおよびその他のユーザースペースツールでCPUが占有するfutexループが修正されます。私は自分のシステムでこのコマンドを実行し、スズで言うことを実行していることを確認しました* 死後 Anticlimax:死んだのはクラスターへのVPN(openvpn)リンクだけだったので、再確立するのに刺激的な数秒がありました。それ以外はすべて問題なく、うるう秒が過ぎた後、ntpの起動は正常に完了しました。 私はその日のすべての経験をhttp://blog.fastmail.fm/2012/07/03/a-story-of-leaping-seconds/に書きました。 http://my.opera.com/marcomarongiu/blog/2012/06/01/an-humble-attempt-to-work-around-the-leap-secondの Marcoのブログを見ると、彼はntpd -xを使用して1時間のスキップを回避するために、24時間にわたって時間の変更を段階的に行います。これは、独自のntpインフラストラクチャを実行するための代替の塗り付け方法です。 ちょうど今日、2012年6月30日(土)-GMTの開始後すぐに開始。さまざまなチームによって管理されているように、さまざまなデータセンターに少数のサーバーがあります-pingに応答せず、画面が空白になります。 それらはすべてDebian Squeezeを実行しています-ストックカーネルからカスタム3.2.21ビルドまでのすべてを備えています。ほとんどがDell M610ブレードですが、私はDell R510を失い、他の部門も他のベンダーのマシンを失いました。また、クラッシュし、無関係であると思われた古いIBM x3550もありましたが、今は疑問に思っています。 私が言ったからスクリーンダンプを取得した1つのクラッシュ: [3161000.864001] BUG: spinlock lockup on CPU#1, ntpd/3358 [3161000.864001] lock: ffff88083fc0d740, .magic: dead4ead, .owner: imapd/24737, .owner_cpu: 0 残念なことに、ブレードにはすべてkdumpが構成されているはずですが、非常に激しく死んだためkdumpがトリガーされず、コンソールのブランキングがオンになっていました。コンソールブランキングを無効にしたため、指が交差したため、次のクラッシュ後に詳細情報を入手できます。 それが共通のスレッドなのか、それとも「私たちだけ」なのかを知りたいだけです。異なる時期に購入され、異なる管理者(私はFastMail.FMの管理者)が実行する異なるデータセンターの異なるユニットであるということは本当に奇妙です...そして今では異なるベンダーのハードウェアですらあります。クラッシュしたマシンのほとんどは数週間/月稼働しており、3.1または3.2シリーズのカーネルを実行していました。 直近のクラッシュは、3.2.21を実行して約6時間しか稼働していなかったマシンでした。 回避策 わかりました、ここで私がそれを回避した方法を示します。 無効なntp: /etc/init.d/ntp stop http://linux.brong.fastmail.fm/2012-06-30/fixtime.plを作成しました(コードはMarcoから盗まれました。コメントのブログ投稿を参照してください) fixtime.plうるう秒セットがあることを確認するために引数なしで実行しました fixtime.plうるう秒を削除する引数を指定して実行しました 注:に依存しadjtimexます。squeeze adjtimexバイナリのコピーをhttp://linux.brong.fastmail.fm/2012-06-30/adjtimexに置きました。squeeze64ビットシステムに依存せずに実行されます。のディレクトリと同じディレクトリfixtime.plに配置すると、システムのディレクトリが存在しない場合に使用されます。明らかに、64ビットsqueezeがない場合は、自分で見つけてください。 ntp明日また始めます。 匿名ユーザーが提案したように-実行する代わりにadjtimex、自分で時間を設定するだけで、おそらくうるう秒カウンターもクリアされます。