Linuxベースのデータセンターで時間ドリフトを検出するための戦略は何ですか?


14

すべてのLinuxベースのデータセンターで時間ドリフトを検出するための戦略は何ですか?これは、最初に思われるよりも難しい問題です。

時間のずれは特定のアプリケーションに深刻な問題を引き起こす可能性があり、多くの場合、NTPがインストールされていても、次の(およびその他の)理由で失敗する可能性があります。

  • NTPは、再起動時に自動的に再起動するように正しく設定されていません。
  • サーバーの設定が正しくないため、サーバーが指すタイムサーバーが到達不能または不正確です。
  • マスタータイムサーバーに到達できず、すべてのサーバーと同期しているため、信頼できないソースに同期しています。

個々のサーバーがすべて正しいかどうかを検出する方法を教えてください。テストスクリプト/アプリケーションがインストールされているサーバーは正しくない可能性があることに注意してください。


6
あなたの理由は偽物だと思います。運用上のNTPは農場にとって重要です。NTPが正常に機能していることを確認します。また、ローカルマスタークロックを展開します。
user539484

NTPは、多くのLinuxディストリビューションですぐに使用できるようになり、実用的なデフォルトになりました。今ではほとんど問題ではありません。
マット

回答:


20

これは簡単に制御できます。構成管理が重要です...

ntpサービスが実行され、構成されていることを確認してください...

たとえば、Monitを使用して実行中であることを確認しntpd、失敗した場合に再起動するのは簡単な方法です... cronなどの必須デーモンをそのようなチェックに追加するのは理にかなっています。

別のオプションは、Puppetなどの構成管理ツールを使用して、同じntpd.confをサーバーに強制し、ntpdがインストール、構成、実行されていることを確認することです。

NTPプロトコルには、到達不能なタイムサーバーのインスタンスを処理するのに十分な冗長性があります。複数のソースを指定します。


3
この感情をエコーし​​なければなりません。構成管理と複数のNTPサーバーは、「データセンター」に近づいているインフラストラクチャの非常に基本的な部分です。中規模以上のデータセンターには、ハードウェアクロックが必要です。GPS時刻源は数百ドルで購入でき、はんだごてが100ドル未満の場合。
クリスS

このソリューション+ nagios
あそこの男

4
のステータスを確認する方法ntpdは非常に重要です。「ntpdが実行されています。すべてがすばらしい!」と言いたくありません。システムが同期していて、機能するピアを持っていること、またはホストと監視ボックス間の時間オフセットが最小であることを実際に確認する必要があります。Nagios を使用する場合はcheck_ntp_peer、Nagiosがそれcheck_ntp_timeを処理します。
voretaq7

ステータスを確認する
ntpq

10

nagiosにはさまざまなcheck_ntpプラグインがあります。

以下がその1つです。

http://nagiosplugins.org/man/check_ntp

このチェックをnagiosホストに追加し、何か問題が発生した場合にアラートを取得します。


はい、監視システムをセットアップして、時間が有効であること、または少なくとも監視システムに対するオフセットが最小であることを確認します。
ゾレダチェ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.