Linuxモニターログと電子メールアラート?


13

再起動したい電源ボタンが故障したサーバーがあります。通常、/ var / logのacpidログファイルが約10時間ほどゴミのスパムを開始するなどの警告サインがあります。

acpidログを監視し、新しいアクティビティが発生したときにメールで通知する簡単な方法はありますか?

私は自分が極端に進歩しているとは思わないので、このようなことを成し遂げるためにあなたが持っているかもしれない「ガイド」はとても役に立ち、とても感謝しています。ありがとうございました!


電源ボタンやサーバーを変更することはもっともらしいソリューションですか?
Meetai.com 14

回答:


19

LogWatchのようなものを使用できます。または、次のような単純なスクリプト(環境に合わせて変更する必要がある擬似コードです):

 #!/bin/bash
 GREP_STRING=`grep -c <error string> <acpid log location>`
 if [ $GREP_STRING -ne 0 ] 
 then
    <send email notification>
 fi

それをcronに入れて1時間ごとに実行すると、電子メールが届き、使い物にならないことを知らせます。


1
ログウォッチは私に最適です。
J.Zimmerman

3
このスクリプトの問題は、ファイルが回転迎えるまでに何度も同じエラーを送信することである
chmeeeを

Ubuntu / Debianでは、logwatchは次のコマンドでインストールできます。aptitudeinstall -y logwatch
Meetai.com 14

8

OSSEC HIDSを使用して、ログファイルにルールを設定し、同時にホストからセキュリティ情報を取得できます。

設定はとても簡単です:

  • ソースをダウンロードする
  • 解凍して./install.shを実行します
  • ローカルインストールを選択
  • 質問に答える(電子メール、小切手など)
  • /var/ossec/rules/local_rules.xml以下の指定に従って編集
  • OSSECを起動します /var/ossec/bin/ossec-control start

local_rules.xml

<group name="local,syslog,">
  <rule id="100001" level="13">
    <regex>^.*Your string.*$</regex>
    <description>I've just picked up a fault in the AE35 unit. It's going to go 100% failure in 72 hours</description>
  </rule>
</group>

ルールは非常に柔軟で複雑にすることができます。この表を参照して、ルールに含まれるパラメーターの概要を把握してください。

他のセキュリティ機能が必要ない、または必要ない場合はincluderulesタグの下の行を削除することで無効にすることができます。


5

Nagiosがネットワークで複数のマシンを監視するために働いている場所で実行するものを提案します。その非常に良い私はあなたのやることに特に使用していませんが、エラーが発生したときにあなたに電子メールを送るように確実に設定することができます。

Ubuntuにインストールするためのガイドhttp://beginlinux.com/blog/2008/11/install-nagios-3-on-ubuntu-810/と、http://www.debianhelpにインストールするためのガイドがあります。 co.uk/nagiosinstall.htm


3

そして、あなたは次のようなものでそれを送ることができます:

EMAILMSG="/tmp/logreport.$$"
echo "Something to put in the email" >> $EMAILMSG

cat $EMAILMSG | mail -s "Whatever Subject You Like" user@domain.com
rm -f $EMAILMGS

3

私が使用しているのZabbixをオンデマンドで障害のあるサーバを再起動するIPMIツールで。また、OSSECも良い選択だと思いますが、実際に試してデバッグする必要があります。


3

サーバーにSplunkをダウンロードしてインストールます。ログウォッチに似ていますが、ログの検索エンジンを提供します。

ログにインデックスを付けるように設定し、ログを検索してパターンを見つけ、エラーを見つけ、その特定の障害点で他のログが何をしているかを調べることができます。

特定のしきい値でアラートを送信したり、スクリプトを実行したりするように設定することもできます。そのため、特定のエラーがログにスパム送信されるようになった場合は、スクリプトを実行して、問題のあるサービスを自動的に再起動できます。

サーバークラスタでsplunkを使用していますが、これは命の恩人です!


Splunkの+1はかなり良さそうなので、今晩遅くに試してみます。
マークデビッドソン

1

以前の雇用主では、logsurfer +を使用してログをリアルタイムで監視し、電子メールアラートを送信しました。誤検知を調整するには多くの時間と設定が必要ですが、さまざまな調査結果とアラートに対して非常にうまく機能するルールセットがあり、Nagiosが同様の目的で使用するよりもはるかに価値がありました。

残念なことに、フィルタリングしたもののサンプルを提供するために構成ファイルにアクセスすることはもうできませんが、サイトはより多くの情報と例を提供する必要があります。


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.