ログファイル内の繰り返しパターンを検出およびレポートするツールを知っている人はいますか？[閉まっている]

12

閉まっている。この質問はトピック外です。現在、回答を受け付けていません。

この質問を改善したいですか？ 質問を更新することがありますので、話題のサーバー障害のため。

3年前に閉店しました。

Javaアプリケーション（log4j）から大きなノイズの多いログファイル（500m /日）を監視する必要があります。今、私は手動でファイルを見て、「ERROR」のgrepなどをしています。ただし、ツールがファイル内の繰り返しパターンを見つけてカウントし、個々のエントリの詳細をドリルダウンできるようにする必要があります。誰でもそのようなツールを知っていますか？テキストまたはWebベースのUIがいいでしょう。

log-files

— デビッド・ティンカー
ソース

1

私にとってこの質問は絶対に叫びperlます。

— ジョン・ガーデニアス

うーん、多くのgrepsでbashスクリプトを作成する必要があるように見え始めています。パターンを自動的に把握するものが欲しいと思っていました。

— デビッドティンカー

真剣に、これはまさにperlが作成されたものです。これらのパターンの自己学習スクリプトを作成できますが、ここでは明らかに範囲外です。

— ジョンガーデニアス

stackoverflow.com/questions/2590251/…にはチェーンソーと呼ばれるソリューションがあります。

— ジョン別名hot2use 16

datadoghq.com/blog/log-patterns <-強くお勧めしますが、それほど高価ではありませんが、それほど安くはありません。

— neokyle

3

ログファイルにベイジアンフィルタリングを適用して、定期的なログエントリと比較して興味深いものを見つける人々のことを耳にします。彼らはスパムフィルターを使用しました。そこでは、日常的な興味のないエントリは「良い」と見なされ、異常なエントリは「スパム」と見なされ、その色を使用して移行することができました。

機械学習のように聞こえますが、実際には動作していません。ビールでしか聞いていません。

— アダモ
ソース

これは私にとって完全に理にかなっているようであり、サーバーログに常に表示される特定の単語について（ベイジアンの意味で）非常に強力な事前の前提を設定することさえできます。

— ドリューコンウェイ

うん、これは仕事をするでしょう。誰でも私が訓練できる実装を知っていますか？

— デビッドティンカー

CRM114から始められると思います。または、Drew ConwayがMachine Learning for Hackersを公開するまで待ちます。私はまだ提案したものへの元の参照を見つけるために働いています。

— アダモ

うん！2005年にこのsage-membersスレッドで読み返しました。メールの作成者はspamprobeに言及しています。

— アダモ

6

Splunkは、この種のものに対して驚異的な働きをします。内部的に使用して、すべてのログを収集し、その優れたブラウザベースのインターフェースを介して迅速な検索を行います。

— バーハン・ハリド
ソース

残念ながら、私たちは、おそらく非フリー版とそのaは高価なビット必要があるだろう

— デヴィッド・ティンカー

3

syslog-ngにはfeatureという名前のpatterndbがあります。パターンを作成し、ログエントリをリアルタイムで照合してから、それらのエントリを個別のログファイルに送信できます。

— 石
ソース

2

syslog-ngとpatterndb（上記の回答に対する+1）を調べていると、ELSAというWebベースのツールに遭遇しました：http : //code.google.com/p/enterprise-log-search-and-archive/。perlのF / OSSであり、Webインターフェースを備えており、非常に高速であるはずです。

まだ試していませんが、patterndbを使用したフィルタリングが完了したら、ELSAを試します。

— エドワードティーチ
ソース

1

プチを試してみてください。
log4j形式で機能するかどうかはわかりませんが、そのためのカスタムフィルターを作成できる場合があります。
PetitにはWebインターフェイスがなく、シェルにグラフが表示されます（ASCII art ftw！）。
繰り返されるメッセージをすばやく確認し、それらがいつ発生したか、またはより頻繁に発生し始めたかを把握することは非常に便利です。

— 偽物
ソース

0

サーバーでdebian / squeezeを使用している場合は、log2mailをご覧ください：http ://packages.debian.org/squeeze/log2mail

— トーステン
ソース

0

Gloggは非常に優れたログエクスプローラーです。文字列と色のラインに基づいてフィルターを作成したり、すべての出現を文字列に取得したりすることができます。

http://glogg.bonnefon.org/

— アレクサンドル・ルー
ソース

0

通常、Splunkはこれに適したソリューションです。しかし、あなたはそれがあなたにとって高すぎると言いました。そのため、LogstashまたはGrayLogを確認することをお勧めします。

— ラファエル・ルティガー
ソース

-1

SEQRELのLogXtenderを試すことができます。これは、パターンを自動的に検出し、同様のログを集約します。その方法は、その場で正規表現を作成し、キャッシュされた正規表現を使用して他のログと一致させることです。分類法の検出を追加すると、さらに細かく追加できます。無料版はhttps://try.logxtender.netからダウンロードできます。

— ミネア
ソース