collectd、statsd、JMXTransを介してデータを収集するためのGraphiteサーバーがあります...数日以来、私たちは頻繁にデータに穴を開けています。まだ保持しているデータを掘り下げてみると、カーボンキャッシュサイズが増加しています(50Kから4Mに)。収集されるメトリックの数は増加していません(metricsReceivedは約300Kで安定しています)。クエリの数が平均で1000から1500に増加しています。
奇妙なことに、キャッシュサイズが大きくなると、cpuUsageは100%(4 CPU)から50%にわずかに減少します。
不思議なことに、ディスクから読み取ったオクテットの数が増加し、書き込まれたオクテットの数が減少しています。
ほとんどの場合、デフォルト値でカーボンを構成します。
- MAX_CACHE_SIZE = inf
- MAX_UPDATES_PER_SECOND = 5000
- MAX_CREATES_PER_MINUTE = 2000
明らかに、システムで何かが変更されましたが、何が原因であるか、どのようにしてこの原因を見つけることができるのかわかりません...
何か助け?