isyncテーブルが時間とともに急激に縮小し、rsync / inodeの問題が発生する
Linux(それはAmazon AWS、CentOSのようなシステム上にありますが、カスタマイズは正確には行われていません)を、LVM上のXFSボリュームとして4TBストレージでセットアップします(最終的にはNFS4経由での提供に使用されますが、まだ使用されていません)、rsyncを使用してファイルを本番のNFSサーバーからXFSボリュームに同期しています(つまり、NFS経由のソースからローカルにマウントされたXFSベースのLVMボリュームにrsyncを実行しています)。ただし、中間のある時点でrsyncがますます遅くなり始め(スループットが大幅に低下)、負荷平均とメモリ消費の両方が大幅に増加しました(そしてCPUはiowaitで非常に大きな割合を占めています)。最終的に私はXFSシステムをリブートし、システムは通常の状態に復帰したようです。少なくとも24時間はrsyncのパフォーマンスがより正常でした。 muninのモニタリンググラフを確認したところ、明らかなことは何もわかりませんでしたが、「Inode table size」および「open inode」メトリック(/ proc / sys /から読み取られる値を指すmuninプラグインの実装を確認しました) fs / inode-nr)は時間とともに減少し続けました。rsyncがスタックするのを観察する少し前に、両方のメトリックが数十万から数千の値に下がっているのを観察しました(非XFSサーバーはほとんどの場合ほぼ500,000のままで、長期間にわたって単調な減少傾向を示しません) )、次のようなカーネルからのログを観察しました: ip-XX-XXX-XXX-XXXログイン:[395850.680006] hrtimer:割り込みは20000573 nsかかりました Sep 18 17:19:58 ip-XX-XXX-XXX-XXXカーネル:[395850.680006] hrtimer:割り込みは20000573 nsかかりました [400921.660046]情報:タスクrsync:7919が120秒以上ブロックされました。 [400921.660066]「echo 0> / proc / sys / kernel / hung_task_timeout_secs」はこのメッセージを無効にします。 [400921.660077] rsync D ffff880002fe4240 0 7919 7918 0x00000000 [400921.660093] ffff8800683e5638 0000000000000282 ffff880000000000 0000000000014240 [400921.660131] ffff8800683e5fd8 0000000000014240 …