Nagiosを使用して、かなりの数(〜130)のサーバーを監視しています。各サーバーでCPU、ディスク、RAM、その他いくつかのことを監視します。私は常にリモートコマンドを実行するためにSSHを使用してきました。リモートサーバーに追加の構成をほとんどまたはまったく必要としないからです。nagios-pluginsをインストールしてnagiosユーザーを作成し、SSHキーを追加するだけです。シェルスクリプト。NRPE経由でSSHを使用することによるパフォーマンスへの影響を実際に検討したことはありません。
Nagiosサーバーへの負荷ヒットについてはそれほど気になりません(おそらくそれが何をするかについては仕様が過剰であり、CPUが10%を超えることはありません)、各リモートチェックを30秒ごとに実行し、各サーバーには5つの異なるチェックがあります実行されました。SSHはチェックごとにより多くのリソースを必要とすると思いますが、大きな違いはありますか?(つまり、NRPEへの切り替えを保証するのに十分な違い)。
それでも問題がなければ、物理サーバー(通常は8、12、または16の物理コア)とAmazon EC2中/大規模インスタンスの混合を監視します。