回答:
nginxとlmonでログ形式の組み合わせを使用して、このようなことをキャッチします。次のようなNGINXログ形式:
log_format main '$ status:$ request_time:$ upstream_response_time:$ pipe:$ body_bytes_sent $ connection $ remote_addr $ host $ remote_user [$ time_local] "$ http_referer" "$ http_user_agent" "$ http_x_forwarded_for" $ upstream_addr $ upstream_cache_status in:$ http_cookie "'
リクエストを処理した上流サーバーなどの多くの役立つ診断情報をキャプチャし、ステータスを前面に表示するので、ログがかなり高速にスクロールしている場合でも読みやすくなります。
LMONを使用してこれらのログを監視し、ログに500 s、503 s、400 sなどのエラーが見つかった場合は、ページャー/電子メールで警告します。
http://www.bsdconsulting.no/tools/lmon-README
これは、問題が発生したときにそれをデバッグするのが最も簡単なときにアラートを受け取るのに役立ちます。
まだ検討していない場合に考慮すべきもう1つのことは、nginxはデフォルトで500を致命的な状態と見なし、別のアップストリームを試行しないことです。複数のアップストリームがある場合は、500を取得した場合に別のアップストリームを使用するように構成できます。うまくいけば、ユーザーからの失敗がわかりにくくなります。
http://wiki.nginx.org/NginxHttpProxyModule#proxy_next_upstream
error_log
です。設定ファイルも投稿してください。