ライブショップを監視する良い方法は何ですか?


41

序文: プロバイダーがPHP構成に問題を抱え、ライブWebショップの一部がクラッシュした(バックエンドとチェックアウトが機能しない)ため、Webショップの監視を拡張したいと考えています。ここで別のプロバイダーに移行することについては説明しません。

現在、ウェブショップ自体と特定のパーツ(「チェックアウトは機能していますか?」など)の可用性を監視する可能性について考えているので、質問は次のとおりです。

ライブWebサイトを監視するには、どのツールと戦略をお勧めしますか?

いくつかのアイデア:

  • チェックアウトがライブWebサイトでまだ機能している場合、自動的にチェックしますか?
  • 障害を検出するために監視する適切なパラメーターは何ですか?最終注文<1日前、最後のユーザーログイン、...
  • cronジョブの使用:ラストオーダーの日付/時刻などを確認し、それが長すぎる場合は、メールを送信するか、チェックアウトがまだ機能するかどうかを手動で確認しますか?
  • Icinga、Uptime Robotなどのソフトウェア/ツールを使用する...
  • 管理者に警告メールを送信しています...

あなたの答えを楽しみにしています:)


1
これが少し「意見ベース」に見えたとしても、私は本当にいくつかの答えを見たいと思っています:)。
マリウス

@Mariusに感謝します。これは一種の主観的なものですが、とにかく共有するのは面白いかもしれません:)
アンナフォルクル

素晴らしい質問、私は同じことを疑問に思っていました!ありがとう!
ウェッセル

回答:


30

自動化できることはいくつかあります。

  1. ショップの一部が機能しなくなった場合ユニットテストは、特定の機能がまだ機能しているかどうかを検出する良い方法です。
  2. フロントエンドをテストするには、リモートサーバーでphpQueryを使用して、「カテゴリリストにまだ製品があります」、「ホームページにフッターがあります」など、特定のキーページで特定のDOM要素を定期的に探します。
  3. ホストにpingを送信してホストがまだ使用可能かどうかを確認する単純なcronジョブを設定します
  4. ネイティブのMagento注文RSSフィードを使用して、注文がまだ入っているかどうかを確認します。交通量の多い店では、金曜日の夜に1時間注文しないと、何か問題があることを示す良い指標になります。
  5. 支払いサービスプロバイダーを監視します。オランダでは、支払いの処理にiDealを使用しています。このWebサイトには稼働時間が表示されます。PSPは同様のサービスを提供する場合があります

*ページにフッターがない場合、レンダリングを停止するPHPエラーを指している可能性があります。

これらは、私たちが使用しているいくつかのソリューションです。それらはセットアップ時間を必要とし、自由に実行できます。

ところで素晴らしい質問です、私は本当にすべての答えを楽しみにしています!


25

次のサンダーの素晴らしい答えにぴったりはまります。これは、Pingdom *のような監視サービスをセットアップして使用していることを前提としています。

  • ページ上のコンテンツに注意してください。通常、終了</html>タグ。私はbefore_body_end、エンドユーザーには見えないが500ステータスを返すサードパーティ(キャッチされていない例外など)で失敗する非常に多くのスクリプトを見てきました-SEO / Google / Webmaster Toolsにとって非常に悪いです
  • エラーが特定のしきい値を超えて増加しているときに通知するようにウェブマスターツールを設定します
  • ページで無効化されたSSLのアラートを設定します
  • ページでJavaScriptエラーのアラートを設定します
  • 支払いに失敗したメール、エラーレポートにはメールグループ/ bccを使用します。
  • コールセンターのスタッフと緊密に連絡を取り、問題のスクリーンショットを作成する方法を知っていることを確認してください。
  • 遅いサイトは、ダウンしたサイトと同じくらい悪いです。サイトの読み込みに通常よりも長い時間がかかっていることに関して、アラートが敏感であることを確認してください。
  • すべての主要なサードパーティ/ホストサービスのtwitterフィードを購読します。大規模なホストには通常、問題が発生したときにTwitterトリガーがあります。特定のアカウントが投稿したときにメール/テキスト送信するようにTwitterを構成できます。

Devops:

  • 重要なシステムを監視し、アラートを送信するためにNagiosをセットアップします
  • ログを集約し、ログデータに基づいてアラートを発行するために、syslogまたはSplunkをセットアップします(特定のクエリ数/日まで無料)。
  • ネットワーク機器のスクリプト化された定期的なチェックを構成します。NICが(何度も)戻って1GBから10MBに低下するのを私たちは知らないうちに見ました。

大規模なチームの場合:

  • CIサーバー(Travis、Jenkins / Hudson、Capistrano)をセットアップして、コミット後にテストが失敗する可能性があることを警告します。
  • ソース管理に事前コミットフックを設定して、コード標準を適用したり、壊れたコードなどの露骨な問題をチェックしたりします。
  • サンダーが言ったように、時間ごとに注文とボリュームのRSSフィードを監視するための何かを設定します-ここでの利点はキャッシュされていないことです。通常、通知のしきい値を低く設定すると潜在的な問題がすぐに発生します
  • セレンを使用します。たくさん。1〜2時間ごとにチェックアウトプロセスを実行するスクリプトテストを実施します。
  • カレンダーのリマインダーとSSLの有効期限に関する特定のアラートを設定します

大量のデータと潜在的に誤検知を生成します。アラートの影響を受けないようにしてください。


私はPingdomと提携していません。私は彼らの(無料の)製品が大好きです。


8

支払いだけではなくホスティング業者に問題がある場合は、隠されている製品のセットアップを検討し、セレンテストを書いてカートに入れてクーポンを追加して無料にし、チェックアウトをステップスルーします。


1
素敵な、私は隠された無料の製品のアイデアが好きです:-)
アンナフォルクル

5

設定に応じて、いくつかの素晴らしい回答がすでにここにあります。NewRelicを使用して、サーバーとトランザクションの統計を監視し、チェックアウトプロセスのすべてのステップで主要なトランザクションを設定します。そうすることで、携帯電話の1つの画面を見て、プロセス全体で適切な数の人がチェックアウトしているかどうか、および適切な応答時間を得ているかどうかを判断できます。最後のステップまでのすべてで大量のスループットが表示される場合、誰もカードを処理できないため、PayPalが壊れている可能性があります。また、エラーが多い場合、応答時間がオフになっている場合などにもアラートを受け取ります。これを行うためにNewRelicを厳密に必要とするわけではありません。自分のダッシュボード/アプリ/アラートシステム。


1
NewRelicの作品が魅力のようなものであることに同意します。また、Pingdomなどのサービスを使用することも、サーバーのアクセシビリティを監視するための優れたオプションであると付け加えます。
Eirik

5

私はこの点でNewRelicとPagerDutyが好きです、彼らは単に完璧であり、あなたのサイトまたはあなたのサイトの一部がダウンしている場合、1分であなたに通知します(電子メール、テキストと電話)。CPUまたはメモリが指定された使用率を超えてサイトが応答しなくなった場合にも通知します。

  • 監視するすべてのページと頻度を監視して、New Relicをセットアップします。例:ホームページ、任意の1つのカテゴリページ、任意の1つの製品ページ、カートページ、チェックアウトページなど
  • PagerDutyアラートおよび必要な通知の種類(メール、テキスト、電話)にユーザー(すべてが通知を受け取るユーザー)、スケジュール(通知を受信したい日時)、サービス(New Relicアラート)およびエスカレーションポリシーを追加します

https://www.pagerduty.com/docs/guides/new-relic-integration-guide/

免責事項:私は上記のサービスのいずれとも提携していません。



3
  • すべてのサーバー(LB、App、DB、Redisなど)およびすべてのサービス(メモリ、負荷、ioなど)の履歴値を取得するプロバイダー側​​のMunin
  • Nagios / Icingaはプロバイダーまたはローカル側にあり、すべてのサーバーの負荷をほぼリアルタイムで監視します
  • フロントページ、チェックアウトなどの「重要な」URLの応答時間を収集するためのPingdom
  • Pingdomを実際のユーザーモニタリングに使用すると、APDEXに似た値が得られ、歴史的な発展を見ることができます
  • URLとその正しいコンテンツをチェックするPingdom
  • 自動リロードモードでの最後のXオーダーのレポート。それで私は可能な休憩を見ることができます
  • 同一のステージシステムでのSeleniumによる自動テスト。私はライブシステムでの自動チェックアウトの友達ではありません。後で会計に関する問題が発生します:)
  • Email2SMS用のZapierとTwilio。重大なエラーはSMSとして電話に送信されます
  • freeboard.ioとdweet.ioを使用して、すてきなダッシュボードにすべてを表示します。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.