CDNを使用している高可用性アプリの測定に関する推奨事項を探しています
私は、高可用性アプリケーション(つまり、5秒のページ間ナビゲーションで99.5%増加しているアプリ)のパフォーマンスと可用性を正確に測定することに苦労しているFortune 500企業で働いています。この可用性の数値を決定するために、予定されたダウンタイムと予定外のダウンタイムの両方を考慮します。ただし、最近CDNをミックスに追加したため、メトリックが少し複雑になります。現在、CDNはトラフィックの約75%を処理し、残りを独自のサーバーに送信しています。 「真のユーザーエクスペリエンス」と呼ばれるものの測定を試みます(つまり、テストスクリプトは、一般的なユーザーがアプリケーションをクリックすることをエミュレートします)。これらの監視スクリプトは、ネットワークの外側にあります。時間。 経営陣は、可用性を測定するために最悪のシナリオを採用することを決定しました。したがって、オリジンサーバーに問題があり、CDNがコンテンツを正常に提供している場合でも、可用性が低下します。同じことが逆の場合にも当てはまります。私は、「ユーザーエクスペリエンス」が成功している限り、不必要に自分を罰するべきではないと考えています。結局のところ、パフォーマンスと可用性を改善するためにCDNがあります! 他のフォーチュン500企業が可用性の数値をどのように計算するかについての知識を持っている人がいるかどうか疑問に思っています。たとえば、ダウンしていないように見えるCDNを使用する店頭のapple.comを見てください(主要な製品発表がある場合を除きます)。これらの指標で不必要に自分自身を傷つける必要があるとは思わない。私たちはされているこれらの数字に基づいてビジネス上の意思決定を行います。 しかし、これらの指標が経営陣に見えることを考えると、問題は非常に迅速に解決され、解決されます(読む:すぐに赤テープを切り抜けます)。何らかの外部要因(CDN)が数値に影響しているため、アプリケーションがアップまたはダウンしていること。 考え? (誤ってこの質問をStackOverflowに投稿しましたが、クロスポストは事前に申し訳ありません)