が主催するクラウドサービスAmazon Webサービス、アズール、グーグルや他のほとんどは公開S ervice L EVEL A greementそれらが提供する個々のサービスのために、またはSLAを。アーキテクト、プラットフォームエンジニア、および開発者は、これらを組み合わせて、アプリケーションのホスティングを提供するアーキテクチャを作成する責任があります。
これらのサービスは、単独で使用すると、通常、3〜4の範囲の可用性を提供します。
- Azure Traffic Manager:99.99%または「フォーナイン」。
- SQL Azure:99.99%または「フォーナイン」。
- Azure App Service:99.95%または「スリーナインファイブ」。
ただし、アーキテクチャで一緒に組み合わせると、いずれかのコンポーネントが停止し、コンポーネントサービスとは異なる全体的な可用性が得られる可能性があります。
シリアル化合物の可用性
この例には、次の3つの障害モードがあります。
- SQL Azureがダウンしています
- App Serviceがダウンしています
- 両方ともダウンしています
したがって、この「システム」の全体的な可用性は99.95%未満でなければなりません。これを考える私の理由は、両方のサービスのSLA が次のようになっている場合です。
サービスは24時間のうち23時間利用可能です
次に:
- App Serviceは0100〜0200の間にある可能性があります
- 0500から0600の間のデータベース
両方のコンポーネント部分はSLA内にありますが、システム全体は24時間のうち2時間利用できませんでした。
シリアルおよびパラレルの可用性
このアーキテクチャには、主に次のような多数の障害モードがあります。
- RegionAのSQL Serverがダウンしています
- RegionBのSQL Serverがダウンしています
- RegionAのApp Serviceがダウンしています
- RegionBのApp Serviceがダウンしています
- Traffic Managerがダウンしています
- 上記の組み合わせ
Traffic Managerはサーキットブレーカーであるため、いずれかの地域の停止を検出し、トラフィックを作業領域にルーティングすることができますが、Traffic Managerの形式には単一障害点があるため、「システム」の全体的な可用性は99.99%を超えます。
上記の2つのシステムの複合可用性をビジネス向けに計算および文書化するにはどうすればよいですか?
図に注釈を付けたい場合は、Lucid Chartでそれらを作成し、多目的リンクを作成しました。誰でも編集できるので、注釈を付けるページのコピーを作成することをお勧めします。