まず第一に、クラスターの総可用性または稼働時間は、クラスター全体が「稼働」していると見なされるために、クラスターの一部がアクティブである必要がある大きさに依存します。
- 機能している1台のマシンで十分ですか?つまり、必要に応じて、単一のマシンで全負荷をかけることができます。
- それらすべてを同時にアクティブにする必要がありますか?つまり、冗長性はありません。
- または、オンラインの3つのうち2つで十分でしょうか?これにより、最初のケースよりも大きなワークロードが可能になります。
ご存知のように、最初の2つのケースの計算は非常に簡単です。任意の時点で単一のサーバーがオンラインになる確率をp = 0.95とします。現在、3つのサーバーの場合、それらがすべて同時にオンラインになる確率はp 3 = 0.857375です。
反対の場合、少なくとも1台のマシンが特定の時間にアクティブである必要がある場合、問題を反転させて、マシンがオフラインになる確率を調べることで、計算が簡単になります。単一のマシンがオフラインになる確率はq = 1- p = 0.05であり、したがって、それらがすべて同時にダウンする確率はq 3 = 0.000125であり、確率1- q 3 = 1-(1- p)が与えられます。3 = 0.999875、少なくとも1つは稼働している。
3ケース中2ケースは、計算が少し難しいです。3つのサーバーのうち少なくとも2つが稼働している状況が4つ考えられます。1)ABCがアップ、2)ABがアップ、3)ACがアップ、4)BCがアップ。これらすべての確率は、それぞれppp、ppq、pqp、およびqppです。ケースはばらばらなので、確率を合計して、合計A = p 3 + 3 p 2 q = 0.992750を得ることができます。
(これはより多くのマシンに拡張できます。要因はよく知られている二項係数です。そのため、さまざまなケースを手動で数えることは、主に演習として機能します。)
もちろん、このような計算は既製のコンピュータプログラムを使用することではるかに簡単に処理できます...少なくとも1つのオンライン計算機がここにあります:http :
//stattrek.com/online-calculator/binomial.aspx
入力値を入力すると、成功確率= 0.95、試行回数= 3、成功数= 2、「累積確率:P(X≥2)= 0.99275」という結果が得られます。その他の関連する値もいくつか示されています。オンラインツールを使用すると、他の数値も簡単に操作できます。
そして、はい、上記のすべては、サーバーが独立して失敗することを前提としています。つまり、a)クラスター全体に影響を与える問題を無視しました。b)コンポーネントのエージングのように、サーバーで障害が発生する可能性はありません。またはほぼ同時に。