Evanにはいくつかの良い点がありますが、ここでは、障害が発生した場合に1時間未満の回復時間を得るための具体的な費用対効果の高い方法を示します。
スモールビジネスとは、おそらく小さなハードウェアを意味するため、問題に直面してかなりの回復力を実際に追加するいくつかの簡単なことを行うのは、それほど多くのコストではないかもしれません。主なアイデアは、追加のハードウェアを準備することです。
まず、仮想IPの考え方に慣れます。これは、ユーザーが通信するIPアドレスですが、指定したサーバーに常駐できます。これはユーザーのIPアドレスであり、アプリケーションは通信したいと思うでしょう。そして、それは最終的にあなたが求めるソリューションにとって最も役立つでしょう。VIPを持っているということは、フェールオーバー時にアプリケーションを再構成する必要がないことを意味します。また、冗長ハードウェアを使用すると、1の代わりに2つの構成更新を行う管理オーバーヘッドの増加の影響も受けることに注意してください。
ルーティング/ウェブプロキシサーバーから始めると、ボックス自体に保存する必要がある実際の状態ではないため、おそらく最も簡単です。したがって、同じボックスの複製を取得し、同じように構成します。両方をLANセグメントに接続したままにします。インターネットが別のインターフェイスに接続していると仮定して、ケーブルが故障した場合はケーブルを交換します。ルーティングの観点から、デフォルトのルートの.1アドレス(VIP)をターゲットとするLANクライアントをすべて設定し、プロキシサーバーはサーバーAに.2アドレス、サーバーBに.3アドレスを与えます。このように、両方を構成更新のために管理できます(両方に適用されます)。フェイルオーバーするために必要な作業は、.1 IP割り当てを.2から削除して.3に移動し、インターネット接続を他のインターフェイスに移動することだけです。それほど複雑ではなく、簡単に理解できます。2台目のボックスの追加ハードウェアが必要です。インターネット側で冗長性を得ることができれば、複雑さを追加し、VRRPのようなものを使用して自動フェールオーバーを取得できます。
具体的なことは言うまでもありませんが、Webサーバーは単純なものかもしれません。同一の構成で2番目のサーバーを追加し、2つの間にvIPを作成し、障害が発生した場合にVIPをバックアップに移動します。一般に、フェイルオーバーでセッション状態が失われるかどうかは気にしません(フェイルオーバーを引き起こすのは重大な問題です)。したがって、ユーザーが再度ログインする必要がある場合、大した問題はありません。繰り返しますが、vrrpはおそらく自動フェイルオーバーに使用できます。
DBに移ると、これは非常に複雑です。ほとんどのDBには、何らかのプライマリ/セカンダリモデルがあり、元のDBをセカンダリにバックアップしてから、すべてのトランザクションログまたはDBの変更をセカンダリにコピーします。繰り返しますが、実際にDBにアクセスするアプリケーション/ユーザーのVIPとこれを組み合わせることができます。ただし、フェールオーバーはより複雑です。プライマリの障害に応じて、トランザクションログをコピーして残りのドライブを実際に起動して実行する必要がある場合があります。次に、セカンダリをアクティブにします。失われたデータを許容できる場合は、セカンダリをすぐにアクティブにすることができます。フェイルオーバー後、サーバーBがプライマリになり、サーバーAを復元し、それを新しいバックアップに変更して、最終的にサーバーbに問題が発生したときに失敗する準備を整えます。
DBとは異なり、ファイルサーバーの組み込み機能を取得するのはかなり難しいため、ファイルサーバーは常に最も難しい部分です。ただし、2番目のサーバーを使用し、ファイルシステムをスキャンして変更を検出し、新しいファイルをセカンダリにコピーするだけで、ある程度の復元力を実現できます。基本的に、cronでrsyncを実行できます。繰り返しますが、ユーザーに提供するVIPを使用し、フェールオーバーを行う場合は移動します。スクリプトでは、ファイルを転送する前に、システムがVIPの所有者であることを確認することを強くお勧めします。rsyncを間違った方向に実行して、ユーザーが行っている変更を上書きすることは本当に本当に望ましくありません。これは、ファイルが失敗した場合、一部のファイルを失う可能性があります。
私はあなたが電話システムについて何ができるかわからない...それは本当にベンダーとそれがどのようにセットアップされているかに依存する。ベンダーは、弾力性のために既製のソリューションを持っている場合があります。
警告の最後の言葉。使用するセットアップを徹底的にテストしてください。その重要な情報を失うことなくフェイルオーバーする方法を知っていることを確認してください。テストテストをテストして、必要なときに機能することを確認します。構成の変更、ソフトウェアの更新などがプライマリとバックアップの両方に適切に適用されるプロセスが整っていることを確認してください。幸いなことに、サーバーをアップグレードする場合などに、制御されたフェールオーバーを実行できる可能性があります。アクティブ/アクティブセットアップではないため、必要なときにセカンダリが機能するかどうかはわかりません。
私はテレコムで働いており、当社の機器は非常に冗長性が高く、ほとんどの場合、地理的な冗長性を含んでいます。私たちの最大の障害点は、変更後に冗長性がテストされないことと、冗長性モデルがどのように機能するかを知らないユーザーが変更を加えることです。ただし、すべての機器が数秒以内に自動フェイルオーバーをサポートする必要があるという追加の問題があります。30〜60分以内に起動して実行する必要がある場合は、フェールオーバーでの手動介入を許容できます。準備するだけです。幸運を。