マルチサイトの高可用性


15

高可用性が必要なSaaSアプリケーションがあります。高価でメンテナンスの行き届いたHyper-Vフェールオーバークラスターは既にありますが、今日、そのクラスターをホストするデータセンターでは5時間の停電が発生し、完全にオフラインになりました。そのため、2つの別々のデータセンターでサーバーを使用する方がよいのではないかと考えています。これらの2つのサイト間ですべてのバックエンドファイルレプリケーションとデータレプリケーションが機能すると仮定すると、フロントエンドルーティングの処理方法が不思議になります。単一障害点。

質問は...ロードバランサーが単一障害点にならないように、2つのホスティングサイト間でロードバランシングを設定するにはどうすればよいですか?各サイトに1つずつ、2つの個別のロードバランサーを使用する方法はありますか?ラウンドロビンDNSを検討すべきですか?

回答:


14

これを適切に行うには、次のものが必要です。

  • 2つのデータセンターにある2つの別個のインスタンス(既に決定済み)
  • 2つのデータセンター間の同期(既に決定済み)
  • 障害発生時にクライアントを一方から他方にリダイレクトする方法

これを行うには、2つの一般的な方法があります。1つはシンプル、もう1つは...ではありません。

DNS

ラウンドロビンDNSは、すべての要求をプライマリDCに送信したい場合があり、2番目のDCは最初のDCのダウンタイム中にのみ使用されるため、希望するものではありません。

何ができるけれども、すべての、あなたのDCがダウンしない場合、あなたは自分のDNSを更新し、5分程度以内ということを意味しますあなたのDNS上の非常に低いTTL(たとえば、30秒、または5分)、設定されていますかクライアントは他のDCを指しています。

これは、2つのDCのIPレイアウトが異なるため、データセンターのセットアップでこれを調整する必要があることを意味します。

BGP

基本的に、この質問をしている場合、これは手の届かないところにあります。つまり、IPアドレスは同じままですが、データセンター間で「移動」されます。これには、高価なルーター、高価なIP範囲、およびAS番号とIP範囲のローカルレジストリへの高価なサブスクリプションが含まれます。

BGPルーターは、プライマリデータセンターで広告を停止し、セカンダリデータセンターで広告を開始します。次に、インターネットがオフラインデータセンターを迂回して、新しいDCにトラフィックを送信します。


ESXiおよびvSphereで仮想化されている場合、VMWareには、一度試してみたVMWare Site Recovery Managerと呼ばれる非常に優れた製品があります。これは基本的にすべてを行います。VM構成の同期を維持し、1番目のサイトがオフラインになったときに2番目のサイトでそれらを起動します。しかし、大金です。


SRMを使用している場合でも、何らかの種類のIPフェールオーバーと同様に、レプリケーションを整理する必要があります。
EEAA

確かに、esxi5には新しい非Sanレプリケーション製品があります。私はあまり調べていませんが。
マークヘンダーソン

ああ、そうです。私はそれについて何か聞いたことを覚えています。
EEAA

1

ロードバランサーをロードバランスする必要があります。

DNSラウンドロビンでこれを行うことができますが、そのアプローチには多くの問題があります。エントリを必要以上にキャッシュするクライアントを制御したり、トラフィックを特定の場所に強制的に移動したりすることはできません。

Global Server Load Balancing(GSLB)を使用してこれを行うこともできます。これは、DNSを活用してインターネットから複数のデータセンターを可視化する、より高度な方法です。つまり、トラフィックをスライスに分割するメカニズムを設定し、DNSを使用してスライスを選択します。クライアントのルックアップを行うように構成されたDNSリゾルバーのハッシュを使用します。他の人々は、地理を使用して「最も近い」データセンターにルーティングします。データセンターまたはクラスターの単一障害点がダウンした場合に、GSLBからIPを迅速に削除するメカニズムを追加する必要があります。

http://www.eukhost.com/web-hosting/kb/global-server-load-balancing/

最後に、一部の非常に高度な人々がAnycast DNSでこの問題に取り組んでいます。これもまた、「最も近い」データセンターのアプローチを活用しようとします。サービスをエニーキャストすると、「ステートフルネス」を排除する必要があります。これは難しいかもしれません。


このアプローチには、提供されたリンクで説明されている「マスターサーバー」という単一障害点がまだあるようです。
マイク

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.