タグ付けされた質問 「failover」

コンピューティングでは、フェイルオーバーは、以前アクティブだったアプリケーション、サーバー、システム、またはネットワークの障害または異常終了時に、冗長またはスタンバイコンピューターサーバー、システム、またはネットワークに自動的に切り替わります。フェイルオーバーとスイッチオーバーは基本的に同じ操作ですが、フェイルオーバーは自動的に行われ、通常は警告なしに動作しますが、スイッチオーバーには人の介入が必要です。

3
グローバル高可用性セットアップの質問
私はvisualwebsiteoptimizer.com / を所有して運営しています。このアプリは、特定のメトリックを追跡するために私の顧客がWebサイトに挿入するコードスニペットを提供します。コードスニペットは外部JavaScript(サイトコードの上部)であるため、顧客のWebサイトを表示する前に、訪問者のブラウザーがアプリサーバーにアクセスします。アプリサーバーがダウンした場合、ブラウザはタイムアウトする前に接続を確立しようとし続けます(通常60秒)。ご想像のとおり、どのような状況でもアプリサーバーを停止することはできません。これは、Webサイトの訪問者だけでなく、お客様のWebサイトの訪問者のエクスペリエンスにも悪影響を与えるためです。 現在、1つのバックアップサーバーが別のデータセンター(実際には別の大陸)に配置されているDNSフェールオーバーメカニズムを使用しています。つまり、アプリサーバーを3つの別々の場所から監視し、それがダウンしていることが検出されるとすぐに、バックアップサーバーのIPを指すようにAレコードを変更します。これはほとんどのブラウザーで正常に機能します(TTLは2分です)が、IEはDNSを30分間キャッシュします。弊社のvisualwebsiteoptimizer.com/split-testing-blog/maximum-theoretical-downtime-for-a-website-30-minutes/の最近の投稿をご覧ください。 それでは、アプリのデータセンターで大規模な障害が発生した場合に、ほぼ瞬時にフェールオーバーを行うには、どのような設定を使用できますか?私はここwww.tenereillo.com/GSLBPageOfShame.htmを読みました。複数のAレコードを持つことが解決策ですが、(まだ)セッションの同期はできません。私たちが検討しているもう1つの戦略は、2つのAレコードを使用することです。1つはアプリサーバーを指し、2つ目は、別のデータセンターにあるリバースプロキシを指します。この戦略は合理的だと思いますか? 私たちの優先事項を確認するために、私たちは私たち自身のウェブサイトやアプリをダウンさせておく余裕がありますが、ダウンタイムのために顧客のウェブサイトを遅くさせることはできません。したがって、アプリサーバーがダウンした場合、デフォルトのアプリケーション応答で応答するつもりはありません。空白の応答で十分ですが、ブラウザがそのHTTP接続を完了することだけが必要です(他には何も必要ありません)。 参照:有用なこのスレッドを読みましたserverfault.com/questions/69870/multiple-data-centers-and-http-traffic-dns-round-robin-is-the-only-way-to-assure

2
サーバー2016 MSMQフェイルオーバー
フェールオーバーシステムでMSMQをセットアップしたいと思います。 共有ストレージの設定はありません(ハードウェアは使用不可-予算)が、3つのdl380を実行しているWindowsサーバー2016があります。 クォーラムサーバーでフェールオーバーをセットアップしたいと思います。 このセットアップは可能ですか?
10 failover  msmq 

7
HyperV VMの接続がランダムに失われるのはなぜですか?
約2週間に1回、奇妙な断続的な接続の問題が発生しています。 最初の構成:2つの物理ホスト(node01とnode02)を持つHyperVフェールオーバークラスターを実行しています。ホストは両方とも、SP1が適用されたWindows Server 2008 R2 HyperVサーバー(無料のサーバー)を実行しています。これらのホストでは、Windows Server 2008 R2 WebエディションSP1を実行する2つのVMを実行しています。ストレージサーバーは、iSCSIを介して接続されたWindows Storage Server 2008です。ホストとストレージサーバーの両方で、インテルのWebサイトから直接ダウンロードされた最新のネットワークドライバーが実行されています。 ここに問題があります:99.99%の時間、すべてが完全に動作します。2〜3週間に1回程度、VMは両方とも着信と発信の両方で同時にネットワーク接続を失います。これが起こるとき、 どちらのVMにもRDPできません。 どちらのホストにもRDPできます。 ノードを右クリックして[仮想マシンに接続]を選択すると、フェイルオーバークラスターマネージャーからどちらのVMにも接続できます 上記の#3で説明したようにVMに接続すると、LAN上のWebサイトやマシンにアクセスできなくなります。VM内の仮想ネットワーク接続を無効にしてから再度有効にしても、問題は解決しません。 VMを別のノードに移動すると、問題が修正されます(今後2週間)。 ホストを再起動してVMをホストに戻すと、問題が修正されます(今後2週間)。 この場合、フェイルオーバークラスターはVMを自動的にフェイルオーバーしません。 ホストまたはVMのいずれにも異常なイベントログエントリはありません。 これは、上記と同じ症状で約5回発生しました。ネットワークドライバーまたはネットワークハードウェアの問題だと思いますが、既に最新のドライバーを実行しているので、どうすればよいかわかりません。 これは本当のスクラッチャーです...何かアイデアはありますか? 更新 私はここで非常に似たケースを見つけました:Virutal MachineがHyper V Clusterのネットワーク接続を失います 2011年7月29日更新 修正プログラムをインストールしてネットワークドライバーを更新した後も、同じ問題が発生します。ハードウェアの詳細を求めるコメントに応えて、サーバーはIntel SR1670HVです。これは、2つの独立したS5500HVマザーボードを含む1Uシャーシです。通信は、Intel 82574Lであるマザーボードの内蔵NICを介して行われます。ネットワークドライバはバージョン16.2.49.0です。

11
Linux向けの優れたフェイルオーバー/高可用性ソリューション?[閉まっている]
閉まっている。この質問はトピックから外れています。現在、回答を受け付けていません。 4年前休業。 ロックされています。この質問とトピックへの回答はロックされています。質問はトピックから外れていますが、歴史的に重要です。現在、新しい回答や相互作用を受け入れていません。 障害(サーバーのハングまたはクラッシュ)が発生した場合に、あるサーバーから別のサーバーにアプリケーションを移行する必要があるいくつかのケースがあります。 solarisでは、これをVCS(Veritas Cluster Server)で行います。Linuxにはどのようなオプションがありますか? それぞれの設定/保守にかかる労力のレベルまたはコスト(ある場合)を示してください。 -詳細を追加- 複雑さのレベルを知るには: 障害が発生したサーバーは予告なしにハングまたはクラッシュする可能性があり、「ping可能」である可能性があります リカバリサーバーは、フェイルオーバー時にアプリケーションを起動する必要があります 失敗したサーバーのブート/電源の再投入は、リカバリサーバーと干渉しないようにパッシブになります。 これはデータベースではなくデータ収集ノードまたは計算ノードであるため、より単純なソリューションが機能する可能性があります。 -さらに詳細(申し訳ありません)- 共有ストレージはオプションではありませんが、あるサーバーから別のサーバーに移行する必要がある状態(ある場合)はそれほど多くありません。rsyncを介して2つのサーバーの同期を維持します。 これまでのすべての投稿をありがとうございました。

4
複数のスイッチ間のリンクボンディング?
nicsとifenslaveの結合について少し読んだ。2つのスイッチ間でボンドを分割するために特別な構成が必要かどうかを理解できません。たとえば、それぞれに2つのNICと2つの個別のスイッチがある複数のサーバーがある場合、ボンドを構成し、それぞれから1つのNICをスイッチ#1に接続し、もう1つをそれぞれからスイッチ#2に接続しますか?それともそれ以上のものですか? ボンドがアクティブバックアップである場合、単一のマシンのNIC障害は、残りのマシンがプライマリNICを使用し、セカンダリが使用しているため、サーバーが切断される可能性があることを意味しますか?または、スイッチも1本のケーブルでリンクしていますか?

1
Azure Site Recoveryの計画外のフェールオーバー
Azureにいくつかの仮想マシンのDRを作成できました。私はAzureサイトの回復とAzureリソースマネージャーを使用しています。これを行う方法については、このマニュアルに従っていますhttps://www.starwindsoftware.com/blog/azure-azure-site-recovery-with-arm-replication-and-failover -failback。 仮想マシンの計画外のフェイルオーバーを実行していたときに、計画外のフェイルオーバーが失敗したと表示されました。エラーIDは70136です。 考えられる原因操作がキャンセルされたか、復旧ポイントをフェイルオーバーに使用できません。推奨事項しばらく待ってから、操作を再試行してください。 解決策を検索しようとしましたが、成功しませんでした。解決策はありますか?PS私の英語が下手でごめんなさい。
8 azure  failover 

5
ホットスペアホストとコールドスペアホスト?
複数のホストがあり、同じホットスペアホストがあり、パッチが適用されて更新されているため、同じソフトウェアと構成に非常に近くなります。障害が発生した場合は、ネットワークケーブルが切り替えられ、DHCPサーバーが新しいMACアドレスで更新されます。これは最良のケースです。通常、修正が必要なものが少し多いためです。 ホットスペアホストを用意するのは電力の浪費であり、それを維持するのに時間の浪費だと感じています。フェイルオーバーの場合は構成の変更が必要なので、次のことを質問します。 ホットスペアホストは古い学校で、今より良い方法がありますか? ホットスペアホストを使用する代わりに、コールドスペアにして、ハードドライブをプライマリホストに配置し、RAIDを1から1 + 1に変更することは理にかなっていますか。障害が発生した場合は、ネットワークケーブルを変更し、DHCPサーバーを更新し、ハードドライブをコールドスペアに挿入して電源を入れるだけです。私が見ると、2x2ディスクは常に同期しているので、フェイルオーバー時に1つのホストのみを維持し、構成を変更する必要がないという利点があります。 それは良い考えですか?

3
NFSマウントポイントの基礎となるファイルシステムにあるファイルにアクセスする
おそらくこれは奇妙な要求ですが、以下に詳述されている質問の反対です。 NFSコンテンツをアンマウントせずに、基になるNFSマウントのコンテンツを表示することは可能ですか? 複数のリモートサイトのLinuxサーバーが中央サーバー(すべてCentOS 5.x)からNFS共有をマウントするように設定しています。考えてください:/opt/softwareまたは類似した何か。 問題がなければ、クライアントシステムはメインサーバーからNFSエクスポートをマウントし、問題なく実行されます。共有に含まれるデータは頻繁には変更されません(おそらく毎週)。 メインのNFSサーバーへの接続が失われる状況(NFSサーバーの停止、ファイバーカットなど)が心配です。共有データは頻繁に変更されないため、NFSマウントが失われた場合にこれらのシステムをスタンドアロンで実行できるようにしたいと考えています。 マウントが/opt/softwareなくなるとしましょう。NFSマウントの下の同じ場所にあるローカルファイルを使用したいと思います。さらに、これらのファイルを毎日同期します。 マウントされたボリュームへの変更は、どのクライアントサイトからも可能である必要があるため、NFSマウントは読み取り/書き込みです。 これは可能ですか?基になるディレクトリのファイルにアクセス(または上書き)するにはどうすればよいですか?タイムアウトの問題が発生する可能性はありますか?これに役立つマウントオプション/ヒントはありますか?
8 linux  nfs  mount  failover 

7
cronジョブのフェイルオーバーを実行するにはどうすればよいですか?
2つのDebianサーバーを使用して、一度に1つのサーバーでのみ呼び出すことができるcronジョブ用の強力なフェイルオーバー環境をセットアップする必要があります。 /etc/cron.d内のファイルを移動するとうまくいくはずですが、そのようなアクションを実行する簡単なHAソリューションはありますか?そして、可能であればハートビートではありません;)
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.