分散システムでのエラー処理に関するどのようなペーパーをお勧めしますか?
分散システムでのエラー処理に関するどのようなペーパーをお勧めしますか?
回答:
2010年に Tushar D. Chandra、Vassos Hadzilacos、Sam Toueg the Edsger W. Dijkstra Prizeを受賞した作品をご覧になるとよいでしょう。
これらのペーパーでは、分散型システムの故障検出器の概念を一般的で正確なフレームワークで紹介しています。彼らは直感的に、コンセンサスの解決に必要な最小限の障害情報を調査しようとしました。コンセンサスを解決するために完全な障害検出器は必要ないことがわかりました。特定の最小条件を満たす信頼性の低い障害検出器でさえ、このタスクには十分です。これらのペーパーは、分散システムの障害に対処する方法に非常に影響力がありました。
システムのどのような障害ですか?ビザンチン障害を処理するためのソリューションを探していますか、それとも古典的なフェイルストップモデルだけですか?分散システムにビザンチンノードが存在する場合の解決策は、より興味深い問題です。この問題は、レスリーランポート(ビザンチン将軍の問題)によって形式化され、Barbara LiskovとMiguel Castroによる1999年の論文では、最も近い実用的な解決策「実用的なビザンチンフォールトトレランス」が提示されています。フォールトトレランスを扱う元の形式モデルにはFred Schneiderのマシンアプローチとビュースタンプレプリケーション 質問は非常に一般的であり、分野は広大であり、理論は今日オンラインで実行されているほとんどのシステムの基礎を形成しています。より良い答え
以下は、分散システムでエラーを処理するためのパターンのコレクションです。
あるいは、より一般的な作業については、Rachid GuerraouiとLuis Rodriguesによる本の信頼できる分散プログラミングの紹介があります。より古典的なテキストである Nancy LynchによるDistributed Algorithmsは、より理論的な観点から同様の根拠をカバーしています。