タグ付けされた質問 「dc.distributed-comp」

分散コンピューティングにおける理論的な質問

4
なぜ分散コンピューティングの統一された複雑性理論を開発できなかったのですか?
分散コンピューティングの分野は、分散アルゴリズムを記述するための単一の数学的理論を開発する上で非常に不十分です。単に相互に互換性のない分散計算のいくつかの「モデル」とフレームワークがあります。さまざまな時間プロパティ(非同期、同期、部分同期)、さまざまな通信プリミティブ(メッセージパッシングと共有メモリ、ブロードキャストとユニキャスト)、複数の障害モデル(フェイルストップ、クラッシュリカバリ、送信省略、ビザンチンなど)の爆発的な爆発on)は、難解な数のシステムモデル、フレームワーク、および方法論を残しており、これらのモデルとフレームワーク全体の相対的な可解性の結果と下限を比較することは困難で扱いにくく、時には不可能になります。 私の質問は非常に単純ですが、なぜそうなのですか?分散コンピューティングについて(シーケンシャルなものとは)根本的に何が異なり、研究を分散コンピューティングの統一理論にまとめることができなかったのですか?シーケンシャルコンピューティングでは、チューリングマシン、再帰関数、およびラムダ計算がすべて同等になるように調整されました。これは単なる幸運だったのでしょうか、それとも分散コンピューティングではまだ達成されていない方法でシーケンシャルコンピューティングをカプセル化するのに本当に良い仕事をしましたか? 言い換えれば、分散コンピューティングは本質的にエレガントな理論に屈しない(そしてそうであれば、どのように、なぜですか?)か、単にそのような理論を発見するのに十分にスマートではありませんか? この問題に対処できる唯一の参考文献は、Fischer and Merritt DOIによる「20年間の分散コンピューティング理論研究の評価」:10.1007 / s00446-003-0096-6です。 参照や説明は本当に役立つでしょう。

10
計算のための現在の並列モデル
1980年代には、両方を引き起こしたPRAMとBSPの並列計算モデル。両方のモデルの全盛期は、80年代後半から90年代前半の間にあったようです。 これらの分野は、並列アルゴリズムの研究に関してまだ活発ですか?並列計算用のより洗練された新しいモデルはありますか?一般モデルはまだ流行していますか、それとも研究者はGPGPUやクラウドベースの計算を専門にしようとしていますか?


1
値を明らかにせずに分散ノード間のパーセンタイルを推定する
この質問は、Theorytical Computer Science Stack Exchangeで回答できるため、Cross Validatedから移行されました。 8年前に移行され ました。 解決すべきかなりユニークな問題があり、ここで誰かがそれをどうやってうまくやるのかについての洞察を与えてくれることを望んでいます。 問題:単一の参加者が共有する番号を実際に知らないような方法で、N個の番号のリストが参加者セット間で共有されているとします。すべての参加者は、N(数値のリストのサイズ)とリスト上のすべての数値の合計を知っていますが、先験的なことは何も知りません。 一緒に作業することにより、参加者が「a <b」という文が真であるかどうかを学習するように、2つの共有番号aとbを比較できますが、それ以上はできません。ただし、これは非常に高価です(1回の比較を完了するのに数秒、場合によっては数分かかることがあります)。そのようなことがどのように可能かについてのもう少しの情報については、この投稿の終わりを見てください。 一日の終わりに、当事者は、リスト内のどのインデックスを、リスト内の「上位Kパーセント」(最大のK%)共有番号に対応させるかを出力します。もちろん、これはソートするか、「トップK」選択アルゴリズムを使用して実行できます。ただし、これらは非常に多くの比較を使用する傾向があるため、回避する必要があります。(これらは、O(n log n)またはO(n)のいずれかで、かなり大きな隠し定数があります。) 別の選択肢は、(1-K)%がXより小さく、K%が大きい数値Xでの「推測」です。次に、各要素をXと比較して、どれだけ大きいか、小さいかを確認できます。推測が間違っていた場合は、正しいソリューションに収束するまで、バイナリ検索などを使用して修正します。推測が正しければ、比較にかかる時間ははるかに少なくなります。 だから、私の質問は、 Nと合計のみを考えると、Xを「予測」する最良の方法は何ですか? もちろん、これは基礎となるディストリビューションに依存します。さまざまなユースケースでは、基礎となる分布は異なる可能性がありますが、既知であるため、すべての一般的なもの(通常、均一、指数関数、おそらくいくつか)の優れたソリューションに興味があります。また、基礎となる分布についての仮定を前提として、「バイナリのような」検索を実行してステップ数を最小限に抑える最善の方法に関する提案を聞きたいと思います。 付録:リストの各値は、Shamirの秘密共有スキームを使用して参加者間で共有されます。仮定M参加者が存在すると、リストは、リスト上のi番目の数は多項式で表現され、そして長さNであり、いくつかの有限体Fの一定期間にわたり度M-1のfはiが数であります共有されていることを、他のすべての係数はj番目の参加者の株式は次いで、F.からランダムに一様に選択されるfをI(J )、1 ≤ I ≤ Nf私f私f_if私f私f_if私(j )f私(j)f_i(j)1 ≤ I ≤ N1≤私≤N1\leq i\leq N。この共有を考えると、参加者はその番号に関する情報を(情報理論的には)持っていません。実際、参加者の適切なサブセットでは、知識を組み合わせて共有番号に関する情報を学習することはできません。ただし、高度な安全なマルチパーティ計算手法を使用すると、情報を公開せずに、ある共有値が別の共有値よりも小さいかどうかを判断できます。この手法では、すべての参加者が協力する必要があります。そのため、実行するのに費用がかかるため、できる限り少ない回数で実行する必要があります。

4
分散コンピューティングにおいてコンセンサス問題がなぜそれほど重要なのですか?
分散コンピューティングでは、コンセンサス問題は集中的な研究を集めている中心的なトピックの1つであるようです。特に、「1つの障害のあるプロセスによる分散コンセンサスの不可能性」という論文は、2001 PODC Influential Paper Awardを受賞しました。 それでは、なぜコンセンサス問題がそれほど重要なのでしょうか?理論的にも実際的にもコンセンサスで何を達成できますか? 参照や説明は本当に役立つでしょう。

4
無限に大きいが局所的に有限な計算問題
この質問は、ユッカスオメラが別の質問に対して行ったコメントに触発されたものです。 無限に大きいが局所的に有限な計算問題(およびアルゴリズム)の例は何ですか? 言い換えると、各チューリングマシンが有限のデータのみを読み取り、処理するが、無限に多数のチューリングマシンがネットワークに接続されている場合、計算は完全に無限サイズの問題を解決する、有限時間で停止する計算の例は何ですか?

1
従来のPaxosおよびFast Paxosの正当性の証明
私はレスリー・ランポートによる「Fast Paxos」論文を読んでいますが、古典的なPaxosとFast Paxosの両方の正確性の証明に固執しています。 一貫性を保つため、値相にコーディネーターが選んだラウンドで満足しなければなりませんvvv2a2a2aiii CP(v,i):CP(v,i):CP(v,i):任意のラウンドのために、以外の値行われていないか、まだラウンドで選択される可能性があります。j&lt;ij&lt;ij < ivvvjjj 古典たPaxosために、プルーフ(ページ8)は、3つのケースに分割される:、と、、いくつかの受容体が相によってコーディネータに報告していた最大ラウンド数であるメッセージ。3番目のケースの議論を理解できませんでした:k&lt;j&lt;ik&lt;j&lt;ik < j < ij=kj=kj = kj&lt;kj&lt;kj < kkkk1b1b1b ケース。帰納法によって、アクセプタがラウンドでに投票したときにプロパティ保持されたと仮定できます。これは、ラウンドで以外の値が選択されていないか、まだ選択されていないことを意味します。j&lt;kj&lt;kj < kCPCPCPa0a0a_0vvvkkkvvvjjj 私の質問は: ラウンドでアクセプターがに投票したときに、プロパティ保持されていると仮定できるのはなぜですか?CPCPCPa0a0a_0vvvkkk 私たちは数学的帰納法を使用しているようです、それで、基礎、帰納的仮説、帰納的ステップは何ですか? Fast Paxosの場合、同じ引数(ページ18)が続きます。それは言います、 ケース。いずれかのためにで、以外の値行われていないか、まだラウンドで選択される可能性があります。j&lt;kj&lt;kj < kvvvVVVvvvjjj 私の質問は: これはどのように取得されますか?具体的には、なぜ「任意のためであるで、ここで」?vvvVVV 私の意見では、ケースの正しさの証明は、(再帰的に)およびの場合に依存しています。 j&lt;kj&lt;kj < kk&lt;j&lt;ik&lt;j&lt;ik < j < ij=kj=kj = k したがって、どのようにケースの結論付けることができ第一証明なし(即ち、サブケースの欠落完全つ以上の値以上を含有しますか)?j&lt;kj&lt;kj < kj=kj=kj = kj=kj=kj = kVVV

1
分散システムに標準的な問題のリストはありますか?
先週、私は再び彼が約与えた会議のレスリーさんランポートの1982 trasncript読んでいた解決される問題、未解決の問題と並行性で非問題。この論文は簡単に読むことができますが、私に考えさせられたものの1つは次の主張です: 問題は相互排除の問題、生産者と消費者の問題、またはその両方の組み合わせとみなすことができますか? 分散システムのケースでこの質問に回答したかどうかを知りたいです。 可能性のあるすべての分散システムの問題を削減できる、標準的な分散システムの問題のセットはありますか?この正規リストとは何ですか? 正規のリストがない場合、現在の問題のリストは何ですか? 例えば、私は非常に素朴に言って、リーダーの選挙と相互排除の問題をコンセンサス問題に還元できると言います。また、分散スナップショットは分散クロックに縮小できると言います。それは本当ですか、それとも明らかに間違っていますか? 可能であれば、回答がその主張を裏付ける公開された論文/書籍への参照を提供することを希望します:)

2
ソーシャルネットワークで影響力のあるノードを決定するための分散アルゴリズム
Kempe-Kleinberg-Tardosによるこの論文では、著者は、劣モジュラ関数に基づいた貪欲なアルゴリズムを提案し、グラフ内の最も影響力のあるノードをソーシャルネットワークへの応用とともに決定します。kkk 基本的に、アルゴリズムは次のようになります。 S= e m p t y s e t S=empty setS = {\rm empty~set} 個々の影響が最も大きいノードを選択し、と呼びます。v1v1v_1S= S∪ V1S=S∪v1S = S\cup v_1 およびをネットワークの残りの部分に接続するすべてのエッジを削除しますv1v1v_1v1v1v_1 が個の頂点を持つまで繰り返すSSSkkk 私が持っている二つの質問のソーシャルネットワークで影響力のあるノードに関するを。 a)解決策を見つけるためのアルゴリズム、または分散化された方法での近似はありますか? b)同じ問題を解決するために、ページランクなどの他のアルゴリズムを適用した人はいましたか?

5
クラッシュやビザンチンではない分散コンピューティングのプロセッサ障害
分散コンピューティングモデルには、主に2つのタイプのプロセッサ障害があります。 (1)クラッシュ障害:プロセッサが停止し、再び起動することはありません。(2)ビザンチンの障害:プロセッサーは敵対的に、悪意を持って振る舞います。 私の質問は: クラッシュやビザンチン障害に減らない、研究されている他のタイプのプロセッサー障害とは何ですか? また、より具体的な質問: ある確率でプロセスが時間ステップでオンになり、そうでなければオフになるモデルが研究されましたか?そのため、各プロセスは、あちこちで点滅しています。ttt 私は、これらの失敗がコンセンサスやその他の分散合意の問題にどのように関係しているかに最も興味を持っています。 ありがとうございました。

2
ランダムなゴシップの複雑さ
分散システムでのうわさ話の問題は次のとおりです。我々はグラフ有するとn個の頂点を。各頂点vにはメッセージm vがありますGGGnnnvvvmvmvm_vすべてのノードに送信する必要があります。 さて、私の質問はアドホックネットワークモデルのコンテキスト内にあります(ノードには、ネットワークのトポロジ、その入出力の程度、およびその近隣のセットに関する事前知識がないと仮定します。各ノードの知識のみが独自の識別子とノードの総数です)。 また、すべてのノードがグローバルクロックにアクセスし、ラウンドと呼ばれる個別のタイムステップで同期して動作すると仮定します。 このコンテキストでのアルゴリズムの複雑さは、完了に必要なラウンドの数です。 ラウンドのゴシップ問題を高い確率で解決するアルゴリズムが存在することを覚えています。しかし、私はもう参照を見つけることができません、そして、私はその問題に関してより最近の結果があるかどうか疑問に思っています。O(nlog2n)O(nlog2⁡n)O(n \log ^2 n) 賢明なコメントに従って編集します。各ラウンドで、ノードはすべての隣接ノードにメッセージを送信し、それらからメッセージを受信できます。ノードは、特定のラウンドでメッセージを受信します。その場合、ノードのちょうど1つのネイバーがそのラウンドで送信します。そうしないと、衝突が発生し、ノードがメッセージを受信しません。

3
ネットワークを介した効率的なDAG比較
分散バージョン管理システム(例えばMercurialのとGitの)効率的に有向非巡回グラフ(DAGの)を比較する必要があります。私はMercurialの開発者であり、2つのDAGを比較することの時間とネットワークの複雑さを議論する理論的な研究について非常に興味があります。 問題のDAGは、記録されたリビジョンによって形成されます。リビジョンは、ハッシュ値によって一意に識別されます。各リビジョンは、前のリビジョンのゼロ(初期コミット)、1(通常のコミット)、またはそれ以上(マージコミット)に依存します。ここではリビジョンが一例であるaためにe、各次々に行われましたが。 a --- b --- c --- d --- e グラフの比較は、誰かが履歴の一部しか持っておらず、欠落している部分を取得したいときに表示されます。私が持っていたと想像aするcと作られたxとyに基づいてc: a --- b --- c --- x --- y Mercurialのでは、私はどうなるhg pullとダウンロードdとe: a --- b --- c --- x --- y \ d --- e 目標は、グラフに多くの(たとえば、100,000を超える)ノードがある場合を識別しd、e効率的にすることです。効率は両方に関係します ネットワークの複雑さ:転送されたバイト数と必要なネットワーク往復回数 時間の複雑さ:変更セットを交換する2つのサーバーによって行われる計算の量 典型的なグラフは狭く、上記のような平行なトラックはほとんどありません。また、通常e、y上記のような少数のリーフノード(Mercurialではヘッドと呼びます)のみが存在します。最後に、中央サーバーを使用すると、クライアントにはサーバー上にないいくつかの変更セットが含まれることがありますが、サーバーは、クライアントが最後にサーバーから最後にプルした人​​に応じて、クライアント用に100以上の新しい変更セットを持つことができます。非対称溶液が好ましい:中央サーバは、クライアントに比べて少し計算を行う必要があります。

1
分散トランザクションの主な研究課題は何ですか?
背景:トランザクション処理は、データベース理論における伝統的な研究テーマです。現在、分散トランザクションは、通常、データパーティション化(シャーディングとも呼ばれます)とデータレプリケーションを伴う大規模分散ストレージシステムによって普及しています。 分散トランザクションの主な研究課題は何ですか? (理論的な)改善を必要とする有名な理論と解決策はありますか? 参考文献をいただければ幸いです。

1
確定的分散アルゴリズムを設計する利点は何ですか?
障害に強い分散アルゴリズムは、決定論的または確率論的のいずれかです。たとえば、コンセンサス問題を考えてみましょう。 Paxosは、仮定が与えられていれば常に機能するという意味で決定論的です。 対照的に、ランダム化されたコンセンサスは所定の確率で機能します。 決定論的アルゴリズムを設計して使用する利点は何ですか? 決定論的アルゴリズムが依存する仮定には、現実に保持される確率(いわゆる仮定カバレッジ)もあります。したがって、決定論的アルゴリズムが実際に機能しない可能性は常にあります。

2
なぜ線形化可能性は安全特性であり、なぜ安全特性は閉じたセットなのですか?
Nancy Lynch著の「Distributed Algorithms」の第13章「Atomic Objects」では、線形化可能性(原子性とも呼ばれます)が安全特性であることが証明されています。つまり、対応するtraceプロパティは、セクション8.5.3で定義されているように、空ではなく、prefix-closedであり、limit-closedです。非公式には、安全特性は、特定の「悪い」ことが決して起こらないと言っているとしばしば解釈されます。 これに基づいて、私の最初の問題は次のとおりです。 安全特性としての線形化の利点は何ですか?文献にこの事実に基づく結果はありますか? 安全特性と活性特性の分類の研究では、安全特性が適切なトポロジーの閉集合として特徴付けられることはよく知られています。アミール・プヌエリ他による論文「The Safety-Progress Classification」@ 1993。、メトリックトポロジが採用されています。より具体的には、プロパティは、アルファベットΣ上の(有限または無限)単語のセットです。プロパティA (Φは)すべての無限の単語で構成されてσようにすべてのプレフィックスσに属しますΦ。たとえば、Φ = a + b ∗の場合、ΦΦ\PhiΣΣ\SigmaA (Φ )A(Φ)A(\Phi)σσ\sigmaσσ\sigmaΦΦ\PhiΦ = a+b∗Φ=a+b∗\Phi = a^{+}b^{\ast}。無限のプロパティ Πは、ある有限のプロパティ Φに対して Π = A (Φ )の場合、安全プロパティとして定義されます。無限語 σと σ ′の間のメトリック d (σ 、σ ′)は、それらが同一の場合は0と定義され、 d (σ 、σ ′)= 2 −A (Φ )= aω+ a+bωA(Φ)=aω+a+bωA(\Phi) = a^{\omega} + a^{+}b^{\omega}ΠΠ\PiΠ …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.