分散トランザクションの主な研究課題は何ですか?


10

背景:トランザクション処理は、データベース理論における伝統的な研究テーマです。現在、分散トランザクションは、通常、データパーティション化(シャーディングとも呼ばれます)とデータレプリケーションを伴う大規模分散ストレージシステムによって普及しています。

分散トランザクションの主な研究課題は何ですか?

(理論的な)改善を必要とする有名な理論と解決策はありますか?

参考文献をいただければ幸いです。

回答:


9

分散データベースの理論と実践の両方に多くの研究分野があります。

主な実用的な課題の1つは、分散および地理的に複製されたデータベースに効率的な同時実行制御メカニズムを実装することです。トランザクションを効率的に実行するために、このようなメカニズムは、トランザクションが順次実行されているように見える直列化可能性よりも弱い保証を提供できます。直列化の代替手段は、スナップショット分離[1]の解決策ですが、これは地理的に複製された分散システムへのスケーリングが不十分であることが証明されています。現在の最新技術では、地理的に複製されたシステムの同時実行制御を処理するために、スナップショット分離(SI)の2つの異なるバリアントが定義されています:並列スナップショット分離(PSI)[2]と非単調スナップショット分離(NMSI)[ 3,4]。分散データベースに関係するもの(つまり、データが異なるサイト間で分割される場合)については、

別の重要な問題は、シリアライザビリティよりも弱い保証を提供する分離レベルのさまざまな概念があるため、実行がまだシリアライズ可能であるように見えるようにプログラムを作成することです。[1]では、スナップショット分離の適切な基準が考案されています。私のグループの何人かの人々は現在PSIの合理的な基準を考案することに取り組んでいます。

理論的および実用的な観点からのもう1つの関連する問題は、トランザクションの細断です。基本的にチョッピングは、粗粒度のトランザクションをより細かい粒度のトランザクションに分割する静的分析手法です。直列化可能性のために、この質問は[6]で取り組まれ、結果の理論は[7]で実用的な実装を提供するために適用されました。

分散データベースの理論的基盤の観点から、弱いメモリモデルコミュニティ[8]の手法を使用してトランザクションの動作を正式に定義するという提案がいくつかあります。[9]で、著者はトランザクションの動作の正式な概念を示しています。[10]でも同じアプローチを使用して、複製されたデータ型の動作を指定しています。

最近、私と私の同僚(Alexey GotsmanとHongseok Yang)は、地理的に複製されたデータベースの整合性レベルの観測可能な動作を指定する理論的なフレームワークである[8,9,10]で開発された手法から始めて構築しました。私たちは、SI、PSI、およびNMSIの公理化を実現するためにフレームワークをうまく使用しました。これらのそれぞれは、単純な実装に関して正しいことが証明されています。また、得られた理論を利用して、PSIのチョッピング基準を考案しました。これらの結果は、近い将来に公開されることを期待しています。

他にご不明な点がございましたら、お気軽にお問い合わせください。お役に立てれば、

アンドレア・セローネ。

参照:

[1] Fekete et al、スナップショット分離をシリアライズ可能にする(2005)

[2] Sovran et al、地理的に複製されたシステムのトランザクションストレージ(2011)

[3] Arkedani et al、Non-Monotonic Snapshot Isolation:Non-Monnotonic Snapshot Isolation:scalable and strong constant for geo-replicated transactional systems(2013)

[4] Arkedani et al、スナップショット分離のスケーラビリティについて(2013)

[5] Binnig et al、分散スナップショット分離:グローバルトランザクションはグローバルに支払い、ローカルトランザクションはローカルに支払います

[6] Shasha et al、Transaction chopping:Algorithms and Performance Studies(1995)

[7] Zhang他、トランザクションチェーン:地理的に分散されたストレージシステムで低レイテンシでシリアル化を実現(2013)

[8] Alglave、弱い記憶モデルの正式な階層(2012)

[9] Buckhardt et al、理解の結果整合性(2013)

[10] Buckhardt et al、Replicated Data Types:Specification、Verification、Optimality(2014)


包括的な回答ありがとうございます。SIの場合、文献に複製された設定でロックフリーの分散プロトコルはありますか?または、SIがうまくスケーリングしないため、この試みは意味がないのですか?PSIについては、今後の作業での実装について述べた論文(Tim Kraska @ Eurosys'13)を読みました。ある一般パクシは、これに適し?Sovran et al [2]のオリジナルのものと比較して、可能な長所/短所/課題は何ですか?再度、感謝します。
hengxin 2014

2
実際、SIは地理的に複製されたシステムにうまく拡張できません。上記の[4]で、著者らは、SI整合性レベルで実行されているgeo複製されたDBMSでは達成できない、本物の部分複製などのプロパティがあることを証明しています。[5]では、著者は、SIに従ってローカルに(単一のシャードで)動作するが、グローバルには動作しない実行の例を示し、DSIと呼ばれるSIのバリアントを提案します。それがMDCCに関係していることについて、私はこのペーパーを認識していません。そして、私は一般化されたPaxosの実装の詳細を知らないことを認めなければなりません。しかし、私は喜んで見て、できるだけ早く返信します。
Andrea Cerone
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.