Neo4j対OrientDB対Titan


13

私は社会関係マイニングに関連するデータサイエンスプロジェクトに取り組んでおり、いくつかのグラフデータベースにデータを保存する必要があります。最初は、データベースとしてNeo4jを選択しました。しかし、Neo4jの継ぎ目はうまく拡張できません。私が見つけた代替手段は、TitanとoriebtDBです。これら3つのデータベースについてこの比較を行ってきましたが、これらのデータベースについてさらに詳しく知りたいと思います。だから、誰かが最高のものを選ぶのに私を助けることができますか?主に、これらのデータベースのパフォーマンス、スケーリング、利用可能なオンラインドキュメント/チュートリアル、Pythonライブラリのサポート、クエリ言語の複雑さ、グラフアルゴリズムのサポートを比較したいと思います。他にも良いデータベースオプションはありますか?


1
Graphlab(Pythonベース)も検討してください:graphlab.com/products/create/overview.htmlこれに関する優れたブログ投稿もここにあります:bugra.github.io/work/notes/2014-04-06/…できませんしかし、Titan対oriebtDBの議論を手伝ってください。うまくいけば、誰かがそれにチャイムします。
nfmcclure

また、可能なスパークとGraphX使用する
sheldonkreger

この記事では、Titanの特別な利点であるスケーラビリティの詳細について説明します。groups.google.com/forum/#!topic/orient-database/CpPh42ukfH4
ヘンリーH.

2
いいえ、ちがいます; GraphXはデータベースではありません。
エムレ

これは数ヶ月前のことなので、あなたはある程度進歩したと思います。なぜ(ここか他の場所?)あなた自身の答えを追加していない
ジャヤン

回答:


1

全体的なデータパイプラインと機械学習パイプラインを念頭に置いておく必要があると思います。強力な分散処理とは別に、テーブルのようなストレージとグラフのようなストレージの間でデータを移動するための堅牢なフレームワークが必要です。私の理解から、Spark GraphXはこれらのパイプラインを構築することを約束しています。Joseph Gonzalez(CMUのGraphLabの作成者の1人)は、YouTubeでのGraphXについての講演を見る価値があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.