非常に大きな有向リンクグラフを視覚化するツールを探しています。現在、〜2,000,000のノードと〜1000万のエッジがあります。私はいくつかの異なることを試しましたが、ほとんどの場合、10万ノードのグラフを作成するのにも数時間かかります
私が試したこと:
gephiで1日過ごしましたが、80Kノードを追加するのに約1時間かかり、アプリケーションはほとんど役に立たなくなります。
助言がありますか?
インタラクティブな視覚化はプラスになります。
非常に大きな有向リンクグラフを視覚化するツールを探しています。現在、〜2,000,000のノードと〜1000万のエッジがあります。私はいくつかの異なることを試しましたが、ほとんどの場合、10万ノードのグラフを作成するのにも数時間かかります
私が試したこと:
gephiで1日過ごしましたが、80Kノードを追加するのに約1時間かかり、アプリケーションはほとんど役に立たなくなります。
助言がありますか?
インタラクティブな視覚化はプラスになります。
回答:
Graphvizは動作するはずです。フロリダ大学のスパースマトリックスコレクションのマトリックスに関連付けられた画像は、Yifan Huが開発した力指向グラフ視覚化アルゴリズムであるsfdpを使用して視覚化されたと思います。コレクション内のほとんどの行列には、対応する視覚化の生成に関連する計算時間があります。そのため、グラフの視覚化したい特性と類似した特性を持つ行列を検索できる場合があります。たとえば、約210万のノードと約300万のエッジを持つグラフでは、Huの生成に約36000秒、つまり10時間かかりました。グラフの生成にどのハードウェアが使用されたかは明らかではありませんが、おそらくデスクトップまたはラップトップが使用されたという合理的な推測であり、時間は少なくともグラフのレンダリングにかかる時間の大まかな考えを与えるでしょう。Huのアルゴリズムは最先端の視覚化アルゴリズムの1つであるように見えます(2005年に公開されました)が、この分野の専門家ではないため、より良いアルゴリズムが存在するかどうかについて話すことはできません。このアルゴリズムは、Graphvizにオプションとして含まれており、説明するような大きなグラフで使用するように設計されています。
JavaScriptのInfoVis Toolkitは、注釈付きのためのきちんとした対話型インタフェースがある地元のグラフの景色を。これらのデモはあなたに関係があるかもしれません:
Graphinsight 1.2を参照してください。数百万のノードを簡単に処理でき、インタラクティブで3Dです。
また、高効率の代数的手法または強制指向手法を使用して、数百万のノードとエッジを持つグラフをレイアウトできます。評価版の試用版が利用可能です(免責事項:私はプログラムの著者の1人です)。
以下は、時間の経過とともに収集されたいくつかの推奨事項とリンクです。
igraph
パッケージを再検討しています。これには、整然としたレイアウトアルゴリズム(Fruchterman-ReingoldおよびKamada-Kawai)などが含まれています。http://www.github.com/graphistry/pygraphistryを構築して、ほとんどのブラウザーとノートブックからこれを実行できるようにしました。WebGLを使用して大きなグラフ(パン/ズーム/など)をレンダリングし、リアルタイムコンピューティング(レイアウト、フィルターなど)のほとんどをGPUクラウドにオフロードするという考え方です。GephiやCytoscapeに似ていますが、大きなグラフとデータ分析に重点を置いており、Webとノートブックに統合しています。
"Tulip" [1]を試してみてください。かなり大きなグラフを処理できると思います(少なくとも10Kから100Kのノードで試してみましたが、うまくいきました)。