多くのセットの交差点を視覚化する


30

多くのセットの交差部分の重なりを示すのに適した視覚化モデルはありますか?

私はベン図のようなものを考えていますが、どういうわけか10以上などのより多くのセットに適しているかもしれません。ウィキペディアにはいくつかのより高いセットのベン図が表示されますが、4セットの図でさえ多くを取り入れる必要があります。

データの最終結果についての私の推測では、セットの多くが重複しないため、ベン図がうまくいく可能性がありますが、それを生成できるコンピューターツールを見つけたいと思います。Googleチャートではそれほど多くのセットが許可されていないようです。


1
関連するが、少数のセット(参照用):stats.stackexchange.com/questions/4211/…– user88 11

回答:


18

多数のセットがある場合は、より線形でリンクを直接表示するもの(ネットワークグラフなど)を試します。FlareとProtovisには、これらの視覚化を処理するユーティリティがあります。

このようないくつかの例については、この質問を参照してください。

代替テキスト


(+1)いい答えです!-私は特にグラフィックが好きです。Rでこれを行う方法があるかどうか疑問に思っていましたか?
-suncoolsu

1
私はそれを行う方法を知りません。私のwebvisパッケージはProtovisのラッパーを提供しますが、このグラフィックを作成するのは大変な作業です。なお、本稿では「アーク図」に関連しているが導入されていますieg.ifs.tuwien.ac.at/~aigner/teaching/ws06/infovis_ue/papers/...
シェーン

1
@suncoolsu、Rパッケージ図は、シェーンが指摘したのと同じ「アーク図」を実行できる可能性があります。ただし、「プロットWeb」を上記のビジュアルのように見せることは大変な作業のように見えます。cran.r-project.org/web/packages/diagram/vignettes/diagram.pdf
アンディW

そしてアンディ。ご回答ありがとうございます。@ Shane、webvisパッケージを見ました。しかし、私はまだそれをさらに調査する必要があります。私はprotovisグラフがとても好きです。彼らは素晴らしいウェブサイトを持っています。
suncoolsu

1
素敵なグラフですが、3つ以上のセットの共通部分を表すことができないため、最初の質問には答えません。それのバリアントはありますか?
nassimhddd

11

@Shaneの答えと競合することはありません。なぜなら、円形ディスプレイは、高次元のデータセットとの複雑な関係を表示するのに非常に適しているからです。

venn()K=4

K=4

さらに参照するには、興味があるかもしれません

Kestler et al。、一般化ベン図:複雑な遺伝的セットの関係を視覚化する新しい方法、Bioinformatics、21(8)、1592-1595(2004)。

ただし、ベン図には制限があります。この点で、Robert KosaraSightings:A Vennerable Challengeで、またはParallel Setsで取ったアプローチが好きです(ただし、Andrew Gelmanのブログでこの議論を参照してください)。


よさそうだ。それが非数値を受け入れるなら、私はそれを愛していたでしょう。最初にデータを数値リストに変換する必要があるようです。
eastafri

実用的な目的のために、いくつかのスクリーングラブを含めるのは素晴らしいことです
user5783745

7

私たちは、あなたがでそれをチェックアウトすることができ、動揺と呼ばれる一連の交差点のためのマトリックスベースのアプローチを開発しhttp://vcg.github.io/upset/。以下に例を示します。

UpSet Screenshot

左側のマトリックスは、行が表す交差点を識別します。ここの最後の行は、たとえば、「アクション、アドベンチャー、および子供」映画ジャンルの交差点です。右側のバーは交差点のサイズを示しています。この例では4です。

交差点やその他の選択の属性などをプロットすることもできます。詳細については、Webサイトをご覧ください。

また、Rの静的バージョンもあります。これは、上記のWebサイトまたはhttps://github.com/hms-dbmi/UpSetR/で確認できます

セットの視覚化に関する最新のレポートは、http: //www.cvast.tuwien.ac.at/SetVizからアクセスできます。これらのほとんどはアカデミックであり、すぐに利用できるコードは付属していません。


1
私としてあなたが投稿した画像には、あまりにも多くの情報を単一のプロット...上に詰めて、むしろoverplottingの一例である
ティム

1
@ティム。私はあなたの言っていることを理解していますが、すべての視覚的要素がはっきりと見えて分離されているので、実際に過剰なプロットではありません。プロットは複雑すぎてすぐに見分けられないと主張することができますが、これはプロットを使用する訓練を受けていないことに関連している可能性があります-ベン図のスケーラビリティが低い)
ThomasP85

@ ThomasP85は、円グラフのような基本的なものも含めて、プロット(「専門家」)の視覚的解釈が本当に悪いことを示す多くの研究がありました。ほとんどの場合、複雑な視覚化は誤解や誤解につながります。
ティム

@Tim私は単純な方が常に良いことに同意しますが、複雑な質問には時々複雑な答えがあります。そもそもこの問題が提起された理由は、これまでのところ、多数の集合交差を処理す​​るための説得力のある単純な視覚化手法ではないためです。受け入れられた答えは、セットの数が増加するにつれて、交差の総数のますます少ない部分である2度の交差にのみ関係します。
ThomasP85

...と、円グラフであなたの例は、ヒト(専門家かどうか)は円グラフが:-)使用すべきではありません理由である、比較角度で恐ろしいであるという事実に関連している
ThomasP85
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.