4次元データを視覚化するための一般的な選択肢は何ですか?


12

次の4次元データがあり、最初の3つは座標と見なされ、最後の1つは値と見なされるとします。

c1, c2, c3, value
1, 2, 6, 0.456
34, 34, 12 0.27
12, 1, 66 0.95

最後の値の最初の3つの座標の効果をより良く視覚化する方法は?

私は3つの方法を知っています。

1つは、ポイントのサイズを4つの値とする最初の3つの座標の3Dプロットです。しかし、データの傾向を見るのはそれほど簡単ではありません。

別の方法は、座標が固定された一連の3Dプロットを使用することです。 ここに画像の説明を入力してください

もう1つは、Rの格子のいわゆる「トレリスグラフ」です。 ここに画像の説明を入力してください


2
静的なディスプレイが必要ですか(例:紙用)?
GUNG -復活モニカ

回答:


12

最初の3つが単なる空間座標であり、データがまばらな場合は、値のサイズや色が異なるポイントを使用して3D散布図を作成するだけです。

次のようになります:( ソース:gatech.edu散布

データが本質的に連続することを意図しており、格子グリッド上に存在する場合、マーチングキューブを使用してデータの複数の等高線をプロットできます。

高密度の4Dデータがある場合の別のアプローチは、3Dに埋め込まれたデータの2D「スライス」をいくつか表示することです。次のようになります。

スライス数


色付きの3D散布図は、3Dデータの連続関数にのみ本当に適しています。関数の勾配が滑らかに変化すると、点散布全体に何らかのパターンが見られます。同様に、下部のボリュームの視覚化もこのシナリオで最適に機能します。関数が非常にうるさい場合、何かを見るのに苦労します。4つの説明変数(PCAやクラスター化など)があり、3つをユークリッド座標でプロットし、4つ目は、色への非線形マッピングを使用して、知覚バイアスを導入して定量化できません。
ダイアンクック14年

@DianneCookそれは本当です。私はそれが常にスムーズで連続的な3D
ボリュー

ねえ、それが質問者が尋ねたものです%^)
ダイアンクック14年

9

4つの量的変数がありますか?その場合は、ツアー、平行座標プロット、散布図マトリックスを試してください。Rのtourr(およびtourrGui)パッケージは、基本的に高次元で回転するツアーを実行します。1D、2D、またはそれ以上に投影することを選択できます。パッケージで引用を開始するために読むことができるJSSペーパーがあります。平行座標プロットと散布図マトリックスはGGallyパッケージにあり、散布図マトリックスはYaleToolkitパッケージにもあります。また、http://www.ggobi.orgでこれらすべてのビデオやその他のドキュメントを見ることができます。

データが完全にカテゴリカルである場合、モザイクプロットまたはバリアントを使用する必要があります。Rのproductplotsパッケージを見てください。また、vcdには合理的な機能がいくつかあります。または、ggparallelパッケージは、カテゴリデータの平行座標プロットに相当します。また、extracatパッケージには、カテゴリデータを表示するための機能がいくつかあります。

もともと質問を間違えたのは、その質問に立ち止まって、説明全体を読むのを怠ったためです。以下のアプローチ(3Dのカラーポイント)と同様に、リンクされたブラッシングを使用して、高次元空間で定義された関数を探索できます。3D多変量正規関数これを行う方法を示すビデオをご覧ください。ブラシは、ポイントを高密度(高機能値)でペイントし、次に低密度値(低機能値)に移動します。関数がサンプリングされる場所は、ツアーを使用して3D回転散布図に表示され、4、5、またはそれ以上の次元のドメインを見るのにも使用できます。


2

チェルノフの顔を試してみてください。アイデアは、変数を顔の特徴にアタッチすることです。たとえば、笑顔のサイズは1つの変数になり、顔の丸みは別の変数になります。変に聞こえるかもしれませんが、変数をフィーチャにマップするスマートな方法を見つけた場合、これは実際に機能します。

別の方法は、3次元の状態図の2次元投影を表示することです。x1、x2、x3、x4の変数があるとします。x4の各値について、(x1、x2、x3)ポイントの3次元グラフを描画し、ポイントを接続します。これは、x4が注文されたとき、たとえば日付や時刻に最適です。

更新:バブルプロットを試すこともできます。通常、3つの次元はデカルトx、y、zで、4番目の次元はバブルポイントのサイズです。

アニメーションを試すことができます。つまり、時間を4次元として使用します。

また、バブルとアニメーションの組み合わせ:x、y、バブル、および時間。

また、Chernoffに関連するのはグリフプロットで、これはもう少し深刻に見えるかもしれません。光線の長さが変数の値に比例する星です。


答えてくれてありがとう。私の問題には2番目のオプションが考えられます。最初のものは、研究論文にとってそれほど深刻ではないと思う。基本的に、プロットが値(4次元)の3つの要因の傾向または影響を明らかにできるようにしたいと思います。
タイラー傲来国主

5
チャーノフの顔は、深刻な研究で使用されました、afaik
Aksakalほぼ確実にバイナリ

1
チェルノフの面は、特に次元が約10〜20の変数である場合に非常に役立ちます。4次元では、他の種類のグラフィック表現ほど効果的ではありません。
whuber

3
チェルノフの顔はひどいアイデアです!アイコンプロットを使用する必要がある場合は、スタープロットを使用します。本当に小さなデータセットがある場合、これらは有用かもしれませんが、1000個のアイコンをプロットして、本当に何かを見ることができるかどうか確かめてください!
ダイアンクック14年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.