Rの順序付けられたカテゴリカルデータ間の相関関係を(視覚的に)すばやく評価しますか?


11

アンケートのさまざまな質問への回答間の相関関係を探しています(「うーん、質問11への回答が質問78の回答と相関しているかどうかを見てみましょう」)。すべての回答はカテゴリ型です(そのほとんどは「非常に不幸」から「非常に満足」までの範囲です)が、いくつかの回答は異なるセットです。それらのほとんどは序数と見なすことができるので、ここでこのケースを考えてみましょう。

私は商用統計プログラムにアクセスできないので、Rを使用する必要があります。

Rattle(Rのフリーウェアデータマイニングパッケージ、非常に気の利いたもの)を試してみましたが、残念ながらカテゴリカルデータはサポートされていません。私が使用できるハックの1つは、「非常に不幸」ではなく数値(1..5)を含む調査のコード化されたバージョンをRにインポートして、それらが数値データであるとラトルに信じさせることです。

私は散布図を作成し、ドットサイズを各ペアの数値の数に比例させることを考えていました。グーグルで検索した後、http: //www.r-statistics.com/2010/04/correlation-scatter-plot-matrix-for-ordered-categorical-data/を見つけましたが、(私にとって)非常に複雑に見えます。

私は統計学者ではありませんが(プログラマーです)、この件について少し読んだことがあります。私が正しく理解していれば、ここではスピアマンのrhoが適切でしょう。

だから、急いでいる人のための質問の短いバージョン:Rでスピアマンのローをすばやくプロットする方法はありますか?プロットは、数値の行列よりも簡単です。これは、目を簡単に見ることができ、材料にも含めることができるためです。

前もって感謝します。

PS私はこれをメインのSOサイトに投稿するか、ここに投稿するかについてしばらく考えました。両方のサイトでR相関を検索した後、このサイトは質問により適していると感じました。


2
Rは適切なソフトウェアよりも劣っているように思えます。:)
RomanLuštrik2010

私の場合、ピアソンの積率相関(連続データを想定)を使用するのはまったく理にかなっています(スケール上に十分なポイントがあり、中点がわからない場合)。心理学(たとえば、性格や社会心理学)内のすべてのフィールドは、たとえば、非常に非Xから非常にXに及ぶ5ポイント(または7ポイント)スケールで単一の項目に回答するという仮定に基づいて(成功)連続として扱われます。:また、このスレッドを参照してくださいstats.stackexchange.com/questions/539/...
ヘンリック

@romunov:Rが他のソフトウェアよりも劣っているという印象をどう受けたかはわかりません。しかし、そうではありません。
wishihadabettername 2010

私はただおしりでした。辛い気持ちはないですね。:)
RomanLuštrik2010

回答:


19

corrplotパッケージによって、相関関係の別の優れた視覚化が提供され、次のようなものが提供されます。 代替テキスト

素晴らしいパッケージです。

こちら回答もご覧ください。知っておくとよいでしょう。

最後に、あなたが言及した投稿のコードがどのように単純になるかについて提案がある場合は、私に知らせてください。


1
Talに感謝します。今からcorrplotを試してみます。私はあなたの解決策を単純化する方法を知っていればよかったのですが(質問でリンクしました)、私はRの初心者なので、私よりも知っています。質問を更新して、解が複雑
wishihadabettername

コーロットはよさそうだ。これは、相関のサイズと方向の優れた視覚的スナップショットを提供します。5点の順序付けられたカテゴリ変数の場合、ピアソンの相関以外の関連性のいくつかの測度を提供することが役立つ場合があります。たとえば、ポリコリック相関。順序付けられたカテゴリー変数の標準的なピアソンの相関のサイズは、2つの変数の平均によって多少影響を受けます。
Jeromy Anglim 2010

3

追加のプロットのアイデアのカップルは次のとおりです。


ひまわりは楽しいソリューションです。ジッタを使用することは、トピックを最初に見たときに試しましたが、相関行列のプロットには効果的でないことがわかりました...
Tal Galili

ええ、ジッターは多くの変数を持つ散布行列でかなり厄介になる可能性があります。ジッタとヒマワリの利点は、生データを見ることができることです(ジッタの場合は混乱します)。
Jeromy Anglim 2010

同意しました(私はジッターが大好きですが、これには向いていません:))
Tal Galili 2010
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.