離散データとPCAの代替
私は、昆虫の密接に関連するいくつかの種の形態学的翼の特徴を説明する離散(順序、メリット、および名目)変数のデータセットを持っています。私が期待しているのは、形態学的特徴に基づいて、さまざまな種の類似性を視覚的に示すような分析を行うことです。最初に頭に浮かんだのはPCA(これは私が作成しようとしている視覚化の種類です)ですが、それを調べた後(特に、次のような他の質問:主成分分析を連続の混合を含むデータセットに適用できますか?)とカテゴリ変数?)、PCAは離散データには不適切である可能性があります(PCAはこれらのタイプの研究で文献で使用されていますが、常に連続データを使用しています)。このデータが不適切である理由の統計的背景を無視すると、PCAは私の生物学的質問に関して比較的完璧な結果を私に与えます(興味のあるハイブリッドグループは父方のグループの真ん中にあります)。 私はまた、統計を緩和するために複数のコレスポンデンス分析を試しました(少なくとも私の理解の限りでは)が、PCAで得られるプロットに似ているプロットを取得できないようです。異なるグループ(生物学的に言えば、異なる種)を示すために、色で区切られています。この分析は、個々の観察ではなく、変数(ここでは、私の形態学的特性)が互いにどのように関連しているかを説明することを目的としているようです。また、グループごとに色分けした観測をプロットすると、個人のセット全体を表す単一の値(おそらく平均)しか得られません。私はRで分析を行ったので、プロットについてのアイデアを機能させるのに十分なほどRに精通していないかもしれません。 私のデータでこの種の分析を試すのは正しいですか、それとも私は順調ですか?わからない場合は、私の統計的な専門知識は限られているので、これらの分析の下で行われている方程式はすべて私の頭の中にあります。私はこの分析を完全に記述的に実行しようとしています(これ以上ダウンストリームの数値計算を行う必要はありません)。これが当てはまる場合は、PCAで十分ですが、確実に確認したいと思います。あまりにも多くの統計的仮定に違反しています。