データ削減のために繰り返される対策に対してPCAを実行できますか?


13

私は、2つのコンテキストのそれぞれで87の動物に対して3つの試験を行っています(データが欠落している、データが欠落している= 64の動物)。文脈の中で、私は多くの具体的な対策(入力する時、避難所に戻った回数など)を持っているので、私は(それらを呼び出すそのコンテキストで動作を説明し、2〜3の複合行動スコアを開発したいですC1C2C3)。私C1は、3つの試験すべてと87匹の動物で同じことを意味するので、年齢、性別、血統、および個々の動物が行動に及ぼす影響を調べるために回帰を行うことができます。次にC1、特定の年齢内の他のコンテキストでの行動スコアとの関係を調べたいと思います。(1歳で、コンテキスト1のアクティビティはコンテキスト2のアクティビティを強く予測しますか?)

これが繰り返し測定されない場合、PCAはうまく機能します。コンテキストの複数の測定でPCAを実行し、PC1、PC2などを使用して、1つのコンテキストのPC1とPC1(または2または3)他のコンテキスト。問題は反復測定であり、これは疑似複製に分類されます。レビュアーに断りなく「ノーゴー」と言ったことがありますが、データ削減を行うときにこれが問題になるかどうかについて明確な参照を見つけることができません。

私の推論は次のようになります。PCAで私がしていることは、元の測定値に対して純粋に記述的であるため、測定値の繰り返しは問題ではありません。コンテクスト1の「大胆さ」尺度としてアリーナに入る時間を使用していることをフィアットで宣言した場合、すべての年齢のすべての個人に匹敵するコンテクスト1大胆さ尺度があり、誰も目をつぶることはありません。私は私が使用するフィアットで宣言した場合は時間に入る+ 0.5 タイム・トゥ・遠端、同じことが行きます。私は、還元の目的のために純粋にPCAを使用していますもしそうなら、なぜそれがPC1が(それはあるかもしれないことはできません0.28 入力+ 0.63 仕上げ+ 0.02を0.5+ 0.50.28+ 0.63+ 0.02 合計時間...)、入力する時間が一般的に有益で代表的な特性であると推測する代わりに、少なくとも複数の手段によって通知されますか?

(注:対策の基本的な構造には興味がありません ...質問は、コンテキスト固有の動作をどのように解釈するかについてです。「コンテキスト1を使用して、ハリーが他の動物と比較してアクティブであると結論付けた場合、ハリーはコンテキスト2でアクティブですか?年齢が上がるにつれてコンテキスト1のアクティビティとして解釈するものを変更した場合、コンテキスト2のアクティビティも変更しますか?)

私はPARAFACを調べましたが、SEMを調べましたが、これらのアプローチのいずれかがサンプルサイズに適しているとは思いません。誰でも体重を量ることができますか?ありがとう。


私はあなたが2つの被験者内要因を持っていることを修正しました:1)いくつかの実験条件(例えば、屋内実験と屋外実験)によって異なるコンテキスト、2)実験の単なる繰り返し、試みであるトライアル。また、各条件でPCAを実行したいのですが、実験の1つではなく、いくつかの試行を行ったことはありません。
ttnphns

2つのコンテキストは2つの個別のテストであり、それぞれで実行される測定値は異なります。そうは言っても、はい、あなたは私の状況を理解しています。
リアン

問題を回避して、3つの試行すべてにわたって平均でPCAを実行するのはどうですか?
ガラ

回答:


7

多因子分析を調べることができます。これは、FactoMineRを使用してRに実装できます。

更新:

詳述するために、Leannは-かなり前に-繰り返し測定を行うデータセットに対してPCAを実施することを提案していました。彼女のデータセットの構造を正しく理解していれば、与えられた「コンテキスト」に対して、動物のx「特定の尺度」(入力する時間、シェルターに戻る回数など)マトリックスがありました。64匹の動物(オブスを逃さない動物)のそれぞれを3回追跡しました。そう、彼女はその後、動物の行動には3つの64×10のマトリクスを持っているでしょう、のは、彼女が10「特定の措置」を持っていたとしましょう(私たちが行列を呼び出すことができX1X2X3)。3つのマトリックスでPCAを同時に実行するには、3つのマトリックスを「行バインド」する必要があります(例:PCA(rbind(X1,X2,X3)))。しかし、これは、最初の観察と64番目の観察が同じ動物に関するものであるという事実を無視しています。この問題を回避するために、彼女は3つのマトリックスを「列バインド」し、それらを複数因子分析で実行できます。MFAは、同じ個人またはオブジェクトで異なる時点で測定された変数の複数のセットを分析する便利な方法です。彼女は、PCAの場合と同じ方法でMFAから主要コンポーネントを抽出できますが、動物ごとに1つの座標を持ちます。動物オブジェクトは、彼女の3つの観察によって区切られた多変量の妥協スペースに配置されます。

彼女はRのFactoMineRパッケージを使用して分析を実行できます。サンプルコードは次のようになります。

df=data.frame(X1, X2, X3)
mfa1=MFA(df, group=c(10, 10, 10), type=c("s", "s", "s"), 
 name.group=c("Observation 1", "Observation 2", "Observation 3")) 
 #presuming the data is quantitative and needs to be scaled to unit variance

また、最初の3つのコンポーネントをMFAから抽出して重回帰を行う代わりに、説明変数を「補足テーブル」としてMFAに直接投影することを検討することもできます(を参照?FactoMineR)。別のアプローチは、MFAからオブジェクト座標のユークリッド距離行列を計算し(例dist1=vegdist(mfa1$ind$coord, "euc"):)dist1、動物固有の変数の関数として(たとえばrda(dist1~age+sex+pedigree)、ビーガンパッケージを使用して)RDAに送信することです。


2
こんにちはカイル、ご回答ありがとうございます。ただし、本質的にリンクにすぎない回答、または長さの文のみに関する回答は、一般に回答ではなくコメントと見なされます。特に、リンクのみの回答はリンク腐敗の影響を受けるため、回答はリンクが機能しなくなった場合でも役立つ十分な情報を持っている必要があります。それが何であるか/それがより一般的に因子分析にどのように関係するかについての非常に簡単な概要を与えて、あなたの答えをもう少し広げてください。
グレン_b-モニカの復帰14

(+1)これは古い投稿であることがわかりましたが、この回答は非常に便利です!おそらくリンクが切れた場合に参照を完全に追加する必要があります:AbdiHervé、Williams Lynne J.、Valentin Domininique。複数因子分析:マルチテーブルおよびマルチブロックデータセットの主成分分析。WIREs Comp Stat 2013、5:149-179。doi:10.1002 / wics.1246
フランスロデンブルク

4

繰り返される測定値を分析する際にPCAを使用するのが一般的です(たとえば、販売データ、株価、為替レートの分析に使用されます)論理は明確です(つまり、PCAは推論ツールではなくデータ削減ツールです) )。

非常に優れた統計学者による出版物の1つは、Bradlow、ET(2002)です。「主成分分析を使用した主要機能の反復測定データセットの探索。」Journal of Research in Marketing 19:167-179。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.