Rのロバストな多変量ガウスフィット


11

一般化されたガウス分布を、かなりの数の外れ値と高いレバレッジを含む7次元の点群に適合させる必要があります。この仕事に適したRパッケージを知っていますか?


3
stats.stackexchange.com/questions/213/…で、同様の質問への返信に多変量外れ値を識別するための少なくとも4つのRパッケージへのリンクがあります。それは良いスタートかもしれません。
whuber

多分問題は私を逃れていますが、多変量ガウス分布をあてはめる限り、MLEとして経験的平均とSDを使用しないのはなぜですか?影響力/レバレッジポイントが高い場合は、診断統計に集中できます。
AdamO

回答:


1

mclustもあります:http ://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html

ただし、注意点が1つあります。ポイントクラウドが大きい場合、高次元空間での混合モデリングは、CPUとメモリを大量に消費する可能性があります。約4年前に、11次元の50〜200Kのポイントデータのバッチを実行していたところ、4〜11 GBのRAMに実行され、各ケースの計算に最大で1週間かかる傾向がありました(400でした)。これは確かに可能ですが、共有計算クラスタを使用している場合や、利用可能なリソースが限られている場合には頭痛の種になる可能性があります。


1

これは、古典的な多変量ガウス混合モデルのように聞こえます。BayesMパッケージはうまくいくと思います。

ここにいくつかの多変量ガウス混合パッケージがあります

  • bayesm:cran.r-project.org/web/packages/bayesm/index.html
  • mixtools:www.jstatsoft.org/v32/i06/paper
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.