混合ガウスモデルを使用する場合


9

GMMを初めて使用する。オンラインで適切なヘルプを見つけることができませんでした。「GMMの使用が私の問題に適しているかどうかを判断する方法」に関する正しいリソースを誰かに教えてもらえますか?または分類の問題の場合「SVM分類またはGMM分類を使用する必要があるかどうかを判断する方法」


あなたのデータセットとは何ですか?あなたの正確な問題は何ですか?これは、データが複数の正規分布に従う(混合される)場合に使用されます。-別の質問を参照してくださいstats.stackexchange.com/questions/236295/...
Arpit Sisodia

これは、データにラベルを付けておらず、潜在グループが完全に多変量正規であると考えるクラスタリングの一種と考えることができます。
ガン-モニカの回復

@ arpit-sisodia、特定の機能があると思われるハードウェアキーボードセットアップの実現可能性に取り組んでおり、GMMを使用してそれをモデル化することを計画しています。基本的なプロセスが明確にわからないため、機械学習手法を使用してモデル化しようとしています。したがって、基になるプロセスに実際にガウス分布が混在しているかどうかはわかりません。さらに、それは多次元であり、ガウス混合であるかどうかを視覚化することはできません
Vinay

@ arpit-sisodia、あなたが提供したリンクは、GMMが私のデータに適合するかどうかを確認するための試行錯誤の方法をさらに提案しています。使用するモデルを決定する決定的な方法/経験則はありますか?より多くの混合物で遊ぶ試行錯誤法は私のデータに適合します。しかし、決定する特定の方法はありますか?SVM分類のためのデータの線形分離可能性が必要であるように
Vinay

回答:


4

私の意見では、データポイントがガウス分布の混合であることがわかっている場合は、GMMを実行できます。基本的には、平均値と標準偏差が異なるクラスターを形成します。scikit-learnのWebサイトに素敵な図があります。L

GMM分類

アプローチは、ソフトクラスタリング手法を使用してクラスターを見つけ、ガウス分布かどうかを確認することです。そうであれば、データセット全体を表すGMMモデルを適用できます。


1
多くの場合、データポイントが混合ガウス分布であるかどうかはわかりません。したがって、これはGaussianとMoGのより多くの遊び回りであり、それが適合するかどうかを確認します。しかし、GMMを適切に使用するための指示や経験則はありません
Vinay

2
私の経験によれば、混合モデルであるデータのパターンを見つける必要があります。読むのに適した
Slayer

0

GMMは通常、(1)観測のクラスター化、(2)生成モデルの指定、または(3)密度の推定のいずれかを目的とする場合に適しています。実際、クラスタリングの場合、GMMはk-meansのスーパーセットです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.