回答:
密度推定のアプリケーションの典型的なケースの1つは、ノベルティ検出(別名外れ値検出)です。ここでは、1つのタイプのデータのみ(またはほとんど)を持っているが、非常にまれで質的に異なるデータに興味があり、それらの一般的なケース。
例としては、不正検出、システムの障害の検出などがあります。これらは、興味のある種類のデータを収集するのが非常に困難および/または高価な状況です。これらのまれなケース、つまり発生する可能性の低いケース。
ほとんどの場合、正確な分布を正確に推定するのではなく、相対的なオッズ(特定のサンプルが実際の外れ値であるか、そうでないか)に関心があります。
このトピックに関する多数のチュートリアルとレビューがあります。これは最初から良いものかもしれません。
編集:一部の人々にとっては、外れ値の検出に密度推定を使用すると奇妙に思えます。まず、1つのことに同意しましょう。誰かが混合モデルを自分のデータに当てはめると、実際に密度推定を実行していることになります。混合モデルは、確率の分布を表します。
kNNとGMMは実際には関連しています。これらは、このような確率密度を推定する2つの方法です。これは、ノベルティ検出の多くのアプローチの根底にある考え方です。例えば、この1は kNNs、これに基づいて、他の1(紙の開始時に、この非常に考えを強調)パーゼンの窓に基づいて、多くの他のもの。
すべてではないにしても、ほとんどがこのアイデアに取り組んでいるように思えます(しかし、それは私の個人的な認識です)。異常/まれなイベントのアイデアを他にどのように表現しますか?