教師なし学習を評価するパフォーマンスメトリック


49

教師なし学習(クラスタリングなど)に関して、パフォーマンスを評価するためのメトリックはありますか?



4
この質問はそれよりも一般的だと思うので、これは公開したままにしておきます。
ピーターフロム-モニカの復職

私はあなたと同じ質問を持っていて、いくつかの(まだ完全には読まれていない)参考文献が関連しています:クラスター検証のための内部有効性測定に関する調査L.フェレンツコヴァチ、チャバレガニー、アッティラバボス
カステルマ

回答:


44

ある意味では、この質問には答えられないと思います。これは、特定の教師なし方法がどれだけうまく機能するかは、そもそも教師なし学習を行う理由に大きく依存するからです。明らかにこれは完全に真実ではありません。人々はこれらの問題に取り組み、何らかの評価を含む結果を公開します。私が知っているいくつかのアプローチの概要を以下に示します。

クラスタリングのための優れたリソース(参考資料)は、sklearnのドキュメントページであるClustering Performance Evaluationです。これにはいくつかの方法が含まれますが、1つを除くすべてのシルエット係数は、グラウンドトゥルースラベルが利用可能であることを前提としています。この方法は、質問「クラスタリングの評価尺度」にも記載されており、この質問のコメントにリンクされています。

教師なし学習方法が確率的である場合、別のオプションは、保留されたデータの確率測定(対数尤度、困惑など)を評価することです。ここでの動機は、教師なし学習方法が、パラメータの適合に使用されなかった同様のデータに高い確率を割り当てる場合、おそらく関心のある分布をキャプチャするのに良い仕事をしたということです。このタイプの評価が一般的に使用されるドメインは、言語モデリングです。

最後に言及するオプションは、関連する補助タスクで教師付き学習者を使用することです。監視されていないメソッドが潜在変数を生成する場合、これらの潜在変数は入力の表現であると考えることができます。したがって、これらの潜在変数を、データが属するドメインに関連するタスクを実行する教師付き分類器の入力として使用するのが賢明です。教師ありメソッドのパフォーマンスは、教師なし学習者のパフォーマンスの代理として機能します。これは基本的に、表現学習に関するほとんどの作業で見られる設定です。

この説明はおそらく少し曖昧であるため、具体的な例を示します。単語表現学習に関するほとんどすべての作業では、評価に次のアプローチを使用します。

  1. 教師なし学習者を使用して単語の表現を学習します。
  2. 学習した表現を、音声タグ付けや名前付きエンティティ認識などのNLPタスクを実行する教師付き学習者の入力として使用します。
  3. 入力としてバイナリワードプレゼンス機能などの標準表現を使用して、ベースラインと比較して教師あり学習者のパフォーマンスを向上させる能力により、教師なし学習者のパフォーマンスを評価します。

作用におけるこのアプローチの例えば紙参照ワード観測研修制限ボルツマンマシンダールら。


11
+1「特定の教師なしメソッドがどれだけうまく機能するかは、そもそも教師なし学習を行う理由に大きく依存します」と、かなり要約しています。結果を実際に解釈することなく与えられた結果を正当化するために何らかの方法で使用できるマジックナンバーを探しに行かないでください。
マーククレセン

1
また、監視なしのアプローチがどれだけうまく機能するかを監視するアプローチをプロキシとして使用することで、新しい機能を発見する必要がないことも付け加えます。たとえば、クラスタリングは新しい機能を学習しませんが、多くの場合、クラスタリングは教師付き学習者の予測精度を改善するために使用され、これがなぜそうなのかを説明する追加の利点があります。たとえば、k-meansクラスタリングは、発見された構造とクラスタリングからの圧縮を活用することによりそれぞれ改善されるk予測を生成できます。参照してくださいttic.uchicago.edu/~shubhendu/Papers/clustering_bagging.pdf
サイバネティック
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.