NLPの分類プロセスで解析ツリーのどの機能が一般的に使用されますか?


13

さまざまなタイプの解析ツリー構造を調査しています。2つの広く知られている解析ツリー構造は、a)Constituencyベースの解析ツリーとb)Dependencyベースの解析ツリー構造です。

スタンフォードNLPパッケージを使用して、両方のタイプの解析ツリー構造を生成できます。ただし、これらのツリー構造を分類タスクに使用する方法がわかりません。

たとえば、感情分析を行い、テキストをポジティブクラスとネガティブクラスに分類したい場合、分類タスクの解析ツリー構造からどのような特徴を導き出すことができますか?

回答:


9

解析ツリーを使用して、文を部分に分割します。センチメント分析の例では、これらのパーツを使用してポジティブ/ネガティブな感情を各パーツに割り当て、それらのパーツの累積効果を得ることができるとします。

感情分析

この画像は、あなたがより理解するのに役立ちます。前半はネガティブな感情(主に「ドライ」という言葉が原因)がありますが、「but」という言葉と「enjoyed」という言葉の使用により、ネガティブな感情はポジティブな感情に変わります。

それらの使用に関しては、文中の個々の単語の単語ベクトル表現を生成し、親ノードの代わりにニューロンを使用することができます。各ニューロンは、重みを介して別のニューロンに接続する必要があります。すべてのリーフノードは、文の単語の単語ベクトル表現になります。最上位の親ニューロン(この場合は最上部の青+シンボル)は、文に従ってポジティブ/ネガティブな感情を生成する必要があります。このツリー構造は、教師付きの方法でトレーニングできます。

理解の詳細については、このペーパーをお読みください。

画像クレジット:cs224.stanford.edu


1

依存関係を使用して、センチメント分類子の精度を向上させることができると思います。次の例を考慮してください。

E1:ビルは科学者ではない

そして、トークン「科学者」が特定のドメインで肯定的な感情を持っていると仮定します。

依存関係neg(scientist、not)を知っていると、上記の例には否定的な感情があることがわかります。この依存関係を知らなければ、おそらく文をポジティブとして分類するでしょう。

別の種類の依存関係をおそらく同じ方法で使用して、分類子の精度を向上させることができます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.