回答:
選挙区解析ツリーは、テキストをサブフレーズに分割します。ツリーの非終端はフレーズのタイプであり、終端は文の単語であり、エッジにはラベルが付いていません。単純な文「John sees Bill」の場合、選挙区解析は次のようになります。
Sentence
|
+-------------+------------+
| |
Noun Phrase Verb Phrase
| |
John +-------+--------+
| |
Verb Noun Phrase
| |
sees Bill
依存関係の解析では、単語をその関係に従って関連付けます。ツリーの各頂点は単語を表し、子ノードは親に依存する単語であり、エッジは関係によってラベル付けされます。"John sees Bill"の依存関係解析は次のようになります。
sees
|
+--------------+
subject | | object
| |
John Bill
目的に最も近いパーサータイプを使用する必要があります。文中のサブフレーズに興味がある場合は、おそらくConstituencyの解析が必要です。単語間の依存関係に関心がある場合は、おそらく依存関係の解析が必要です。
Stanfordパーサーはどちらかを提供できます(オンラインデモ)。実際、実際に機能する方法は、常にConstituencyパーサーで文を解析し、必要に応じて、Constituency解析ツリーで確定的(ルールベース)変換を実行して、それを依存関係ツリーに変換します。
もっとここに見つけることができます: