2
NLP-Gazetteerはチートですか?
NLPには、Gazetteer注釈の作成に非常に役立つ概念があります。私が理解する限りでは: 地名辞典は、都市、組織、曜日などのエンティティの名前を含むリストのセットで構成されます。これらのリストは、名前付きエンティティの認識タスクなど、テキストでこれらの名前の出現を見つけるために使用されます。 したがって、本質的にはルックアップです。この種のチートではありませんか?Gazetteer名前付きエンティティを検出するためにaを使用する場合、それほど多くは行われませんNatural Language Processing。理想的には、NLPテクニックを使用して名前付きエンティティを検出したいと思います。それ以外の場合、正規表現パターンマッチャーよりも優れていますか?