現在、ラベル付きデータセットを検索して、非公式テキスト(ツイートに似たもの)から名前付きエンティティを抽出するモデルをトレーニングしています。データセットのドキュメントには大文字と文法が欠けていることが多いため、今日の最先端のエンティティ認識システムの多くがそうであるニュース記事やジャーナルエントリよりも少し「非公式」なドメイン外データを探しています。訓練を受けた。
2
尋ねるオススメopendata.stackexchange.com
—
エア
@マディソン5月。データセットを見つけましたか?似たようなものを探しています。ありがとう。
—
ahoffer
私は、U。Washingtonのtwitter nerコーパス(元の投稿にリンクされています)で間に合わせる必要がありました。
—
マディソン14
関連する優れた注釈付き英語コーパスを取得しましたか?
—
アキウタナンダサフー