Vowpal Wabbit(VW)は明らかにSEARNを介したシーケンスタグ付け機能をサポートしています。問題は、説明といくつかの例を含む詳細なパラメーターリストがどこにも見つからないことです。私が見つけた最高のものは、非常に短い例のあるジンコフのブログエントリです。メインのwikiページはかろうじてSEARNに言及しています。
チェックアウトしたソースコードで、NERサンプルデータを含むデモフォルダーを見つけました。残念ながら、すべてのテストを実行するスクリプトは、このデータで実行する方法を示していません。少なくとも、期待される形式を確認するのに十分な情報でした。エントリが空白行で区切られていることを除いて、標準のVWデータ形式とほぼ同じです(これは重要です)。
私の現在の理解は、次のコマンドを実行することです。
cat train.txt | vw -c --passes 10 --searn 25 --searn_task sequence \
--searn_passes_per_policy 2 -b 30 -f twpos.vw
どこ
--searn 25
-NERラベルの総数(?)
--searn_task sequence
-シーケンスタグ付けタスク(?)
--searn_passes_per_policy 2
-何をしているのかわからない
その他のパラメーターはVWの標準であり、追加の説明は必要ありません。おそらく、SEARNに固有のパラメーターが他にありますか?それらの重要性と影響は何ですか?それらを調整する方法?経験則はありますか?
例へのポインタは高く評価されます。