BERTは双方向(双方向トランスフォーマーを使用)なので、次の単語予測タスクに使用できますか?はいの場合、何を調整する必要がありますか?
元の出版物を見ましたか?セクション3.3.2で説明されているように、文レベルで予測を扱っているようです。
—
mapto
GitHubに関する関連ディスカッションを検討してください。
—
mapto