Word2Vec実装にiter
パラメーターがありますgensim
クラスgensim.models.word2vec.Word2Vec(sentences = None、size = 100、alpha = 0.025、window = 5、min_count = 5、max_vocab_size = None、sample = 0、seed = 1、workers = 1、min_alpha = 0.0001、sg = 1、hs = 1、negative = 0、cbow_mean = 0、hashfxn =、iter = 1、null_word = 0、trim_rule = None、sorted_vocab = 1)
エポックの数を指定します。つまり、
iter =コーパス全体の反復数(エポック)。
それがコーパス全体でモデルを改善するのに役立つかどうか誰か知っていますか?
がiter
デフォルトで1に設定されている理由はありますか?いいえを増やすことにはあまり効果はありません。エポックの?
いいえを設定する方法についての科学的/経験的評価はありますか?エポックの?
分類/回帰タスクとは異なり、ベクトルは監視されていない方法で生成され、目的関数は単純に階層型ソフトマックスまたは負のサンプリングのいずれかであるため、グリッド検索方法は実際には機能しません。
いいえを短縮するための早期停止メカニズムはありますか?ベクトルが収束した時点のエポックの数 また、階層的なソフトマックスまたは負のサンプリング目標は収束できますか?