私の質問はばかげているかもしれません。あらかじめお詫び申し上げます。
私はスタンフォードNLPグループ(リンク)によって事前トレーニングされたGLOVEモデルを使用しようとしていました。しかし、私の類似性の結果がいくつかの負の数を示していることに気づきました。
すぐに、単語ベクトルデータファイルを確認するように求められました。どうやら、単語ベクトルの値は負になることが許されていました。これが、コサインの負の類似性を見た理由です。
[0、1]で値が制限されている周波数ベクトルのコサイン類似度の概念に慣れています。ベクトル間の角度に応じて、内積と余弦関数が正または負になる場合があることを知っています。しかし、私はこの否定的な余弦の類似性を理解して解釈するのに本当に苦労しています。
たとえば、類似性が-0.1の単語のペアがある場合、類似性が0.05の別のペアよりも類似性が低いですか?-0.9と0.8の類似度を比較してみませんか?
または私はちょうどからの最低限の角度差の絶対値になります?スコアの絶対値は?
とても感謝しています。
An angular-type similarity coefficient between two vectors. It is like correlation, only without centering the vectors.
2つの間の唯一の違いは、相関偏差(瞬間)-相互乗算されている-は平均からであるのに対し、コサイン偏差は元の0からである-つまり、それらはそのままの値です。