word2vecアルゴリズムは両方に基づいていると私は言うでしょう。
人々が言うときdistributional representation
、それらは通常言語的側面を意味します:意味は文脈であり、会社や他の有名な引用で単語を知っています。
しかし、人々が言うときdistributed representation
、それはほとんど言語学とは何の関係もありません。それはコンピュータサイエンスの側面についてです。私がミコロフと他を正しく理解するならばdistributed
、彼らの論文の言葉
はベクトル表現のそれぞれの単一の構成要素がそれ自身の意味を持っていないことを意味します。解釈可能な機能(たとえば、word2vecの場合のワードコンテキスト)は非表示でdistributed
、解釈不可能なベクトルコンポーネントの中にあります。各コンポーネントは複数の解釈可能な機能を担当し、各解釈可能な機能は複数のコンポーネントにバインドされています。
したがって、word2vec(およびdoc2vec)は、語彙のセマンティクスを表現する方法として、技術的に分散表現を使用します。同時に、それは概念的に分布仮説に基づいています。分布仮説が真であるためにのみ機能します(単語の意味は典型的なコンテキストと相関しています)。
しかし、もちろん多くの場合、これらの用語は同じ意味distributed
でdistributional
使用され、誤解が増えています:)