回答:
LSAとLSIはほとんど同義語として使用され、情報検索コミュニティは通常それをLSIと呼んでいます。LSA / LSIはSVDを使用して、用語ドキュメント行列Aを用語概念マトリックスU、特異値行列S、および概念ドキュメント行列Vに分解します。形式は、A = USV 'です。ウィキペディアのページには、潜在的なセマンティックインデックスの詳細な説明があります。
特に、LSAとLSIはSVDを使用して魔法を実行しますが、前後のコンテキストを追跡するテキストを選別するHAL(Hyperspace Analogue to Language)と呼ばれる計算上および概念的に単純な方法があります。これらの(しばしば重み付けされた)共起行列からベクトルが抽出され、特定の単語が選択されて意味空間にインデックスが付けられます。数学的にも概念的にも複雑なSVDのステップを必要とせずに、LSAと同様に機能することを理解するために多くの方法で与えられます。詳細については、1996年のLund&Burgessを参照してください。