答えは、対称ディリクレ分布と非対称ディリクレ分布のどちらを仮定しているか(より厳密には、ベースメジャーが均一かどうか)によって異なります。他に何かが指定されていない限り、LDAのほとんどの実装は、分布が対称であると想定しています。
対称分布の場合、アルファ値が高いということは、各ドキュメントにほとんどのトピックが混在している可能性が高く、特定のトピックだけが含まれている可能性が低いことを意味します。アルファ値が低いと、ドキュメントにかかる制約が少なくなり、ドキュメントにはトピックのほんの数個、または1つだけのトピックが混在する可能性が高くなります。同様に、ベータ値が高いということは、各トピックに具体的な単語ではなく、ほとんどの単語が混在している可能性が高いことを意味し、低い値はトピックに少数の単語が混在している可能性があることを意味します。
一方、分布が非対称である場合、アルファ値が高いということは、特定のトピック分布(ベースメジャーに応じて)がドキュメントごとに発生する可能性が高いことを意味します。同様に、高いベータ値は、各トピックに基本メジャーで定義された特定の単語の組み合わせが含まれている可能性が高いことを意味します。
実際には、アルファ値が高いと、含まれるトピックに関してドキュメントがより類似したものになります。同様に、ベータ値が高いと、トピックに含まれる単語がより類似したトピックになります。
そのため、はい、アルファパラメーターは、ドキュメント内のトピックのスパース性/均一性に関する事前の信念を指定します。「私はあなたが「言葉の観点からのトピックの相互排他性」によって何を意味するのか完全にはわかりません。
より一般的には、これらはLDAモデルで使用されるディリクレ分布の濃度パラメーターです。これがどのように機能するかを直感的に理解するために、このプレゼンテーションにはいくつかの素晴らしいイラストと、LDAの一般的な説明が含まれています。
私はあなたの元の質問にコメントできないので、ここに追加のコメントを付けます:私が見たものから、アルファパラメータとベータパラメータはいくつかの異なるパラメータ化をやや混乱させて参照することができます。基礎となるディリクレ分布は通常、ベクトルで化されますが、これは基本メジャーと濃度に分解できますパラメーター、その結果。alphaパラメーターがスカラーの場合、通常は濃度パラメーター意味しますが、の値も意味する場合があります(α1、α2、。。。、αK)u = (u1、あなた2、。。。、あなたK)αα ∗ u = (α1、α2、。。。、αK)α(α 1、α 2、。。。、α K)(α1、α2、。。。、αK)、これらは対称ディリクレ分布の下で等しいため。ベクトルの場合、通常はます。どのパラメーター化が最も一般的かはわかりませんが、私の返信では、濃度パラメーターとしてアルファ値とベータ値を意味すると思います。(α1、α2、。。。、αK)