機械学習コミュニティは「条件付け」および「パラメーター化」を乱用していますか?


13

たとえば、は依存しています。厳密に言えば、Xα

  • 場合と両方とも確率変数である、我々は書くことができ ;Xαp(Xα)

  • ただし、がランダム変数であり、がパラメーターである場合、を記述する必要があります。Xαp(X;α)

機械学習コミュニティは違いを無視して用語を悪用しているように見えることに何度か気付きます。

たとえば、有名なLDAモデルでは、はランダム変数ではなくディリクレパラメーターです。α

ここに画像の説明を入力してください

いけませんか?LDA論文の原著者を含む多くの人々がと書いているのを見ます。p(θ;α)p(θα)


6
数学的に言えば、これはランダム変数の制限的なケースであるため、定数をいつでも条件付けることができます。ベイジアンの観点からは、すべての未知数は確率変数として扱われるため、条件付け表記法を全面的に使用することは理にかなっています。
西安

1
@ Xi'an「定数の条件付け」に関するあなたの主張は理解しています。しかし、私がを描くと想像してくださいXパラメータのカテゴリ分布から、すなわち、X C T θ 。私はような分布を書くことができ、P X | θ ?常に固定のθを設定できるため、これは奇妙に見えます。p X ; θ は私にとってより快適に見えます。θXCat(θ)p(Xθ)θp(X;θ)
シブスギャンブル

4
私は書面で問題が表示されていないこの特殊なケースで。繰り返しますが、条件付き表記法を使用すると、すべての未知のパラメーターに事前分布を導入する方法ができます。p(Xθ)
西安

回答:


14

これは、機械学習対統計よりも、ベイジアン/非ベイジアン統計に関するものだと思います。

ベイズ統計では、パラメータもランダム変数としてモデル化されます。p Xの共同分布がある場合X,α条件付き分布、何の物理的解釈がない問題であり、Xおよび α。1のみの固定とみなした場合は αのか、そうでない場合を確率分布入れていない αを、との計算 P X ; αはとまったく同じです P X | α P αp(Xα)Xαααp(X;α)p(Xα)。また、任意の時点に1つの缶は、固定値を持つモデルに延びるように決定 αを超える前に分布があるものに αが。少なくとも私には、この時点で分布 -αの表記法が変わるのは奇妙に思えます。そのため、ベイジアンの中には、すべてのパラメータをランダム変数として定義することに煩わされていなくても、条件付け表記法を使用することを好む人がいます。p(α)ααα

p(X;α)pバツαp

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.