多くの本や論文で一般的に使用されている表記と意味の違いは何ですか?P (z | d 、w )
多くの本や論文で一般的に使用されている表記と意味の違いは何ですか?P (z | d 、w )
回答:
これの起源は尤度パラダイムであると信じています(以下の実際の歴史的正確さは確認していませんが、iotがどのようになったかを理解する合理的な方法です)。
回帰設定で、p(Y | x、beta)という分布があるとします。つまり、xとbetaの値がわかっている(条件付きで)場合のYの分布です。
ベータを推定する場合は、尤度を最大化します。L(beta; y、x)= p(Y | x、beta)基本的に、式p(Y | x、beta)は次のようになります。ベータ版の機能ですが、それ以外は違いはありません(適切に導出できる数学的に正しい表現の場合、これは必要です-実際には誰も気にしませんが)。
その後、ベイジアン設定では、パラメータと他の変数の違いがすぐに消えていくため、両方の表記法を混在させて使用し始めました。
つまり、本質的には、実際の違いはありません。両方とも、左側の事物の条件付き分布を示し、右側の事物を条件としています。
X X θ F (X 、θ )X Θ (X 、θ )Θ F (ランダム変数の密度である点におけると、分布のパラメータです。は、ポイントでのと結合密度であり、がランダム変数の場合にのみ意味を持ちます。は与えられたの条件付き分布であり、これもが確率変数である場合にのみ意味があります。この本をさらに読み、ベイジアン分析を見ると、これはより明確になります。X Θ Θ
はと同じです。つまり、は固定パラメーターであり、関数は関数です。、OTOHは、関数のファミリー(またはセット)の要素であり、要素はインデックス付けされます。おそらく微妙な違いですが、重要なもの、特に。既知のデータ xに基づいて未知のパラメータを推定するときが来たとき。そのとき、 θは変化し、 x固定され、「尤度関数」が得られます。統計学者の間では使用がより一般的数学者の間で。
常にこのようになっているわけではありませんが、最近ではは、d 、wがランダム変数ではない場合に使用されます(必ずしも既知であるとは限りません)。P (z | d 、w )は、d 、wの値の条件付けを示します。条件付けはランダム変数に対する操作であるため、d 、wがランダム変数ではないときにこの表記法を使用するのは混乱を招きます(そして悲劇的に一般的です)。
@Nick Sabbeが指摘するように、は、観測データyのサンプリング分布の一般的な表記法です。一部の頻繁に使用される表記法では、この表記を使用しますが、Θはランダム変数ではなく、IMOの乱用であると主張します。しかし、彼らはそこに独占権を持っていません。ベイジアンもそれを行い、条件式の最後に固定ハイパーパラメーターを追加しました。