場合非ゼロ値を有する確率分布が上にある、どのような種類の(S)のためのの定数が存在するよう すべてについて?
上記の不等式は、実際には分布とその圧縮バージョン間のカルバック・ライブラー発散です。この不等式は指数分布、ガンマ分布、ワイブル分布に当てはまることがわかり、それがより大きなクラスの確率分布に有効かどうかを知りたいと思っています。
その不平等が何を意味するのか考えていますか?
場合非ゼロ値を有する確率分布が上にある、どのような種類の(S)のためのの定数が存在するよう すべてについて?
上記の不等式は、実際には分布とその圧縮バージョン間のカルバック・ライブラー発散です。この不等式は指数分布、ガンマ分布、ワイブル分布に当てはまることがわかり、それがより大きなクラスの確率分布に有効かどうかを知りたいと思っています。
その不平等が何を意味するのか考えていますか?
回答:
書く
対数ととp (x (1 + ϵ ))の関係は、両方のpとその引数のを指数としてしています。そのために、定義する
すべての実のため右辺が定義さに等しくされている- ∞どこP (Eのyは)= 0。変数x = e yの変化はd x = e y d yを必要とし、(pを分布の密度とする)全確率の法則は次のように表せることに注意してください。
y → ± ∞のとき、と仮定しましょう。 これは、0または∞に近い密度の無限に多くのスパイクを持つ確率分布を除外します。特に、pのテールが最終的に単調である場合、(1 )はこの仮定を暗示し、深刻なものではないことを示します。
対数の操作を簡単にするために、
以下の計算は、の倍数まで行われることになるので、、定義します
我々としても交換するかもしれないすることにより、電子δと、δ = 0が対応するε = 0と正のδポジティブに対応しますε。
不等式が失敗することが可能な1つの明白な方法は、一体型のためになるいくつかのために発散しε ∈ (0 、1 ]。例えば、あることをがあった場合などはどうなる任意の適切な間隔[ U 、V ]正の数の、ここでどのように小さな、どんなにP同様にゼロであったが、pが間隔にゼロではありませんでした[ U - ε 、V - ε ]。これにより、被積分関数は正の確率で無限になります。
質問はの性質に関して不明確であるため、pがどれだけ滑らかであるかに関する技術的な問題に行き詰まる可能性があります。どこでもqに使用したい派生物がたくさんあると仮定することで、まだある程度の洞察を得ることを望んで、そのような問題を避けましょう。(q ' 'が連続している場合は2つで十分です。)qが有界集合で有界のままであることが保証されるため、x > 0の場合、p (x )がゼロになることはありません。
質問は本当にの行動に関することを注意として、εは上からゼロに近づきます。この積分は、の連続関数であるので、ε間隔で(0 、1 ]、それはいくつかの最大となるMのP()場合εは任意の正の間隔に制限されている[ 、1 ]を選択するために私達を可能にする、C = M Pを(a )/ a 2、明らかに
不平等を機能させます。これが、法とする計算にのみ関係する必要がある理由です。
からyへ、pからqへ、そしてϵからδへの変数の変化を使用して、単純化を実現するために、ϵ(またはδ)の2次からI p(ϵ )を計算しましょう。そのために定義する
yの周りのqのテイラー展開の次数剰余になります。
左の積分で変数をに変更すると、(1 )に続く仮定で述べたように、変数が消えなければならないことがわかります。右積分で変数をx = e yに戻すと、
不平等は、係数の場合に限り、(私たちの様々な技術的な仮定の下で)保持している右側には有限です。
。
質問で言及されたいくつかのケースをチェックしてみましょう:指数分布とガンマ分布。(指数はガンマの特殊なケースです。)スケールパラメーターは測定単位を変更するだけなので、スケールパラメーターについて心配する必要はありません。スケール以外のパラメーターのみが重要です。
Similar calculations imply the inequality for Weibull distributions, Half-Normal distributions, Lognormal distributions, etc. In fact, to obtain counterexamples we would need to violate at least one assumption, forcing us to look at distributions where vanishes on some interval, or is not continuously twice differentiable, or has infinitely many modes. These are easy tests to apply to any family of distributions commonly used in statistical modeling.