情報理論CLTの最も単純な形式は次のとおりです。
ましょう平均でIIDさ、分散。ましょう正規化された和の密度であると標準ガウス密度です。次に、情報理論CLTは、がいくつかのnに対して有限である場合、D(f_n \ | \ phi)\ to 0はn \ to \ infty。0 1 f n ∑ n i = 1 X iN D (F N ‖ φ )→ 0 、N → ∞
確かに、この収束は、ある意味では、文献で確立されている収束、分布の収束、メトリックでの収束よりも「強力」です。これは、Pinskerの不等式。つまり、KLダイバージェンスでの収束は、分布での収束と距離での収束を意味します。
二つ知りたいのですが。
結果D(f_n \ | \ phi)\ to 0の何が素晴らしいのですか?
3番目の段落で述べた理由のために、KLダイバージェンスの収束(つまり、)の方が強いと言っているのですか?
注意:私はこの質問をmath.stackexchangeでいつか行ったところ、何も返事がありませんでした。