情報理論の中心極限定理


11

情報理論CLTの最も単純な形式は次のとおりです。

ましょう平均でIIDさ、分散。ましょう正規化された和の密度であると標準ガウス密度です。次に、情報理論CLTは、がいくつかのnに対して有限である場合D(f_n \ | \ phi)\ to 0n \ to \ infty0 1 f n n i = 1 X iX1,X2,01fni=1nXinϕN D F Nφ 0 、N D(fnϕ)=fnlog(fn/ϕ)dxnD(fnϕ)0n

確かに、この収束は、ある意味では、文献で確立されている収束、分布の収束、L1メトリックでの収束よりも「強力」です。これは、Pinskerの不等式(|fnϕ|)22fnlog(fn/ϕ)。つまり、KLダイバージェンスでの収束は、分布での収束とL1距離での収束を意味します。

二つ知りたいのですが。

  1. 結果D(f_n \ | \ phi)\ to 0の何が素晴らしいのD(fnϕ)0ですか?

  2. 3番目の段落で述べた理由のために、KLダイバージェンスの収束(つまりD(fnϕ)0)の方が強いと言っているのですか?

注意:私はこの質問をmath.stackexchangeでいつか行ったところ、何も返事がありませんでした。


重複するmath.SE質問へのリンクを提供してください。
枢機卿

6
あなたの声明は暗黙的に密度の存在を想定しているようです(ルベーグ測度に関して)。あなたはこの短くて楽しい論文に興味があるかもしれません:AR Barron(1986)、エントロピーと中央極限定理 アン。プロバブ。、第14巻、いいえ。1、336-342。(オープンアクセス)。
枢機卿

2
私はすでにその論文を見ました。彼は、1ページの第2段落で情報理論的観点に動機を与えました。そのとき、私にはそれほど明確ではありませんでした。今では大丈夫に見えます。それでも、次のことを明確に説明し、回答として投稿できればすばらしいと思います。「情報理論から、相対エントロピーは、からのサンプルの量子化を記述するときの正規分布に基づくシャノンコードの冗長性(過剰平均記述長)の最小上限です。」math.SEではその質問を削除しました。誰も引き付けなかったためですf nDnfn
Ashok

@cardinal:素敵な論文のTKS。

回答:


5

この定理の優れている点の1つは、通常の中心極限定理が適用されない一部の設定で極限定理を提案することです。たとえば、円の分布など、最大エントロピー分布が非正規分布である状況では、一様分布への収束を示唆しています。


わかりません。すでに述べたように、KL発散の収束は分布の収束を意味しますね。したがって、情報理論CLTが適用される場合は常に、通常のCLTも適用されます。さらに、情報理論CLTも有限分散を仮定します。それとも何か不足していますか?
Ashok、

2
つまり、エントロピー法は、限界が正規分布ではない状況での限界を示唆しているということです。限界は、エントロピーを最大化する分布です。
kjetil b halvorsen 2014年

3

見回した後、相対エントロピーに収束せずに分布の収束の例を見つけることができなかったため、これはその結果の「偉大さ」を測定するのが困難です。

私には、この結果は、たたみ込み積の相対的なエントロピーを単純に説明しているように見えます。これは、中心極限定理の代替解釈および証明フレームワークと見なされることが多く、情報理論ではそうであるが、確率理論に直接関係があるとは思えない。

以下からの情報理論と中心極限定理(19ページ)。

熱力学の第2法則は、熱力学エントロピーは常に時間とともに増加することを示しており、ギブス状態への何らかの収束を示唆しています。エネルギーの節約は、この時間発展の間が一定のままであることを意味するので、最初からどのギブス状態が限界になるかを知ることができます。 畳み込みを行うと情報理論的エントロピーが最大に増加し、ガウス分布に収束することを示すことで、同じように中心極限定理を考察します。適切に正規化することは、たたみ込みの間、分散が一定のままであることを意味し、最初からどのガウスが限界になるかを知ることができます。E


2
相対エントロピーに収束せずに分布に収束する例はたくさんあります離散分布があり、CLTが適用されるときはいつでも。Xi
Mark Meckes、2012

1

、N D(fnϕ)0は、KLダイバージェンスの定義のために、確率変数の合計の分布ととしてのガウス密度の間に「距離」がないことを保証します。自体。おそらく私はあなたの質問を誤解しました。n

あなたが任命した2番目の点については、それはあなたの段落で回答されています。


1
正規(リンドバーグ)CLTは、標本平均が分布で正規RVに収束すると述べています。つまり、CDFはポイントごとに収束します。これとOPの結果の間には、ここでの回答には反映されていない微妙な測定理論上の違いがあります。Φ
AdamO 2017
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.