確率分布のためのハフマン符号最小加重平均符号語長を有する接頭コードである、ここでの長さであり番目codword。ハフマン符号のシンボルあたりの平均長は、と間であることがよく知られている定理です。ここで、は、確率分布のシャノンエントロピーです。
平均長がシャノンエントロピーをほぼ1超える標準的な悪い例は、ような確率分布で、エントロピーはほぼ0で、平均コードワード長は1です。これによりギャップが生じます。エントロピーとほぼコードワード長の間。
しかし、確率分布の最大確率に限界があるとどうなりますか?たとえば、すべての確率が1未満であるとします。この場合に見つけることができる最大のギャップは、エントロピーが1よりわずかに大きく、平均コードワード長が1.5よりわずかに小さいなどの確率分布の場合です。0.5。これはあなたができる最善ですか?この場合、厳密に1未満のギャップの上限を指定できますか?
ここで、すべての確率が非常に小さい場合を考えてみましょう。それぞれが確率1 / Mを持つ文字にわたる確率分布を選択するとします。あなたが選択した場合この場合、最大のギャップが発生したM ≈ 2 K LN 2を。ここでは、約1 + ln ln 2 − ln 2のギャップがあります。
この質問は、このTCS Stackexchange質問に触発されました。