ヘッフディングの不等式で使用される補題の証明を理解する


11

ラリー・ワッサーマンのカセリャとバーガーを主要なテキストとして使用する統計学に関する講義ノートを研究しています。私は彼の講義ノートセット2に取り組んでいますが、ヘッフディングの不等式で使用される補題の導出に行き詰まりました(pp.2-3)。以下の注記で証明を再現しています。証明の後で、どこに行き詰まっているのかを指摘します。


補題

仮定するE(X)=0とすることをX B。次いで、 EE T XE T 2B - A 2 / 8aXbE(etX)et2(ba)2/8

証明

以来X B、我々は書くことができるXを凸状の組合せとして及びB、すなわち X = α B + 1 - α Aここで、α = X - AaXbXabX=αb+(1α)aα=Xaba。関数の凸性により、yety我々が持っています

etXαetb+(1α)eta=Xabaetb+bXbaeta

両方の期待を取り、事実E(X)=0を使用して

E(etX)abaetb+bbaeta=eg(u)

ここで、u=t(ba) g(u)=γu+log(1γ+γeu)およびγ=a/(ba) g 0 = gであることに注意してくださいです。またgg(0)=g(0)=0のすべてのためのu>0g(u)1/4u>0

テイラーの定理により、ある、その結果 、G U = G 0 + U Gε(0,u)g(u)=g(0)+ug(0)+u22g(ε)=u22g(ε)u28=t2(ba)28

従ってE(etX)eg(u)et2(ba)28


私は証明を

uguγの導出方法がわかりません。E(etX)abaetb+bbaeta=eg(u)u,g(u),γ


3
var(X)E [ E T X ] E σ 2 maxの T 2 / 2σmax2=(ba)2/4
E[etX]eσmax2t2/2

@DilipSarwate私の理解では、最大分散は一様確率変数ます。の分散はです。を入手した方法を説明していただけますか?X V RX = B - 2XU(a,b)Xba2Var(X)=(ba)212(ba)24
Anand

エンドポイントに質量を集中することにより...
Elvis

@DilipSarwate証明にいくつかのコメントを追加しました。これにより、最悪のケースが最大分散である理由が少しわかりやすくなります。
Elvis

1
@DilipSarwate-補題1と演習1をここで参照してください:terrytao.wordpress.com/2010/01/03/…。ジェンセンの不平等とテイラーの拡大に依存するより簡単な派生があるようです。しかし、これの詳細は私には不明です。おそらく誰かがそれを理解できるでしょう。((9)から(10)および演習1の導出)
レオ

回答:


17

私はあなたの質問を正しく理解したかわかりません。私は答えようとします:を関数として書いてみてください:this範囲が欲しいので自然です。

abaetb+bbaeta
u=t(ba)eu28

経験に助けられて、形式で書くことを選択した方がよいことがわかります。次に、 は とます。eg(u)

eg(u)=abaetb+bbaeta
g(u)=log(abaetb+bbaeta)=log(eta(abaet(ba)+bba))=ta+log(γeu+(1γ))=γu+log(γeu+(1γ)),
γ=aba

それはあなたが求めていたものですか?

編集:証明に関するコメント

  1. 最初のトリックは注意深く検討する価値があります。が凸関​​数で、が中央揃えのランダム変数である場合、 ここでは定義される離散変数です 結果として、は分散が最も高いをサポートする中央変数: サポート幅を固定する場合ϕaXb
    E(ϕ(X))abaϕ(b)+bbaϕ(a)=E(ϕ(X0)),
    X0
    P(X0=a)=bbaP(X0=b)=aba.
    X0[a,b]
    Var(X)=E(X2)E(X02)=ba2ab2ba=ab.
    (ba)、これは、Dilipがコメントで述べているように未満です。境界は得られ。(ba)24(ba)2+4ab0a=b
  2. 次に、問題に移ります。なぜだけに依存して境界を取得できるのですか?直感的には、これはの再スケーリングの問題にすぎませんの場合のがある場合、一般的な範囲を取ることで取得できます。ここで、幅1をサポートする中央揃えの変数のセットを考えてみましょう。自由度はそれほど多くないため、ような境界が存在する必要があります。 他のアプローチは、上記の補題によって、より一般的には、これはとu=t(ba)XE(etX)s(t)ba=1s(t(ba))s(t)

    E(ϕ(X))E(ϕ(tX))E(ϕ(tX0))uγ:およびし、変化させる場合、自由度は1つだけです。そして、、、です。我々は、取得 あなただけの含む境界を見つける必要があります。u=u0=t0(b0a0)γ=γ0=a0b0a0t,a,bt=t0αa=αa0b=αa0

    abaϕ(tb)+bbaϕ(ta)=a0b0a0ϕ(tb0)+b0b0a0ϕ(a0).
    u
  3. 今ではそれが可能であると確信しています。そもそもだとは必ずしも思っていません。重要なのは、すべてをと関数として記述しなければならないということです。 最初に、、、およびことに注意してください。次に、 これで、特定のケースで ... Iあなたが終えることができると思います。guγ

    γ=aba1γ=bbaat=γubt=(1γ)u

    E(ϕ(tX))abaϕ(tb)+bbaϕ(ta)=γϕ((1γ)u)+(1γ)ϕ(γu)


    ϕ=exp

少し明確にしてほしい。


それがまさに私が探していたものです。どうもありがとう。
アナンド

1
@アナンド私はアドバイスに従うのは難しいことを知っていますが、技術的な詳細に焦点を当てることから始めるのではなくそのような限界が存在する理由を理解しようとするべきだと思います...そうすれば、証拠がより簡単に見えるはずです。私はあなたに今朝追加された理由をあなたに見せようとしました(あなたはこのような質問で寝る必要があります-少なくとも私は必要です)。ほとんどの教科書にこのような直感が現れないのは恐ろしいことだと思います。技術的な部分を手に入れても、アイデアがなければすべてが魔法のように見えます。これについて詳細に考える機会を与えてくれてありがとう、CrossV!
Elvis

1
うわー!編集のために+1。ありがとう。しかし、ようなものを取得することができれば、すばらしいと思いませんか。
E[etX]eE[t2X2/2]=e(t2/2)E[X2]=e(t2/2)var(X)et2σmax2/2?
Dilip Sarwate、2012年

@Elvisアドバイスと直感的な部分を書き留めてくれてありがとう。これを理解するには少し時間を費やす必要があります!
アナンド2012年

1
@Elvis直感について理解を深めたいです。よりシャープな境界を取得するには、より高いモーメントが必要です。マルコフは一次モーメントを使用し、チェビシェフは二次モーメントを使用し、ヘッフディングはmgfを使用します。これは正しいです?誰かがこの部分を拡大して明確にすることができればそれは素晴らしいでしょう。
Anand
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.