GLMの正規化変換の導出


15

どのようにA = D UV 1 / 3μ A()=duV1/3(μ)正規化指数家族のための変換派生した?

より具体的には、3ページのスライド1のテイラー展開スケッチを追おうとしましたが、いくつか質問があります。バツX指数ファミリー、形質転換からh X h(X)、およびκ Iκi示す私はトンの時間ithキュムラント、スライドは、と主張している: κ 3H ˉ XH 'μ 3 κ 3ˉ XN 2 +3H'μ2H"μσ4N +ON3

κ3(h(X¯))h(μ)3κ3(X¯)N2+3h(μ)2h′′(μ)σ4N+O(N3),
および上記の評価が0になるようなh(X)を見つけるだけh X h(X)です。
  1. 私の最初の質問は算数についてです。私のテイラー展開には異なる係数があり、それらが多くの項を落としたことを正当化することはできません。

    h x 以来 H μ + H 'μ X - μ + H X 2X-μ2、我々は:H ˉ X-HUH 'U ˉ X - μ + H X 2 ˉ X -μ2EH ˉ X-HU3H 'μ 3 Eˉ X - μ 3 + 32時間'μ2H" μ)E(ˉXμ)4+34h(μ)h(μ)2E(ˉXμ)5+18h(μ)3E(ˉXμ)6.

    Since h(x)h(X¯)h(u)E(h(X¯)h(u))3h(μ)+h(μ)(xμ)+h′′(x)2(xμ)2, we have:h(u))(X¯μ)+h′′(x)2(X¯μ)2h(μ)3E(X¯μ)3+32h(μ)2h′′(μ)E(X¯μ)4+34h(μ)h′′(μ)2E(X¯μ)5+18h′′(μ)3E(X¯μ)6.

    中心の瞬間をキュムラント相当物に置き換えることで似たようなことができますが、それでも足りません。

  2. 2番目の質問:分析が、実際に重要な量であるXではなく\ bar {X}で始まるのはなぜですか?ˉXX¯XX


あなたが持っているように見えるuuあなたが意味する数回μμ
Glen_b -Reinstateモニカ

回答:


2

リンクするスライドはやや混乱を招き、手順を省略していくつかのタイプミスを犯しますが、最終的には正しいものです。最初に質問2、次に1に答え、最後に対称変換。A(u)=u1[V(θ)]1/3dθA(u)=u1[V(θ)]1/3dθ

質問2.をランダム変数のサイズのサンプルの平均として分析してい。科学では常に同じ分布をサンプリングして平均を取るため、これは重要な量です。が真の平均どれだけ近いかを知りたいです。中央極限定理は、にとして収束すると言いますが、分散と歪度を知りたいと思い。ˉXX¯NNX1,...,XNX1,...,XNˉXX¯μμμμNNˉXX¯

質問1.テイラー級数の近似は間違っていませんが、スライドと同じ結論を得るには、対およびべき乗を追跡することに注意する必要があります。の定義と中心モーメントから、の公式を導き出し。ˉXX¯XiXiNNˉXX¯XiXiκ3(h(ˉX))κ3(h(X¯))

ˉX=1NNi=1XiX¯=1NNi=1Xi

E[Xi]=μE[Xi]=μ

V(Xi)=E[(Xiμ)2]=σ2V(Xi)=E[(Xiμ)2]=σ2

κ3(Xi)=E[(Xiμ)3]κ3(Xi)=E[(Xiμ)3]

さて、の中心的な瞬間:ˉXX¯

E[ˉX]=1NNi=1E[Xi]=1N(Nμ)=μE[X¯]=1NNi=1E[Xi]=1N(Nμ)=μ

V(ˉX)=E[(ˉXμ)2]=E[((1NNi=1Xi)μ)2]=E[(1NNi=1(Xiμ))2]=1N2(NE[(Xiμ)2]+N(N1)E[Xiμ]E[Xjμ])=1Nσ2V(X¯)=E[(X¯μ)2]=E[((1Ni=1NXi)μ)2]=E[(1Ni=1N(Xiμ))2]=1N2(NE[(Xiμ)2]+N(N1)E[Xiμ]E[Xjμ])=1Nσ2

および以来、最後のステップが続きます。これはの最も簡単な派生ではなかったかもしれませんが、およびを見つけるために必要なプロセスと同じです、合計の積を分割し、異なる変数のべき乗を持つ項の数をカウントします。上記の場合、存在した形状のものであった用語及びの形の点。E[Xiμ]=0E[Xiμ]=0E[(Xiμ)2]=σ2E[(Xiμ)2]=σ2V(ˉX)V(X¯)κ3(ˉX)κ3(X¯)κ3(h(ˉX))κ3(h(X¯))NN(Xiμ)2(Xiμ)2N(N1)N(N1)(Xiμ)(Xjμ)(Xiμ)(Xjμ)

κ3(ˉX)=E[(ˉXμ)3)]=E[((1NNi=1Xi)μ)3]=E[(1NNi=1(Xiμ))3]=1N3(NE[(Xiμ)3]+3N(N1)E[(Xiμ)E[(Xjμ)2]+N(N1)(N2)E[(Xiμ)]E[(Xjμ)]E[(Xkμ)]=1N2E[(Xiμ)3]=κ3(Xi)N2κ3(X¯)=E[(X¯μ)3)]=E[((1Ni=1NXi)μ)3]=E[(1Ni=1N(Xiμ))3]=1N3(NE[(Xiμ)3]+3N(N1)E[(Xiμ)E[(Xjμ)2]+N(N1)(N2)E[(Xiμ)]E[(Xjμ)]E[(Xkμ)]=1N2E[(Xiμ)3]=κ3(Xi)N2

次に、次のようにをテイラー級数で展開します。h(ˉX)h(X¯)

h(ˉX)=h(μ)+h(μ)(ˉXμ)+12h(μ)(ˉXμ)2+13h(μ)(ˉXμ)3+...h(X¯)=h(μ)+h(μ)(X¯μ)+12h′′(μ)(X¯μ)2+13h′′′(μ)(X¯μ)3+...

E[h(ˉX)]=h(μ)+h(μ)E[ˉXμ]+12h(μ)E[(ˉXμ)2]+13h(μ)E[(ˉXμ)3]+...=h(μ)+12h(μ)σ2N+13h(μ)κ3(Xi)N2+...E[h(X¯)]=h(μ)+h(μ)E[X¯μ]+12h′′(μ)E[(X¯μ)2]+13h′′′(μ)E[(X¯μ)3]+...=h(μ)+12h′′(μ)σ2N+13h′′′(μ)κ3(Xi)N2+...

さらに努力すれば、残りの用語がことを証明できます。最後に、、(これはと同じではありません)、再び同様の計算を行います:O(N3)O(N3)κ3(h(ˉX))=E[(h(ˉX)E[h(ˉX)])3]κ3(h(X¯))=E[(h(X¯)E[h(X¯)])3]E[(h(ˉX)h(μ))3]E[(h(X¯)h(μ))3]

κ3(h(ˉX))=E[(h(ˉX)E[h(ˉX)])3]=E[(h(μ)+h(μ)(ˉXμ)+12h(μ)(ˉXμ)2+O((ˉXμ)3)h(μ)12h(μ)σ2NO(N2))3]κ3(h(X¯))=E[(h(X¯)E[h(X¯)])3]=E[(h(μ)+h(μ)(X¯μ)+12h′′(μ)(X¯μ)2+O((X¯μ)3)h(μ)12h′′(μ)σ2NO(N2))3]

順序になる用語にのみ興味があり、余分な作業を行うと、用語「が不要であることを示すことができます。"または" "は、3番目の累乗をとる前に、順序に関してのみ結果となるためです。したがって、単純化すると、O(N2)O(N2)O((ˉXμ)3)O((X¯μ)3)O(N2)O(N2)O(N3)O(N3)

κ3(h(ˉX))=E[(h(μ)(ˉXμ)+12h(μ)(ˉXμ)212h(μ)σ2N))3]=E[h(μ)3(ˉXμ)3+18h(μ)3(ˉXμ)618h(μ)3σ6N3+32h(μ)2h(μ)(ˉXμ)4+34h(μ)h(μ)(ˉXμ)532h(μ)2h(μ)(ˉXμ)2σ2N+O(N3)]κ3(h(X¯))=E[(h(μ)(X¯μ)+12h′′(μ)(X¯μ)212h′′(μ)σ2N))3]=E[h(μ)3(X¯μ)3+18h′′(μ)3(X¯μ)618h′′(μ)3σ6N3+32h(μ)2h′′(μ)(X¯μ)4+34h(μ)h′′(μ)(X¯μ)532h(μ)2h′′(μ)(X¯μ)2σ2N+O(N3)]

この製品では明らかにだった用語をいくつか省略しました。用語およびはも同様です。しかしながら、O(N3)O(N3)E[(ˉXμ)5]E[(X¯μ)5]E[(ˉXμ)6]E[(X¯μ)6]O(N3)O(N3)

E[(ˉXμ)4]=E[1N4(Ni=1(ˉXμ))4]=1N4(NE[(Xiμ)4]+3N(N1)E[(Xiμ)2]E[(Xjμ)2]+0)=3N2σ4+O(N3)E[(X¯μ)4]=E[1N4(i=1N(X¯μ))4]=1N4(NE[(Xiμ)4]+3N(N1)E[(Xiμ)2]E[(Xjμ)2]+0)=3N2σ4+O(N3)

次に、方程式に期待値を分配します。κ3(h(ˉX))κ3(h(X¯))

κ3(h(ˉX))=h(μ)3E[(ˉXμ)3]+32h(μ)2h(μ)E[(ˉXμ)4]32h(μ)2h(μ)E[(ˉXμ)2]σ2N+O(N3)=h(μ)3κ3(Xi)N2+92h(μ)2h(μ)σ4N232h(μ)2h(μ)σ4N2+O(N3)=h(μ)3κ3(Xi)N2+3h(μ)2h(μ)σ4N2+O(N3)κ3(h(X¯))=h(μ)3E[(X¯μ)3]+32h(μ)2h′′(μ)E[(X¯μ)4]32h(μ)2h′′(μ)E[(X¯μ)2]σ2N+O(N3)=h(μ)3κ3(Xi)N2+92h(μ)2h′′(μ)σ4N232h(μ)2h′′(μ)σ4N2+O(N3)=h(μ)3κ3(Xi)N2+3h(μ)2h′′(μ)σ4N2+O(N3)

これでの導出が終わりました。最後に、対称変換を導出します。κ3(h(ˉX))κ3(h(X¯))A(u)=u1[V(θ)]1/3dθA(u)=u1[V(θ)]1/3dθ

この変換では、がの形式の指数関数族分布、特に自然指数関数族(またはこの分布に変換されている)からのものであることが重要XiXifXi(x;θ)=h(x)exp(θxb(θ))fXi(x;θ)=h(x)exp(θxb(θ))

この場合、分布のキュムラントは与えられます。したがって、、、およびです。パラメータは、と書くだけで、の逆数をとるだけの関数として書くことができます。それからκk=b(k)(θ)κk=b(k)(θ)μ=b(θ)μ=b(θ)σ2=V(θ)=b(θ)σ2=V(θ)=b′′(θ)κ3=b(θ)κ3=b′′′(θ)θθμμbbθ(μ)=(b)1(μ)θ(μ)=(b)1(μ)

θ(μ)=1b((b)1(μ))=1b(θ))=1σ2θ(μ)=1b′′((b)1(μ))=1b′′(θ))=1σ2

次に、分散を関数として記述し、この関数を呼び出し。μμˉVV¯

ˉV(μ)=V(θ(μ))=b(θ(μ))V¯(μ)=V(θ(μ))=b′′(θ(μ))

それから

ddμˉV(μ)=V(θ(μ))θ(μ)=b(θ)1σ2=κ3σ2ddμV¯(μ)=V(θ(μ))θ(μ)=b′′′(θ)1σ2=κ3σ2

だからの関数として、。μμκ3(μ)=ˉV(μ)ˉV(μ)κ3(μ)=V¯(μ)V¯(μ)

今、対称の形質転換のために、我々はの歪度低減することによりなので、はです。したがって、私たちは欲しいh(ˉX)h(X¯)h(μ)3κ3(Xi)N2+3h(μ)2h(μ)σ4N2=0h(μ)3κ3(Xi)N2+3h(μ)2h′′(μ)σ4N2=0h(ˉX)h(X¯)O(N3)O(N3)

h(μ)3κ3(Xi)+3h(μ)2h(μ)σ4=0

および式を関数としてと、次のようになります。σ2κ3μ

h(μ)3ˉV(μ)ˉV(μ)+3h(μ)2h(μ)ˉV(μ)2=0

したがって、、。h(μ)3ˉV(μ)+3h(μ)2h(μ)ˉV(μ)=0ddμ(h(μ)3ˉV(μ))=0

この微分方程式の1つの解決策は次のとおりです。

h(μ)3ˉV(μ)=1

h(μ)=1[ˉV(μ)]1/3

したがって、任意の定数に対して、です。これにより、対称変換。ここで、は次の分散です。自然な指数関数族の平均の関数。h(μ)=μc1[ˉV(θ)]1/3dθcA(u)=u1[V(θ)]1/3dθV


1

1.非中心モーメントで近似して同じ結果を得てから、中心モーメント近似非心モーメントを使用しますか?EˉXkE(ˉXEˉX)k

派生を任意に変更し、重要な剰余項を削除するためです。大きなO表記と関連する結果に精通していない場合は、[Casella&Lehmann]が参考になります。

h(ˉX)h(u)h(u)(ˉXμ)+h(x)2(ˉXμ)2+O[(ˉXμ)3]

E[h(ˉX)h(u)]h(u)E(ˉXμ)+h(x)2E(ˉXμ)2+(?)

ただし、常に(これは正当ではありません...)を実行していると主張して残基を削除しない場合でも、次のステップ: はN\E(h(ˉX)h(u))3h(μ)3\E(ˉXμ)3+32h(μ)2h(μ)\E(ˉXμ)4+34h(μ)h(μ)2\E(ˉXμ)5+18h(μ)3\E(ˉXμ)6.(1)

[h(x)h(x0)]3dx=[h(x0)(xx0)+12h(x0)(xx0)2+O((xx0)3)]3dx=(1)

これがまだ明確でない場合、被積分関数を展開する代数は次のようになります。

[h(x0)(xx0)+12h(x0)(xx0)2+O((xx0)3)]3(2)

まかせ、、A=h(x0)(xx0)B=12h(x0)(xx0)2C=O((xx0)3) (2)=[A+B+C]3 [A3+3A2B+3AB2+B3]=[A+B]3=(1)

あなたの間違いは、拡張前の残基を省略することです。これは、ビッグO表記の「古典的な」間違いであり、後にビッグO表記の使用に対する批判になりました。

2.分析が重要な量であるではなく始まるのはなぜですか?ˉXX

導入する指数モデルの十分な統計に基づいて分析を行いたいためです。サイズ1のサンプルがある場合、または分析しても違いはありません。ˉX=1nni=1XiX1

GLMとは関係ありませんが、これは大きなO表記法の良いレッスンです...

参照 [Casella&Lehmann] Lehmann、Erich Leo、およびGeorge Casella。ポイント推定の理論。Springer Science&Business Media、2006年。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.