テイラー級数(特に残り)の期待値を取得する


42

私の質問は、広く使用されている方法、つまり、Taylor Seriesの期待値を正当化することに関するものです。正の平均および分散を持つランダム変数があると仮定します。さらに、などの関数があります。Xμσ2log(x)

平均を中心にテイラー展開を行うと、 ここで、通常どおり、はst。logX

logX=logμ+Xμμ12(Xμ)2μ2+13(Xμ)3ξX3,
ξX|ξXμ|<|Xμ|

予想を立てると、通常は自明の何かと呼ばれる近似式が得られます(最初の式の記号を参照してください)

ElogXlogμ12σ2μ2

質問:剰余項の期待値が実際に無視できることを証明する方法に興味があります。つまり、 (または、言い換えれば、)。

E[(Xμ)3ξX3]=o(σ2)
E[o(Xμ)2]=o(E[(Xμ)2])

私が実行しようと何:と仮定し(これは、順に、手段で)、I は周囲、二つに積分を分割しようと一部とを -vicinity: σ20XμPμεNε

Rp(x)(xμ)3ξx3dx=xNεdx+xNεdx

最初の1つは、0Nε、したがって1/ξ3が気にしないという事実のために制限されます。しかし、2番目の場合、2つの事実があります:一方では、

P(|Xμ|>ε)0
σ20)。しかし一方で、1 / \ xi ^ 3をどうするかはわかりません1/ξ3

別の可能性としては、ファトーの補題を使用してみることもできますが、その方法はわかりません。

ヘルプやヒントをいただければ幸いです。これは非常に技術的な質問のようなものであることに気づきましたが、この「テイラーへの期待」の方法を信頼するためには、それを経験する必要があります。ありがとう!

PS私はここでチェックアウトしましたが、それは少し別のもののようです。


テイラー展開の第3項の前にマイナス記号があるのはなぜですか?また、なぜ第4期にではなく?私は何が欠けていますか?3 33!
アレコスパパドプロス

@Alecos:番目の導関数を見てください。それはあなたの両方の質問に答えます。log xnlogx
枢機卿

4
(+1)この問題は最近、瞬間を見つけることに関連する2つの質問の議論で取り上げられました。そのような問題にさらに注意を払うことは有益です。:X1
枢機

1
平均値の定理により、実際には、一次近似の方が実際に優れている場合があります。平均値定理が一般的な場合に役立つかどうかはわかりません。
確率論的

1
方程式は限界と積分の交換であるため、支配的な収束定理がここで役立つ可能性があると思い。E(o(..))=o(E(..))
確率論的

回答:


32

あなたはこのアプローチに懐疑的であることは正しい。ヒューリスティックには真実の核が含まれていますが、テイラー級数法は一般に機能しません。以下の技術的な議論を要約すると、

  • 強い集中は、テイラー級数法が素敵な関数に対して機能することを意味します
  • ヘビーテールの分布やあまり良くない関数では、事態は劇的に悪くなる可能性があります。

Alecosの答えが示すように、これは、データの裾が重い可能性がある場合は、テイラー級数法を廃止する必要があることを示唆しています。(金融の専門家、私はあなたを見ている。)

エルビスが指摘したように、重要な問題は、分散が高次モーメントを制御しないことです。理由を確認するために、主なアイデアを得るために質問を可能な限り単純化しましょう。

仮定我々は確率変数の配列を有しとなど。 σ X N0 、N Xnσ(Xn)0n

Q:をとして保証できますN E[|Xnμ|3]=o(σ2(Xn))n?

有限の2次モーメントと無限の3次モーメントを持つランダム変数があるため、答えは断固としてnoです。したがって、一般に、テイラー級数法は3次多項式でも失敗します。この引数を反復すると、ランダム変数のすべてのモーメントが適切に制御されない限り、多項式に対してもテイラー級数法が正確な結果を提供することを期待できないことがわかります。

それでは、何をする必要がありますか?確かにこの方法は、サポートがポイントに収束する有界ランダム変数に対して機能しますが、このクラスは小さすぎて面白くありません。シーケンスという代わりとしいくつかから来て高度に濃縮された(と言う)を満たしていることを家族Xn

(1)P{|Xnμ|>t}eCnt2

すべてのおよび。このようなランダム変数は驚くほど一般的です。たとえば、が経験的平均である場合C > 0 X nt>0C>0Xn

Xn:=1ni=1nYi

素敵なランダム変数(たとえば、iidと有界)のさまざまな濃度不等式は、が(1)を満たすことを意味します。標準的な引数(ここの p。10を参照)は、そのようなランダム変数の番目のモーメントを制限します。X n pYiXnp

E[|Xnμ|p](p2Cn)p/2.

したがって、「十分に良い」分析関数(以下を参照)については、三角形の不等式を使用して項のテイラー級数近似で誤差を制限できます。E m mfEmm

Em:=|E[f(Xn)]p=0mf(p)(μ)p!E(Xnμ)p|1(2Cn)(m+1)/2p=m+1|f(p)(μ)|pp/2p!

場合。スターリングの近似により、切り捨てられたテイラー級数の誤差は、p PのP - 1 / 2n>C/2p!pp1/2

(2)Em=O(n(m+1)/2) as nwheneverp=0p(1p)/2|f(p)(μ)|<.

したがって、が強く集中し、が十分に良い場合、テイラー級数近似は実際に正確です。(2)に現れる不等式は、であるため、特にこの条件ではがwholeである必要があります。(1)は有界性の仮定を課さないため、これは理にかなっています。Xnff(p)(μ)/p!=O(pp/2)fXn

特異性がある場合に何がうまくいかないかを見てみましょう(whuberのコメントに従ってください)。を選択するとします。0と2の間で切り捨てられた分布からを取得すると、は十分に集中しますが、ごとにになります。言い換えれば、非常に集中した有界確率変数があり、関数に特異点が1つしかない場合でも、テイラー級数法は失敗します。ff(x)=1/xXnNormal(1,1/n)XnE[f(Xn)]=n

厳密さに関するいくつかの言葉。厳密な定理/証明形式で必要とされるdeus ex machinaよりも、派生 として(2)に現れる条件を提示する方が良いと思います。議論を完全に厳密にするために、まず、(2)の右側が

E[|f(Xn)|]i=0|f(p)(μ)|p!E[|Xnμ|p]<

上からのサブガウスモーメントの成長率によって。したがって、フビニの定理は

E[f(Xn)]=i=0f(p)(μ)p!E[(Xnμ)p]

残りの証明は上記のように進みます。


1
クイックリーディングでそれを見逃したかもしれませんが、の3番目の瞬間が十分に「制御されている」ことを(特に)主張している場合、期待値は、 [マクローリン]シリーズ?心配しているのは、少なくともの分布の裾と同じくらい重要な系列自体の収束特性への参照を見たことがないからです。Xlog(X)logX
whuber

2
@whuberあなたは正しいです。のサポートがテイラー級数のROCに含まれている必要があるため、特にほぼ確実です。これを反映するように投稿を更新します。X0<X<2μ
マイクマッコイ

2
まだ何かが足りないと思います。たとえば、が切り捨てられた正規分布を持つ場合、明らかに「非常に集中」し、平均を持ち、ほぼ確実に(を中心とする単位ディスクの内部で解析的であり、を含む)、まだは無限です。X(1,1)(0,2)μ=1f(x)=1/x=1/(1(1x))1(0,2μ)E[f(X)]
whuber

1
@gronいくつかの小さなエラーが発生しました。場合、誘導体。ため条件は成立しませんいずれかのための。あなたはまた、(2)を満たす(2)も満たしていることを任意の関数ので、保持していない確認することができます、したがって持っています特異点はありません(リンクごとにその全体)。| f p μ f(x)=1/x|f(p)(μ)|=p!/μp
(2)=p!p(1p/2)μp
μ>0log(p!f(p)(μ))/pf
マイクマッコイ

1
あなたは二つのことを必要とする@gron:(1)あなたのRVは、厳密ログの級数のROC内のサポートを持っていることを確認してください(すなわち、について)、および(2)RVのモーメントが十分に速く減少し、上記の誤差推定が有限であることを確認します。瞬間をどのように制御するかについては、あまりにも多くのキャラクターが使用されるため、新しい質問をする必要があります(そして、私自身も新しい方法に興味があります)。[0+ε,2με]ε>0Em
マイクマッコイ

10

私の答えは他の答えの数学的洗練のレベルにどこにも近づきませんが、貢献するものがあると信じているので、投稿することにしました。

ライトトーンで、私はOPであると言うでしょう、「リスク回避」 OPが必要であるため、(ほとんどの人がそうであるように、だけでなく、科学そのもの)、十分なこと」への2次テイラー級数展開近似のための条件を許容」。しかし、それは必要条件ではありません

まず、OPが要求するように、Remainderの期待値がrvの分散よりも低い次数であるために必要だが十分ではない前提条件は、シリーズが最初に収束することです。収束を想定する必要がありますか?番号。

調べる一般的な表現は

E[g(Y)]=fY(y)[i=0g(i)(μ)(yμ)ii!]dy[1]

以下のようLoistl(1976) Gemignaniの「微積分や統計」の本(1978、P。170)を参照の状態、無限和の収束のための条件は、(のアプリケーションである比検定収束のために)

yμ<|yμ|<limi|(g(i)(μ)g(i+1)(μ)(i+1))|[2]

...ここではrvの平均です。これも十分な条件ですが(上記の関係が等しければ、比率検定は決定的ではありません)、不等式が他の方向で成り立つ場合、系列は発散します。μ

Loistlは、 3つの特定の関数形式、指数関数、べき乗、および対数を調べました(彼の論文はExpected UtilityおよびPortfolio Choiceの分野にあるため、凹関数関数を表すために使用される標準の関数形式をテストしました)。これらの関数型について、彼は指数関数型についてのみ制限が課されないことを発見しました。逆に、べき乗および対数の場合(すでにが存在する場合)、不等式有効性はと同等 であることがわかります。g()yμ0<y[2]

yμ<μ0<y<2μ

これは、変数がこの範囲外で変動する場合、変数の平均を展開中心とするテイラー展開が発散することを意味します。

そのため、一部の関数形式では、この点が展開中心からどれだけ離れていても、その領域のある点での関数の値は無限テーラー展開に等しくなります。他の関数形式(対数を含む)の場合、関心のあるポイントは、選択した拡張の中心にやや「近く」にあるはずです。rvがある場合、これは変数の理論的サポートの制限(または実験的に観察された範囲の検査)に変換されます。

Loitlは、数値例を使用して、切り捨ての前に展開の次数を増やすと、近似の精度が悪化する可能性があることも示しました。経験的に、金融セクターで観測された変数の時系列は、不平等で必要な変動よりも大きな変動を示すことに注意する必要があります。そのため、Loitlは、ポートフォリオ選択理論に関して、テイラー級数近似方法論を完全に廃止すべきであると主張し続けました。

リバウンドは18年後にHlawitschka(1994)からもたらされました。ここでの貴重な洞察と結果は、私が引用している

...シリーズは最終的に収束する可能性がありますが、その部分シリーズについてはほとんど何も言えません。系列の収束は、用語のサイズがすぐに小さくなることや、特定の用語が無視できるほど十分に小さいことを意味しません。実際、ここで示したように、シリーズが最終的に制限に収束する前に発散するように見える可能性があります。したがって、テイラー級数の最初のいくつかの項に基づく期待効用のモーメント近似の品質は、無限級数の収束特性によって決定できません。これは経験的な問題であり、経験的に、ここで検討した効用関数の2モーメント近似は、ポートフォリオ選択のタスクに適しています。 フラウィチカ(1994)

例として、Hlawitschkaは、テイラー級数が収束したかどうかにかかわらず、2次近似が「成功」したことを示しましたが、近似の次数を上げると悪化する可能性があるというLotlの結果も検証しました。しかし、この成功には修飾子があります。ポートフォリオの選択では、期待効用が証券やその他の金融商品のランク付けに使用されます。これは序数の尺度であり、基数ではありません。したがって、Hlawitschkaが見つけたのは、2次近似がの正確な値から生じるランキングと比較して、異なる証券のランキング保存することでありE(g(Y) この正確な値に十分に近い定量的結果が常に得られたこと(718ページの表A1を参照)。

では、それはどこに私たちを残すのでしょうか?リンボでは、私は言うだろう。理論と経験の両方で、2次テイラー近似の許容性は、研究中の特定の現象のさまざまな側面と採用された科学的方法論に大きく依存しているようです。観測されたシリーズの変動について...

しかし、これを前向きに終わらせましょう。今日では、コンピューターの力が多くのものに取って代わります。そのため、変数の値の範囲が広い場合、理論的問題でも経験的問題でも、2次近似の妥当性をシミュレートしてテストできます。


8

実際の答えではありませんが、物事はそれほど良くないことを示す例であり、この結果を真にするためには追加の仮説が必要です。

を均一なと通常のとの混合として定義し、確率で選択される均一成分、および確率の法線。あなたが持っているに、その分散が収束をとき無限大になると、 誤解しない限りXnU([1n;1n])N(nn1,1n)1n11n=n1nE(Xn)=10n

E(Xn2)=13n2×1n+((nn1)2+1n)×n1n,

ここで、(およびなど定義します。ランダム変数は適切に定義されていますが、 が定義されていないため、期待値 はありません。大きさに関係なく。f(x)=1/xf(0)=0f(Xn)

1n1n1xdx
n

私の結論は、の大域的振る舞い、または予想される値から遠く離れたときにの密度が減衰する速度についての仮説が明らかに必要だということです。このような仮説は古典文学(および教科書)にも見られると確信しています。残念ながら、私のトレーニングは統計学ではなく、私自身も文学に苦労しています。fXn

PS。この例は、ニックの答えの反例ではありませんか?誰が間違っていますか?


1
あなたの引数のより一般的なステートメントは、ということである存在し、有限であるE[Xk]k=1,2,3
probabilityislogic

上記のコメントは正しくないと思います-関数がポイントでテイラー級数展開を許可するということです。提供する例では、連続していないあり。これは、例としてをテイラー級数で展開できないことを意味すると思います。f(x)x=μf(x)=1xx=0f
確率論的

それはで、可能。次に、収束半径があります...無限の収束半径が必要な場合がありますか?!それは強い要件です。μ=1
エルビス

1
エルビス、はい、グローバルな条件が必要です。基本的に、残りの部分は、分布の裾で重み付けされた後、適切に動作する必要があります。最近出てきたあなたの例に似たものについてこちらこちらこちらご覧ください
枢機卿

4

これは完全な答えではなく、2次近似に到達する別の方法です。

テイラー級数の剰余項を扱うのではなく、コーシーの平均値定理を使用するのが最善の方法だと思います。一度適用すると、

f(X)=f(μ)+f(ξ1)(Xμ)

いくつかのためのときまたは。私たちは今、再び平均値の定理を適用する 我々は持っていますXξ1μXμXξ1μXμf(ξ1)

f(ξ1)=f(μ)+f(ξ2)(ξ1μ)

いくつかのためのときまたは。これを最初のフォーミュラに入れるとXξ1ξ2μXμXξ1ξ2μXμ

f(X)=f(μ)+f(μ)(Xμ)+f(ξ2)(ξ1μ)(Xμ)

この結果は、が連続であり、と間で2階微分可能であることのみを必要とすることに注意してください。しかし、これは唯一の固定のために適用される、および変更、対応する変化を意味します。2次デルタ法は、のサポートの全範囲でおよびのグローバルな仮定を行うものとことができます。または少なくとも確率質量の高い領域で。fXμXXξiξ1μ=12(Xμ)ξ2=μX

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.