幾何平均の信頼区間を計算する方法は?


8

これがまったく混乱するなら、私は謝罪します、私は幾何学的な手段にとても慣れていません。コンテキストでは、私のデータセットは35か月末のポートフォリオ値です。月ごとの成長率[Month(N)/ Month(N-1)]-1を見つけたため、34個の観測値があり、既知の前月の月末の値を使用して月末の値を推定したいと思います。たとえば、先月のポートフォリオの最終値がわかっている場合は、それに成長率を掛けて、今月の最終値+/-エラーのマージンの見積もりを取得します。

私は最初に成長率の算術平均を使用し、サンプルの標準偏差を見つけ、信頼区間を計算して下限/上限の成長率を得ました。

私はこの方法の正確さを疑っており、代わりに幾何平均を使用しようとしました。したがって、現在私は34の成長率のセットを持っていますが、1を差し引かなかったため、すべての値は正であり、幾何平均を計算し、標準偏差を計算するには、このWikipediaの式を使用しました: いまこのサイトで同様の質問を調べ、インターネットを一般的に検索し、方法や数式についてさまざまな意見を見ているので、95%CIを計算する方法に関する損失(確かに、基礎となる数学でも少し失われています)。

σg=exp(i=1nln(xiμg)2n)

現在、正規分布の式を使用して、幾何標準偏差から1を引いて(パーセンテージに戻すために)信頼区間を計算しています。

  • 標準誤差= [(Geometric Stdev-1)/ Sqrt(N)]、
  • エラーのマージン= [標準エラー* 1.96]、および
  • CI = [幾何平均+/-エラーのマージン]

これは妥当な近似ですか、それともCIを計算するために別の方法を使用する必要がありますか?

回答:


5

ログ増加率の算術平均を計算できます。

  • してみましょう時間であなたのポートフォリオの価値もVtt
  • してみましょうからあなたのポートフォリオの成長率ものRt=VtVt1t1t

基本的な考え方は、ログを取得して標準的なことを行うことです。ログを取ることは乗算を合計に変換します。

  • してみましょうログの成長率も。rt=logRt

r¯=1Tt=1Trtsr=1T1t=1T(rtr¯)2

次に、サンプル平均標準エラーは次のように与えられます。SEr¯r¯

SEr¯=srT

の95%信頼区間は、およそ次のようになります:。μr=E[rt]

(r¯2SEr¯,r¯+2SEr¯)

べき乗して信頼区間を得る eμr

以来 ex 厳密に増加する関数であり、95%の信頼区間 eμr だろう:

(er¯2SEr¯,er¯+2SEr¯)

これで完了です。なぜ私たちは終わったのですか?

観察する r¯=1Ttrt 幾何平均の対数です

したがって er¯サンプルの幾何平均です。これを示すために、幾何平均が次の式で与えられることを確認してください。

GM=(R1R2RT)1T

したがって、両側のログを取る場合:

logGM=1Tt=1TlogRt=r¯

直感を構築するいくつかの例:

  • 次の平均ログ成長率を計算するとします。 .02。次に、幾何平均はexp(.02)1.0202
  • 次の平均ログ成長率を計算するとします。 .05、その後、幾何平均は exp(.05)=.9512

ために x1、 我々は持っています log(x)x1 そしてのために y0、 我々は持っています exp(y)y+1。さらに遠くに、それらのトリックはブレカを壊します:

  • 次の平均ログ成長率を計算するとします。 .69の場合、幾何平均の平均は exp(.69)2 (つまり、値は期間ごとに2倍になります)。

すべてのログの増加率が rt ゼロに近い(または同等の VtVt1が1に近い場合、幾何平均と算術平均が非常に近いことがわかります。

役に立つかもしれない別の答え:

この回答を議論、ログの違いは、基本的パーセント変化しています。

コメント:ログで快適に考えることは、金融で役立ちます。変化率の観点から考えると似ていますが、数学的にはよりクリーンです。


詳細な回答をありがとう、この方法と@Greenparkerによって提案された方法の違いは何ですか?標準偏差、エラーなどについて異なる結果を取得する必要がありますか?
randyvelour 2017年

1
@randyvelour非常に似ていることを言っています。俺のr¯ 彼とまったく同じです Y¯。彼は、デルタ法を使用して、eY¯ そして、それを使用して信頼区間を作成します。信頼区間のエンドポイントを指数化することもできます。 r¯非対称信頼区間を取得します。
Matthew Gunn 2017年

4

手元の統計的な問題を抽出してみましょう。あなたが持っているX1,Xn 平均のある分布から μ と分散 σ2

検討する Yi=logXi、ここでの平均 Y です μy そして分散は σy2。の平均を考えますYs: Y¯n=i=1nYi/n。CLTにより、

n(Y¯nμy)dN(0,σy2).

今考えて eY¯n

eY¯n=exp{i=1n1nlogYi}=exp{i=1nlogYi1/n}=i=1nexp{logYi1/n}=i=1nYi1/n.

したがって、 eY¯幾何平均です!次に、DeltaメソッドをCLTメソッドに適用します。定義するg(x)=ex、その後 g(x)=ex。デルタ法による

n(eY¯neμy)dN(0,e2μyσy2).

これで、信頼区間を作成するツールが手に入りました。 eμy は真の幾何平均であり、これについて信頼区間を作成する必要があります(これは期待値の信頼区間ではありません) μ)。最初のステップは見積もりですσy2。以来σy2 の分散です Ys、

sy2:=1ni=1n(YiY¯n)2=1ni=1n(logXilogeY¯n)2=1ni=1nlog(XieY¯n).

あなたを作るために 100(1α)真の幾何平均の信頼区間%:

eY¯n±z1α/2eY¯nsyn.

詳細な応答をありがとう、私が持っている質問は、ExcelのGEOMEAN関数がexp(Ybar)とは異なる幾何平均結果を生成するのはなぜですか?私は何か間違ったことをしていますか、それとも違いが予想されますか?さらに、GEOMEAN関数は(1+成長率)を与えるようですが、メソッドは成長率のみを返しますが、平均を見つけた後に変換を行う必要がありますか?言い換えれば、(新/旧)の結果と同様の成長率に戻すために操作を実行する必要があるポイントはありますか?
randyvelour 2017年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.