Y〜XとX〜Yのベータの平均は有効ですか?


7

2つの時系列変数との関係に興味があります。2つの変数は互いに関連しており、どちらが原因であるかは理論からは明らかではありません。 YX

この考えると、私は、線形回帰好む何の正当な理由がないを超える。 Y=α+βXX=κ+γY

明らかにと間にはいくつかの関係がありますが、私はは真ではないことを理解するのに十分な統計を思い起こします。それとも、近くにないのでしょうか?私は少しかすんでいます。βγβ=1/γ

問題は、に対してどれだけのを保持すべきかを決定することです。XY

私はとの平均を取り、それをヘッジ比率として使用することを検討しています。 β1/γ

との平均は意味のある概念ですか?β1/γ

そして二次的な質問として(おそらくこれは別の投稿になるはずです)、2つの変数が相互に関連しているという事実に対処する適切な方法は何ですか?つまり、独立した従属変数は実際にはありませんか?


1
問題は因果関係ではなく、測定のエラーです(従属変数Yが測定エラーが大きいものであり、「Y = a + B x +エラー」を一般的な式にしていることがよくあります)。 XとYの測定のエラー
Sextus Empiricus

1
正確な値とで見つけることができます私のこの回答への応答と説明変数を...切り替えの効果、そして、あなたは疑いよう、の逆数ではありません、および平均とは正しい方法ではありません。とが最小化しているものの絵図は、同じ質問に対するElvisの回答で与えられ、彼はあなたが望むかもしれない「最小の長方形」回帰を導入します.....βγβγβ1/γβγ
Dilip Sarwate

3
あなたは、テクニックの選択が直接、物理的に測定可能な影響を与える理想的なシナリオにいます。各見積もりの​​サンプル外のヘッジエラーを測定し、それらを比較するだけです。また、通常、最適なヘッジは、VECMモデルを使用することでより適切に処理されます(たとえば、Gatarek&Johansen、2014、cointegrated vector autoregressive modelを使用した最適なヘッジを参照)。 。
Chris Haug

1
可能性として幾何平均を確認することをお勧めします(両方が負の場合は、負の平方根をとる場合があります)。次に、を見てください。これは非常によく似ていますβγsysx
Henry

1
@ricardo サンプル外のエラーを指定したため、モデルの(サンプル内の)適合ではないことに注意してください。そして、最適なヘッジ比率が時間の経過とともに変化することは完全に可能です(特に、関係が実際に線形でない場合)。これは、モデルをバックテストして観察することにより、最も直接的なヘッジ戦略の解明が最も直接的に実行できるという事実を変更しません結果。
Chris Haug

回答:


11

両方の表現間の関係を確認するには、2変量の法線ベクトルを取り: with conditionals および これは、

(X1X2)N((μ1μ2),(σ12ρσ1σ2ρσ1σ2σ22))
X1X2=x2N(μ1+ρσ1σ2(x2μ2),(1ρ2)σ12)
X2X1=x1N(μ2+ρσ2σ1(x1μ1),(1ρ2)σ22)
X1=(μ1ρσ1σ2μ2)α+ρσ1σ2βX2+1ρ2σ1ϵ1
および は、(a)がではなく、(b) 2つの回帰の間の関係は、分布に依存します。
X2=(μ2ρσ2σ1μ1)κ+ρσ2σ1γX1+1ρ2σ2ϵ2
γ1/β(X1,X2)


2つのベータの平均がどちらか一方よりもヘッジ比率の優れた尺度であるかどうかをどのように判断しますか?
リカルド

4
何も思いつきません。
西安

@ricardo各推定値の下でサンプル外のヘッジエラーを測定することで、最終的に最小化しようとしているものです。
Chris Haug

3

コメントから変換.....

正確な値と で見つけることができます私のこの回答への単純な線形回帰に応答し、説明変数の切り替えの効果、あなたは疑いよう、及び の逆数ではない、および平均そして、 (または平均および)に行くための正しい方法ではありません。と が最小化しているものの図解は、Elvisの回答に記載されていますβγβγβγβ1/γβγ同じ質問に答えて、彼はあなたが探しているかもしれない「最小の長方形」回帰を紹介します。Elvisの回答に続くコメントは無視しないでください。彼らは、この「最小の長方形」回帰を、以前に研究された他の技法に関連付けます。特に、モデレーターchlは、予測子変数と応答変数のどちらが明確でない場合にこのメソッドが重要であることを指摘していることに注意してください。


3

βγ

西安が彼の回答で述べたように、とは、条件付き平均と(順番に単一のジョイント分布に関係します)に関係することによって互いに関係しています。これらは、だと感じてください。これは、推定値を使用する代わりに、真のとを「知っている」場合には当てはまりません。あなたが持っているとβγX|YY|Xβ1/γσρ

β=ρXYσYσX
γ=ρXYσXσY

またはあなたは言うことができます

βγ=ρXY21

および計算については、ウィキペディアの単純な線形回帰も参照してください。βγ

対称性を妨害するのはこの相関項です。場合及び単に標準偏差の比率であろう及びそれらは実際に互いの逆であろう。という用語は、一種としてこれを修正するように見ることができる平均に回帰βγσY/σXσX/σYρXY

  • 完全な相関を使用すると、基づいてを完全に予測できます。勾配は等しくなりますρXY=1XY
    βγ=1
  • ただし、完全な相関ではない場合、これらの完全な予測を行うことはできず、条件付き平均は、またはによる単純なスケーリングと比較して、無条件平均にいくぶん近づき。回帰直線の傾きは緩やかになります。相互に逆数であり、それらの積は1つのより小さいため、勾配は関連しません。ρXY<1σY/σXσX/σY
    βγ<1

回帰直線は正しい方法ですか?

これらの条件付き確率と回帰直線がと比率を決定するために必要なものかどうか疑問に思うかもしれません。最適な比率の計算に回帰直線をどのように使用するかは、私にはわかりません。XY

以下は、比率を計算する別の方法です。この方法には対称性があります(つまり、XとYを切り替えると、同じ比率になります)。


オルタナティブ

セイ、債券利回りの及び多変量正規分布に従って分布している相関のと標準偏差との和であり、その後、ヘッジの収率とであろうが正規分布:XYρXYσXσYXY

H=αX+(1α)YN(μH,σH2)

たとと0α1

μH=αμX+(1α)μYσH2=α2σX2+(1α)2σY2+2α(1α)ρXYσXσY=α2(σX2+σY22ρXYσXσY)+α(2σY2+2ρXYσXσY)+σY2

平均の最大であろうか否場合、既存の。μH

α=0 or α=1
μX=μY

分散の最小値は、σH2

α=1σX2ρXYσXσYσX2+σY22ρXYσXσY=σY2ρXYσXσYσX2+σY22ρXYσXσY

最適は、これらの2つの極端の間のどこかにあり、損失と利益をどのように比較するかによって異なります。

と間には対称性があることに注意してください。ヘッジか、ヘッジを使用するかは関係ありません。に関して同じ比率になります。α1αH=α1X+(1α1)YH=α2Y+(1α2)Xα1=1α2

最小分散の場合と主成分との関係

最小分散の場合(ここでは実際に多変量正規分布を仮定する必要はありません)、次のヘッジ比率が最適なこれは、回帰係数およびであり、次のようになります

α1α=var(Y)cov(X,Y)var(X)cov(X,Y)
β=cov(X,Y)/var(X)γ=cov(X,Y)/var(Y)
α1α=1β1γ

3つ以上の変数/株式/債券がある状況では、これを最後の(最小の固有値)主成分に一般化できます。


バリアント

多変量正規分布とは異なる分布を使用することで、モデルを改善できます。また、時間をより洗練されたモデルに組み込んで、ペアの将来の値/分布の予測を改善することもできます。X,Y


これは簡略化ですが、回帰直線を使用せずに最適な比率を見つけるために分析を実行する方法と実行する方法を説明する目的に適しています。


1
申し訳ありませんが、物理学者として、株式、債券、金融に関連する言語(ロング、ショート、ホールディングスなど)についてはあまり知りません。もっと簡単な言語でキャストできれば、理解して作業できるかもしれません。私の答えは、ヘッジと株式を表現する方法と詳細を知らない非常に単純な表現ですが、回帰直線の使用から抜け出す方法の基本原則を示しています(最初の原則に戻り、関連性が直接明確ではない回帰直線を使用する代わりに、中心にある利益のモデル)。
Sextus Empiricus

私は理解したと思います。問題は、1 /ρ_{XY} \ ne p_ {XY}であること p_ {XY} $はしばしば逆に取るとかなり変化します。あなたの代替案は私が考えているケースに近いですが、私は一つのことを確認したいです:これは非負の保有を許可しますか?あなたの専門用語を採用すると、結合Xの単位保有とYの負の保有があります。結合Xの1単位を長く、結合Yの1.2単位を短く(たとえば)言いますが、0.2単位または5単位は、数学によって異なります。.indeed,
リカルド

ロングとは、価格が〜1%上昇した場合に債券に1%を支払うことを意味します ショートとは、価格が〜1%上昇した場合、債券で〜1%を失うことを意味します。つまり、私は1つの債券の1単位が長く(したがって、感謝の恩恵を受ける)、もう一方の債券の一部が不足している(したがって、感謝の意を失う)のです。
リカルド

「問題は、XのどれだけがYに対して保持されるべきかを決定することです。」これに関する私の問題は、あなたがこれについてどのように決めるかについての説明/モデル/表現がないということです。損失と利益をどのように定義し、どのくらい評価しますか?
Sextus Empiricus

短期および長期に関連するコストはありますか?私はあなたが投資する特定の金額を持っていると思います、そしてこれはあなたがそれらの債券でどれだけあなたがショート/ロングになることができるかを制限します。次に、あなたの以前の知識に基づいて、その制限のあらゆる組み合わせの損失/利得の分布を推定/決定できます。最後に、損失と利益をどのように評価するかを決定するいくつかの関数に基づいて(これは、なぜ/どのようにヘッジするかを表します)、どの組み合わせを選択するかを決定できます。
Sextus Empiricus

1

おそらく「グレンジャー因果律」のアプローチが役立つかもしれません。これは、XがYの優れた予測子であるかどうか、またはXがYの優れた予測子であるかどうかを評価するのに役立ちます。つまり、ベータとガンマのどちらがより真剣に取るべきかを示します。また、時系列データを扱っていることを考慮すると、Xの履歴がYの予測にどれだけカウントされるか(またはその逆)がわかります。

ウィキペディアは簡単な説明をしています:時系列Xは、通常、Xのラグされた値に対する一連のt検定とF検定(およびラグされたYの値も含まれます)を介して表示できる場合、グレンジャー原因Yと言われます、これらのX値はYの将来の値に関する統計的に有意な情報を提供すること。

あなたがすることは次のとおりです:

  • Y(t)の回帰X(t-1)およびY(t-1)
  • Y(t)の回帰X(t-1)、X(t-2)、Y(t-1)、Y(t-2)
  • Y(t)の回帰X(t-1)、X(t-2)、X(t-3)、Y(t-1)、Y(t-2)、Y(t-3)

履歴の長さが妥当である可能性がある場合は、続けます。各回帰のF統計の有意性を確認します。次に、同じことを逆にして(つまり、X(t)でXとYの過去の値を回帰する)、有意なF値を持つ回帰を確認します。

Rコードを使用した非常に簡単な例がここにあります。グレンジャーの因果関係は、実際には因果関係を確立していないために批判されています(場合によっては)。しかし、あなたのアプリケーションは、実際には「予測因果律」に関するものであるようです。これは、まさにグレンジャー因果律アプローチが意図されているものです。

重要なのは、このアプローチでは、XがYを予測するか、YがXを予測するかが示され(そのため、2つの回帰係数を人為的かつ誤って合成するように誘惑されることはなくなります)、より適切な予測が得られます( Yを予測するために、XとYの履歴をどれだけ知る必要があるかがわかります。これは、ヘッジ目的に役立ちますよね。


どちらも真の原因ではなく、原因になったとしても、それが長期にわたって真実であり続けることはないと私は信じる強い理論的理由があります。だから私はこの場合、Granger Causailtyが答えだとは思わない。それは便利なので、私はどんな場合でも答えを支持しました-特に。Rコード。
リカルド

そのため、「実際に因果関係を確立していない(場合によっては)ため、グレンジャーの因果関係は批判されてきた」と明示的に述べています。あなたの質問は、「予測的因果関係」を確立することに関するものであるように思われます。これは、グレンジャー因果関係が意図されているものです。さらに、グレンジャーのアプローチは、時系列データの情報を使用します。これは、それらがある場合は使用しないでください。もちろん、時間の経過に伴う影響を再推定することができます(すべきですか?)。グレンジャー効果は断面OLSよりも安定していると思います(履歴データを使用して、これを事前にテストできます)。HTH
スティーブG.ジョーンズ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.