市場間分析は、異なる市場間の関係を見つけることにより、市場の行動をモデル化する方法です。多くの場合、相関関係は、S&P 500と30年物米国債などの2つの市場間で計算されます。これらの計算は多くの場合、価格データに基づいていないため、定常時系列の定義に適合しないことは誰にとっても明らかです。
(代わりにリターンを使用して)可能な解決策はありませんが、データが非定常である相関の計算は有効な統計計算でもありますか?
このような相関計算はやや信頼できない、または単なるナンセンスだと思いますか?
市場間分析は、異なる市場間の関係を見つけることにより、市場の行動をモデル化する方法です。多くの場合、相関関係は、S&P 500と30年物米国債などの2つの市場間で計算されます。これらの計算は多くの場合、価格データに基づいていないため、定常時系列の定義に適合しないことは誰にとっても明らかです。
(代わりにリターンを使用して)可能な解決策はありませんが、データが非定常である相関の計算は有効な統計計算でもありますか?
このような相関計算はやや信頼できない、または単なるナンセンスだと思いますか?
回答:
相関は線形関係を測定します。非公式の文脈では、関係は安定したものを意味します。定常変数のサンプル相関を計算し、利用可能なデータポイントの数を増やすと、このサンプル相関は真の相関になります。
通常はランダムウォークである価格の場合、サンプル相関はランダム変数になる傾向があることを示すことができます。これは、どれだけ多くのデータを保持しても、結果は常に異なることを意味します。
注:数学を使わずに数学的な直観を表現してみました。数学的な観点からは、説明は非常に明確です。定常プロセスのサンプルモーメントは、確率が定数に収束します。ランダムウォークのサンプルモーメントは、ランダム変数であるブラウン運動の積分に収束します。関係は通常、ランダム変数ではなく数値として表されるため、非定常変数の相関を計算しない理由が明らかになります。
更新 2つの変数間の相関に関心があるため、最初にそれらが定常プロセスから来ると仮定します。定常性は、E Z tおよびc o v (Z t、Z t − h)がtに依存しないことを意味します。相関関係
また、式のすべての量はに依存しない行列c o v (Z t)から取得されるため、tはtに依存しません。したがって、サンプル相関の計算
なる感覚、我々は、サンプルの相関が推定することを合理的期待有することができるのでρ=CORR(Xをt、Yt)。これは、一定の条件を満たし、固定プロセスのために我々は持っているので、この希望は、根拠のないではないことが判明ρを→
ここで、が静止していないと仮定します。次に、c o r r (X t、Y t)はtに依存します。だから我々は、サイズのサンプルを観察するときTを推定するために、我々 potentialy必要性T異なる相関ρ トンを。これには、最良のシナリオでは、我々は唯一のいくつかの機能を推定することができ、もちろん実行不可能であるρ トンを、このような平均値や分散など。しかし、結果には理にかなった解釈がないかもしれません。
次に、おそらく最も研究されている非定常プロセスのランダムウォークの相関関係で何が起こるかを調べてみましょう。Z t = ∑ t s = 1(U t、V t)の場合、プロセスをランダムウォークと呼びます。ここで、C t = (U t、V t)は定常プロセスです。簡単にするため、E C t = 0と仮定します。それから
To simplify matters further, assume that is a white noise. This means that all correlations are zero for . Note that this does not restrict to zero.
Then
So far so good, though the process is not stationary, correlation makes sense, although we had to make same restrictive assumptions.
Now to see what happens to sample correlation we will need to use the following fact about random walks, called functional central limit theorem:
簡単にするために、サンプル相関を次のように定義します。
Let us start with the variances. We have
This goes to infinity as increases, so we hit the first problem, sample variance does not converge. On the other hand continuous mapping theorem in conjunction with functional central limit theorem gives us
Similarly we get
So finally for sample correlation of our random walk we get
So although correlation is well defined, sample correlation does not converge towards it, as in stationary process case. Instead it converges to a certain random variable.
...is the computation of correlation whose data is non-stationary even a valid statistical calculation?
Let be a discrete random walk. Pick a positive number . Define the processes and by , if , and otherwise ; and . In other words, starts out identical to but every time rises above , it switches signs (otherwise emulating in all respects).
(In this figure (for ) is blue and is red. There are four switches in sign.)
In effect, over short periods of time tends to be either perfectly correlated with or perfectly anticorrelated with it; however, using a correlation function to describe the relationship between and wouldn't be useful (a word that perhaps more aptly captures the problem than "unreliable" or "nonsense").
Mathematica code to produce the figure:
With[{h=5},
pv[{p_, v_}, w_] := With[{q=If[v > h, -p, p]}, {q, q w}];
w = Accumulate[RandomInteger[{-1,1}, 25 h^2]];
{p,v} = FoldList[pv, {1,0}, w] // Transpose;
ListPlot[{w,v}, Joined->True]]