回答:
共分散行列の最も基本的な使用法は、回帰推定の標準誤差を取得することです。研究者が個々の回帰パラメータ自体の標準誤差のみに関心がある場合、対角線の平方根を取得して個々の標準誤差を取得できます。
ただし、多くの場合、回帰パラメーターの線形結合に興味があるかもしれません。たとえば、特定のグループのインジケータ変数がある場合、グループの平均に興味があるかもしれません。
。
次に、そのグループの推定平均の標準誤差を見つけるには、次のようにします
、
ここで、はコントラストのベクトル、Sは共分散行列です。我々の場合には、我々は唯一の付加共変量「GRP」を持っている場合、X = (1 、1 )(1切片のため、1グループに属するため)。
さらに、共分散行列(または、共分散行列から一意に識別される相関行列)は、特定のモデル診断に非常に役立ちます。2つの変数が高度に相関している場合、それを考える1つの方法は、モデルがどの変数が効果の原因であるかを判断するのに苦労していることです(それらは非常に密接に関連しているため)。これは、予測モデルで使用する共変量のサブセットの選択など、さまざまな場合に役立ちます。2つの変数の相関が高い場合は、予測モデルで2つのうちの1つのみを使用できます。
回帰係数には2つの「種類」があります。
次に、共分散の意味を考えます。任意の2つの確率変数とます。もし | C o v (X 、Y ) | Xの大きな絶対値を描画するときは常に、同じ方向に Yの大きな絶対値を描画することも期待できます。ここで「高い」とは、コメントで指摘されているように、 Xと Yの変動量に関連することに注意してください。
2つの回帰係数の(推定)共分散の共分散で推定、。推定係数間の共分散と b 2のが高い場合、 b 1が高いサンプルでは、 b 2も高いことが期待できます。よりベイズ的な意味では、 b 1には b 2に関する情報が含まれています。
「高」は相対的であることに再度注意してください。ここで、「は高い」とは「b 1がその標準誤差に対して高い」ことを意味し、共分散が「高い」とは「標準誤差の積に対して高い」ことを意味します。これらの解釈上の問題を滑らかにする1つの方法は、標準偏差(場合によっては2つの標準偏差)で割ることによって、各回帰入力を標準化することです。
このサイトにあるユーザが記述 「ファッジのビット」としてではなく、私は完全に同意しません。一つには、この解釈を使用して、ベイジアン回帰の有益な事前確率を考え出すことができます。
これが実際に何に使用されるかについては、Cliff ABの答えは良い要約です。