私は2つの確率変数の共分散をよりよく理解しようとし、それを最初に考えた人が統計で日常的に使用されている定義に到達した方法を理解しようとしました。私はそれをよりよく理解するためにウィキペディアに行きました。記事から、適切な候補メジャーまたは数量には次のプロパティが必要です。
- 2つの確率変数が類似している場合(つまり、一方が増加し、もう一方が増加し、一方が減少すると、もう一方も増加する)、正の符号が表示されます。
- また、2つの確率変数が逆に類似している場合(つまり、1つが増加すると、もう1つの確率変数が減少する傾向がある場合)には、負の符号を付けます。
- 最後に、2つの変数が互いに独立している場合(つまり、それらが互いに共変動しない場合)は、この共分散量をゼロ(またはおそらく非常に小さい)にする必要があります。
上記のプロパティから、を定義します。私の最初の質問は、なぜがこれらのプロパティを満足するのかが完全に明らかではないということです。私たちが持っている特性から、「導関数」のような方程式が理想的な候補になることを期待していました。たとえば、「Xの変化が正の場合、Yの変化も正でなければならない」などのようなものです。また、なぜ平均との違いを「正しい」こととするのですか?C o v (X 、Y )= E [ (X - E [ X ] )(Y - E [ Y ] )]
より接線的ですが、それでも興味深い質問ですが、それらの特性を満たし、さらに意味があり、有用であった別の定義がありますか?なぜこの定義を最初から使用しているのか誰も疑問に思わないので、私はこれを尋ねています数学的好奇心と思考)。受け入れられた定義は、私たちが持つことができる「最良の」定義ですか?
これらは、受け入れられた定義が理にかなっている理由についての私の考えです(それは直感的な議論になるだけです):
してみましょう(すなわち、それはいくつかの時点でいくつかの他の値にいくつかの値から変更)、変数Xのためのいくつかの違いがあります。同様に、を定義します。Δ
ある時点で、それらが関連しているかどうかを計算することができます:
これは少しいいです!ある時点では、それは私たちが望む特性を満たしています。両方が一緒に増加する場合、ほとんどの場合、上記の量は正でなければなりません(同様に、それらが反対に類似している場合は、の符号が反対になるため、負になります)。
しかし、それは時間内に1つのインスタンスに必要な量を与えるだけであり、それらはrvであるため、1つの観測のみに基づいて2つの変数の関係をベースにすることを決定した場合、オーバーフィットする可能性があります。次に、これの期待を利用して、差異の「平均」積を確認してください。
上記で定義された平均的な関係がどのようなものであるかを平均して把握する必要があります!しかし、この説明の唯一の問題は、この違いを何から測定するのでしょうか。これは、平均からのこの差を測定することで対処されるようです(これは、何らかの理由で正しいことです)。
私が定義で持っている主な問題は、平均からの差を取ることだと思います。私にはまだそれを正当化することはできません。
記号の解釈は、より複雑なトピックのように思われるため、別の質問に任せることができます。