タグ付けされた質問 「correlation」

変数のペア間の線形関連の度合いの尺度。

2
3つの相関した一様分布のランダム変数を生成する
私たちが持っていると仮定します X 2〜UNIF(nは、0 、1 )、X1∼unif(n,0,1),X1∼unif(n,0,1),X_1 \sim \textrm{unif}(n,0,1), X2∼unif(n,0,1),X2∼unif(n,0,1),X_2 \sim \textrm{unif}(n,0,1), ここで、unif(n,0,1)unif(n,0,1)\textrm{unif}(n,0,1)はサイズnの一様ランダムサンプルであり、 Y=X1,Y=X1,Y=X_1, Z=0.4X1+1−0.4−−−−−−√X2.Z=0.4X1+1−0.4X2.Z = 0.4 X_1 + \sqrt{1 - 0.4}X_2. この場合、と相関はです。Z 0.4YYYZZZ0.40.40.4 これを3つの変数、、に拡張するにはどうすればよいですか?X 2 X 3X1X1X_1X2X2X_2X3X3X_3

4
1つの変数の標準偏差が0の場合、相関はどうなりますか?
私が理解しているように、方程式を使用して共分散を正規化することで相関を得ることができます ρi,j=cov(Xi,Xj)σiσjρi,j=cov(Xi,Xj)σiσj\rho_{i,j}=\frac{cov(X_i, X_j)}{\sigma_i \sigma_j} ここで、は標準偏差です。 XIσi=E[(Xi−μi)2]−−−−−−−−−−−√σi=E[(Xi−μi)2]\sigma_i=\sqrt{E[(X_i-\mu_i)^2]}XiXiX_i 私の懸念は、標準偏差がゼロに等しい場合です。ゼロにならないことを保証する条件はありますか? ありがとう。


2
距離相関計算の理解
私の知る限り、距離相関は、2つの数値変数間に関係があるかどうかを確認するための堅牢で普遍的な方法です。たとえば、数字のペアのセットがある場合: (x1, y1) (x2, y2) ... (xn, yn) 距離相関を使用して、2つの変数(xおよびy)の間に(必ずしも線形ではない)関係があるかどうかを確認できます。また、xおよびyは、異なる次元のベクトルにすることができます。 距離相関の計算は比較的簡単です。まず、を使用して距離行列を計算します。次に、y iを使用して距離行列を計算します。x iとy iの数が同じであるため(ペアになっているため)、2つの距離行列は同じ次元になります。xiバツ私x_iyiy私y_ixiバツ私x_iyiy私y_i 現在、ペアリングできる距離がたくさんあります。たとえば(2,3)、最初の距離行列の要素(2,3)は、2番目の距離行列の要素とペアになります。したがって、距離のペアのセットがあり、それを使用して相関(距離間の相関)を計算できます。 2種類の距離が相関している場合、Xが近いと通常Yが近いことを意味します。たとえば、がx 13に近い場合、y 7はy 13に近い可能性が高いことを意味します。したがって、XとYは依存していると結論付けることができます。x7バツ7x_7x13バツ13x_{13}y7y7y_7y13y13y_{13} 理にかなっているように思えますが、理解できない2つの側面があります。 まず、距離相関を計算するために、2つの距離行列を直接使用しません。それらに二重センタリング手順を適用します(そのため、行(または列)のすべての要素の合計がゼロに等しくなります)。なぜそうする必要があるのか​​分かりません。このステップの背後にあるロジック(または直感)とは何ですか? 第二に、元の距離行列では、対角線上にゼロがあります。したがって、距離間の相関を計算すると、最初の行列の多くのゼロが2番目の行列の対応するゼロとペアになっているため、統計的に有意な相関があります。この問題はどのように解決されますか?

2
2つの相関するランダム変数をサンプリングするためのいくつかの手法は何ですか?
2つの相関するランダム変数をサンプリングするためのいくつかの手法は何ですか? 確率分布がパラメータ化されている場合(たとえば、対数正規) ノンパラメトリック分布がある場合。 データは、非ゼロの相関係数を計算できる2つの時系列です。履歴相関と時系列CDFが一定であると仮定して、将来これらのデータをシミュレートしたいと考えています。 ケース(2)の場合、1-DアナログはCDFを構築し、そこからサンプルを作成します。だから、2-D CDFを作成して同じことをすることができたと思います。ただし、個々の1-D CDFを使用し、ピックを何らかの方法でリンクすることで、近づく方法はないのでしょうか。 ありがとう!

1
距離相関と相互情報
私はしばらくの間、相互情報を扱ってきました。しかし、分布の独立性、いわゆる「距離相関」(ブラウン相関とも呼ばれる)の測定にも使用できる「相関世界」で、最近の測定値を見つけました。http://en.wikipedia.org/wiki/Brownian_covariance。私は、この手段が導入されている論文をチェックしましたが、相互情報を暗示することはありませんでした。 だから、私の質問は: 彼らはまったく同じ問題を解決しますか?そうでない場合、問題はどのように異なりますか? そして、前の質問が肯定的に答えられる場合、どちらかを使用する利点は何ですか?

6
「相関」のアクティブ/パッシブ使用に関するニトピッキング
ここで統計StackExchangeまたは言語/英語のいずれでこれを尋ねるかどうかはheしますが、他のフォーラムの統計に精通したユーザーよりも、ここで言語を選ぶユーザーの方が多いと思います;) 「AをBと相関させて見つけた...」のように、アクティブな音声の動詞として相関関係に言及しているレポートをよく読みます。私にとって、この動詞は、たとえば「AとBが有意に相関していることがわかった」と言ったときのように、受動態でのみ意味があります。文法的にはこれが実際にアクティブな音声とパッシブな音声を構成するというのは間違っているかもしれませんが、私が説明するのは、AとBがそれぞれ変化するように何かをすることと、3番目の変数(R係数など)を計算することの違いです。 もちろん、2つの変数を積極的に相関解除することはできますが、アクティブなものを参照するのではなく、それらを「相関させる」ことは、そのような有意な相関関係が存在するかどうかを確認するための簡略表現として使用されるように思えます! 私が間違っている?AをBと[積極的に]相関させたと言うことは、統計的に他の意味をなしますか?

3
変数の1つがカテゴリカルである場合、相関があまり役に立たないのはなぜですか?
これはちょっとした内臓検査です。この概念をどのように誤解しているかを確認してください。 私は相関関係の機能的理解を持っていますが、その機能的理解の背後にある原則を本当に自信を持って説明するために、ちょっとした把握を感じています。 私が理解しているように、統計的相関(用語のより一般的な使用法とは対照的に)は、2つの連続変数とそれらが同様の方法で上昇または下降する傾向があるかどうかを理解する方法です。 たとえば、1つの連続変数と1つのカテゴリ変数で相関を実行できない理由は、2つの間の共分散を計算する ことができないためです。なぜなら、定義によりカテゴリ変数は平均を求めることができず、したがって、最初の統計分析のステップ。 そうですか?

1
極端な値で依存している(おおよそ)独立変数の例はありますか?
私は2つの確率変数の例を探していますXXX、YYY、このような |cor(X,Y)|≈0|cor(X,Y)|≈0\newcommand{\cor}{{\rm cor}}|\cor(X,Y)| \approx 0 しかし、分布のテール部分を考慮すると、それらは非常に相関しています。(テールが線形ではない可能性があるため、テールの「相関」/「相関」を回避しようとしています)。 おそらくこれを使用します: |cor(X′,Y′)|≫0|cor(X′,Y′)|≫0|\cor(X', Y')| \gg 0 どこX′X′X'上の条件付きであるX>90%X>90%X > 90\%のXXXの人口、およびY′Y′Y'同じ意味で定義されています。

1
重み付き相関などですか?
ストリーミング配信された最も人気のある音楽アーティストに関する興味深いデータを、場所ごとに約200の議会地区に分割しています。音楽の好みについて人に投票して、その人が「民主党員のように聞く」のか、「共和党員のように聞く」のかを判断できるかどうかを見たい。(当然、これは簡単ですが、データには実際のエントロピーがあります!) 約100人のアーティストに関するデータに加えて、過去3回の選挙サイクルにおける各地区の共和党員と民主党員の平均投票率があります。そこで、各アーティストについて相関関係を調べ、どのアーティストが最も不釣り合いに聴かれているかを、民主党の投票シェアの関数として調べました。これらの相関関係は、どのアーティストでも約-0.3から0.3の範囲であり、中間には予測力がほとんどまたはまったくないものがたくさんあります。 2つの質問があります。1つ目は、地区ごとのストリームの総数は大きく異なります。現在、私は、たとえばビヨンセに属する地区ごとのすべてのストリームの割合を、民主党に投じられた票の割合と相関させています。しかし、ある地区の総河川は数百万、もう1つの地区は100,000の低さです。これを説明するために、どういうわけか相関に重みを付ける必要がありますか? 第二に、これらの相関関係を組み合わせて、ユーザーの政治に関する複合的な推測を行う方法に興味があります。絶対相関値が最も高い20人のアーティスト(正と負)をそれぞれの方向に10人ずつ取り、各アーティストがどれだけ好きかについてユーザーに投票するとします。したがって、私は各アーティストに賛成または反対票を投じ、さらに20の価値すべてに対する政治との相関関係を持っています。これらの相関を単一の推定値に結合する標準的な方法はありますか?(私はNYTimesの有名な方言クイズのようなものを考えています。そこでは25の質問に対する地域の確率をヒートマップに結合しました。しかしこの場合、音楽に対する民主党や共和党員の好みに関する単一の値が必要です。 ありがとうございました!

1
サンプル相関係数は、母集団相関係数の不偏推定量ですか?
それが事実であるための不偏推定量であるρ X 、Y?すなわち、E [ R X 、Y ] = ρ X 、Y?RX,YRX,YR_{X,Y}ρX,YρX,Y\rho_{X,Y}E[RX,Y]=ρX,Y?E[RX,Y]=ρX,Y?\mathbf{E}\left[R_{X,Y}\right]=\rho_{X,Y}? ない場合は、のための不偏推定するものである?(おそらく、使用されている標準の不偏推定量がありますか?また、偏りのあるサンプル分散にnを掛ける単純な調整を行う、不偏サンプル分散に類似していますか?ρX,YρX,Y\rho_{X,Y}?)nn−1nn−1\frac{n}{n-1} 人口の相関係数は以下のように定義されるサンプル相関係数は以下のように定義されている間RX、Y=Σ N iは= 1(XI- ˉ X)(YI- ˉ Y)ρX,Y=E[(X−μX)(Y−μY)]E[(X−μX)2]−−−−−−−−−−−−√E[(Y−μY)2]−−−−−−−−−−−−√,ρX,Y=E[(X−μX)(Y−μY)]E[(X−μX)2]E[(Y−μY)2],\rho_{X,Y}=\frac{\mathbf{E}\left[\left(X-\mu_{X}\right)\left(Y-\mu_{Y}\right)\right]}{\sqrt{\mathbf{E}\left[\left(X-\mu_{X}\right)^{2}\right]}\sqrt{\mathbf{E}\left[\left(Y-\mu_{Y}\right)^{2}\right]}},RX,Y=∑ni=1(Xi−X¯)(Yi−Y¯)∑ni=1(Xi−X¯)2−−−−−−−−−−−−−√∑ni=1(Yi−Y¯)2−−−−−−−−−−−−√.RX,Y=∑i=1n(Xi−X¯)(Yi−Y¯)∑i=1n(Xi−X¯)2∑i=1n(Yi−Y¯)2.R_{X,Y}=\frac{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)\left(Y_{i}-\bar{Y}\right)}{\sqrt{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}}\sqrt{\sum_{i=1}^{n}\left(Y_{i}-\bar{Y}\right)^{2}}}.

3
直感のために、無相関であるが従属するランダム変数の実際の例は何ですか?
非相関が独立を意味しない理由を説明する際に、ランダム変数の束を含むいくつかの例がありますが、それらはすべてとても抽象的に見えます:1 2 3 4。 この答えは理にかなっているようです。私の解釈:ランダム変数とその二乗は無相関の場合があります(明らかに相関の欠如は線形独立性に似ているため)が、明らかに依存しています。 例としては、(標準化された)高さと高さ2は無相関だが依存しているかもしれないが、高さと高さ2を比較したい理由がわからない。22^222^2 初等確率理論または同様の目的で初心者に直観を与える目的で、無相関だが従属する確率変数の実際の例は何ですか?

4
「相関」は回帰分析の傾きも意味しますか?
私は論文を読んでおり、著者は次のように書いています。 Yに対するA、B、Cの影響は、重回帰分析を使用して調査されました。A、B、Cは、従属変数としてYを使用して回帰式に入力されました。分散分析を表3に示します。Yに対するBの効果は有意であり、Bは.27をYと相関させます。 英語は私の母国語ではなく、私はここで本当に混乱しました。 最初に、彼は回帰分析を実行すると述べ、次に分散分析を示しました。どうして? そして、彼は相関係数について書きました、それは相関分析からではありませんか?または、この単語を使用して回帰勾配を説明することもできますか?

4
スピアマン相関の次の2つの式の等価性を証明する
ウィキペディアから、スピアマンのランク相関は、変数およびをランク変数およびに変換し、ランク変数間のピアソンの相関を計算することにより計算されます。XiXiX_iYiYiY_ixixix_iyiyiy_i ただし、この記事では、変数と間に関係がない場合、上記の式はXiXiX_iYiYiY_i ここで、、ランクの差。di=yi−xidi=yi−xid_i = y_i - x_i 誰かがこれの証拠をお願いできますか?ウィキペディアの記事で参照されている教科書にアクセスできません。

1
順序変数と連続変数の間の相関を正しく評価する方法は?
以下の間の相関関係を推定したいと思います。 順序変数:被験者は、6種類の果物に対する好みを1〜5のスケール(非常に不快なものから非常においしいものまで)で評価するよう求められます。平均して、被験者はスケールの3ポイントのみを使用します。 連続変数:同じ被験者にこれらの果物をすばやく特定するように依頼します。これにより、6つの果物の平均精度が得られます。 Spearman rhoはこれらのデータを分析するための最良の方法であるか、および/または私が検討できる他の良い方法はありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.