タグ付けされた質問 「correlation」

変数のペア間の線形関連の度合いの尺度。

3
非ゼロ相関は依存関係を意味しますか?
ゼロ相関は独立性を意味しないという事実を知っています。非ゼロの相関が依存関係を意味するかどうかに興味があります。つまり、いくつかのランダム変数XおよびYの場合、一般にf X 、Y(x 、y )≠ f X(x )f Y(y )?Corr (X、Y)≠ 0Corr(X,Y)≠0\text{Corr}(X,Y)\ne0バツXXYYYfバツ、Y(x 、y)≠ fバツ(x )fY(y)fX,Y(x,y)≠fX(x)fY(y)f_{X,Y}(x,y) \ne f_X(x) f_Y(y)

3
因果関係と混同された相関の実際の例
相関関係の証拠から因果関係が不適切に推測された特定の実際のケースを探しています。 具体的には、次の基準を満たす例に興味があります。 因果関係の存在は、注目に値する効果(公共政策、談話、個々の決定など)をもたらすのに十分なほど広く事実として受け入れられました。 このリンクは、相関する証拠のみに基づいて推測されました(おそらく、一貫性はあるが実証されていない原因メカニズムの存在とともに)。 因果関係は客観的に改ざんされているか、少なくとも深刻な疑いを抱いています。 私に思い浮かんだ2つの例は、あまり理想的ではありません。 ナトリウム摂取と血圧:私が理解するように、それ以来、塩摂取はナトリウムに敏感な人の血圧を上げるだけであると判断されました。有効な因果関係の存在(元々受け入れられていたものではありませんが)により、この例の説得力は低下します。 ワクチンと自閉症:背景が間違っているかもしれませんが、このリンクは相関関係と(不正な)実験的証拠の両方に基づいて推測されたと思います。この例は、(偽の)直接的な証拠が存在したという事実によって弱められています。 注:同様の質問を見ました: 教育の例:相関は因果関係を意味しない 私の質問は主に、注目すべき実世界の例に焦点を当てており、因果関係が明らかにない例(体重や音楽のスキルなど)に焦点を当てていないという点で異なります。

3
3変数のピアソン相関の類似
3つの変数の「相関」が何かであるかどうかに興味があります。 ピアソンの積率相関係数 E{(X−μX)(Y−μY)}Var(X)Var(Y)−−−−−−−−−−−−√E{(X−μX)(Y−μY)}Var(X)Var(Y)\frac{\mathrm{E}\{(X-\mu_X)(Y-\mu_Y)\}}{\sqrt{\mathrm{Var}(X)\mathrm{Var}(Y)}} ここで、3つの変数の質問:Is E{(X−μX)(Y−μY)(Z−μZ)}Var(X)Var(Y)Var(Z)−−−−−−−−−−−−−−−−−−√E{(X−μX)(Y−μY)(Z−μZ)}Var(X)Var(Y)Var(Z)\frac{\mathrm{E}\{(X-\mu_X)(Y-\mu_Y)(Z-\mu_Z)\}} {\sqrt{\mathrm{Var}(X)\mathrm{Var}(Y)\mathrm{Var}(Z)}} 何か? Rでは、解釈可能なもののように見えます: > a <- rnorm(100); b <- rnorm(100); c <- rnorm(100) > mean((a-mean(a)) * (b-mean(b)) * (c-mean(c))) / (sd(a) * sd(b) * sd(c)) [1] -0.3476942 通常、3番目の変数の値が固定されている2つの変数間の相関関係を調べます。誰かが明確にできますか?

6
R:グループごとの相関を計算する
ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け入れていません。 Rには、クラスラベルC(因子)と2つの測定値M1およびM2を含むデータフレームがあります。各クラス内でM1とM2の相関を計算するにはどうすればよいですか? 理想的には、クラスごとに1行、クラスラベルCと相関関係の2列のデータフレームが返されます。
17 r  correlation 

2
相関行列を使用して回帰の予測変数を選択していますか?
数日前、私の心理学者である私の研究者は、線形回帰モデルに変数を選択する彼の方法について私に話しました。私はそれは良くないと思いますが、他の誰かに確かめてもらう必要があります。メソッドは次のとおりです。 すべての変数(従属変数Yを含む)間の相関行列を見て、Yと最も相関する予測子Xを選択します。 彼は基準について言及しなかった。 Q:彼は正しかったですか? [この予測方法は間違っていると思う。なぜなら、どの予測変数を選択すべきか、あるいは変数バイアス(OVB)を省略すべきだという理論だからだ。]

4
独立性がゼロ相関を意味するのはなぜですか?
まず第一に、私はこれを求めていません: ゼロ相関が独立性を意味しないのはなぜですか? これは(むしろうまく)ここで対処されています:https : //math.stackexchange.com/questions/444408/why-does-zero-correlation-not-imply-independence 私が求めているのは逆です... 2つの変数は互いに完全に独立しています。 彼らは偶然にわずかな相関関係を持っていなかったのでしょうか? そうではないはずです...独立は、非常に小さい相関を意味しますか?

4
3つのベクトルがすべて負のペアワイズ相関を持つ可能性はありますか?
3つのベクトル、、および与えられ場合、と、と、およびと間相関がすべて負になる可能性はありますか?すなわち、これは可能ですか?b c a b a c b caaabbbcccaaabbbaaacccbbbccc corr(a,b)&lt;0corr(a,c)&lt;0corr(b,c)&lt;0corr(a,b)&lt;0corr(a,c)&lt;0corr(b,c)&lt;0\begin{align} \text{corr}(a,b) < 0\\ \text{corr}(a,c) < 0 \\ \text{corr}(b,c) < 0\\ \end{align}

2
共同分布が多変量正規分布である場合、ピアソンのρは関連性の網羅的な尺度にすぎないのはなぜですか?
この主張はこの質問への一番の回答で提起されました。「なぜ」という質問は、新しいスレッドを保証するほど十分に異なると思います。グーグルの「関連性の徹底的な尺度」はヒットを生み出さず、そのフレーズが何を意味するのか分かりません。

1
対数正規確率変数の相関
とX 2の正規確率変数に相関係数ρが与えられている場合、次の対数正規乱数変数Y 1とY 2の間の相関関係を見つけるにはどうすればよいですか?X1X1X_1X2X2X_2ρρ\rhoY1Y1Y_1Y2Y2Y_2 Y1=a1exp(μ1T+T−−√X1)Y1=a1exp⁡(μ1T+TX1)Y_1 = a_1 \exp(\mu_1 T + \sqrt{T}X_1) Y2=a2exp(μ2T+T−−√X2)Y2=a2exp⁡(μ2T+TX2)Y_2 = a_2 \exp(\mu_2 T + \sqrt{T}X_2) さて、あればおよびX 2 = σ 1 Z 2、Z 1およびZ 2は、線形変換特性から、標準の法線は、我々が得ます:X1=σ1Z1X1=σ1Z1X_1 = \sigma_1 Z_1X2=σ1Z2X2=σ1Z2X_2 = \sigma_1 Z_2Z1Z1Z_1Z2Z2Z_2 Y1=a1exp(μ1T+T−−√σ1Z1)Y1=a1exp⁡(μ1T+Tσ1Z1)Y_1 = a_1 \exp(\mu_1 T + \sqrt{T}\sigma_1 Z_1) Y2=a2exp(μ2T+T−−√σ2(ρZ1+1−ρ2−−−−−√Z2)Y2=a2exp⁡(μ2T+Tσ2(ρZ1+1−ρ2Z2)Y_2 = a_2 \exp(\mu_2 T + \sqrt{T}\sigma_2 (\rho Z_1 …


1
コサインの類似性、ピアソン相関、およびZスコアの間に関係はありますか?
これらの3つの対策の間に何か関係があるのだろうかと思います。定義を参照することでそれらの間のつながりを作ることができないようです(おそらくこれらの定義に慣れていないので、それらをつかむのに少し苦労しているからです)。 コサインの類似性の範囲は0〜1であり、ピアソン相関の範囲は-1〜1であり、zスコアの範囲は不明です。 ただし、コサイン類似性の特定の値がピアソン相関またはzスコアについてどのように伝えることができるか、またはその逆はどうでしょうか?

3
共線性について話すことができるのはいつですか
線形モデルでは、説明変数間に関係が存在するかどうかを確認する必要があります。それらが過度に相関している場合、共線性があります(つまり、変数は互いに部分的に説明します)。現在、それぞれの説明変数間のペアワイズ相関関係を調べています。 質問1: 相関が高すぎると分類されるものは何ですか?たとえば、ピアソン相関が0.5すぎますか? 質問2: 相関係数に基づいて2つの変数間に共線性があるかどうか、または他の要因に依存しているかどうかを完全に判断できますか? 質問3: 2つの変数の散布図をグラフィカルにチェックすると、相関係数が示すものに何かが追加されますか?

1
帰無仮説の下で交換可能なサンプルの背後にある直感は何ですか?
順列テスト(ランダム化テスト、再ランダム化テスト、または正確なテストとも呼ばれます)は非常に便利で、たとえば、必要な正規分布の仮定がt-test満たされていない場合や、ランク付けによる値の変換時に役立ちますノンパラメトリックテストのようにMann-Whitney-U-test、より多くの情報が失われます。ただし、この種の検定を使用する場合、帰無仮説の下でのサンプルの交換可能性の仮定は1つだけの仮定を見落とすべきではありません。coinRパッケージで実装されているようなサンプルが3つ以上ある場合にも、この種のアプローチを適用できることも注目に値します。 この仮定を説明するために、平易な英語で比fig的な言葉や概念的な直観を使ってください。これは、私のような非統計学者の間で見過ごされているこの問題を明確にするのに非常に役立つでしょう。 注: 置換テストの適用が同じ仮定の下で保持または無効にならない場合に言及することは非常に役立ちます。 更新: 私の地区の地元の診療所から無作為に50人の被験者を収集したとします。彼らは、1:1の比率で薬またはプラセボを無作為に割り当てられました。それらはすべてPar1、V1(ベースライン)、V2(3か月後)、およびV3(1年後)のパラメーター1について測定されました。50個の被験者はすべて、機能Aに基づいて2つのグループにサブグループ化できます。Aポジティブ= 20およびAネガティブ=30。これらは、機能Bに基づいて別の2つのグループにサブグループ化することもできます。Bポジティブ= 15およびBネガティブ=35 。今、私はPar1すべての訪問ですべての被験者からの値を持っています。交換可能性の仮定の下で、次のPar1場合に順列検定を使用するレベルを比較でき ますか?-薬物と被験者をV2でプラセボを投与した被験者と比較する ますか?-機能Aの対象とV2の機能Bの対象を比較しますか? -V2で機能Aを持つ対象とV3で機能Aを持つ対象を比較しますか? -この比較はどのような状況で無効であり、交換可能性の仮定に違反しますか?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
相関係数の式を理解する方法は?
ピアソン相関式の理解を助けてくれる人はいますか?サンプルrrr =変数XXXおよび標準スコアの積の平均YYY。 XXXとを標準化する必要がある理由YYYを理解していますが、zスコアの両方の積を理解する方法はありますか? この式は「製品モーメント相関係数」とも呼ばれますが、製品アクションの根拠は何ですか?質問を明確にしたかどうかはわかりませんが、式を直感的に覚えておきたいだけです。

3
最強の相関を持つデータポイントのサブセットを選択する自動手順
(2つの次元に沿って)最も強い相関を持つ大きなプールからデータポイントのサブセットを選択するための標準的な手順(参照として引用するなど)はありますか? たとえば、100個のデータポイントがあるとします。X次元とY次元に沿って可能な限り強い相関を持つ40ポイントのサブセットが必要です。 これを行うためのコードの記述は比較的簡単だと思いますが、引用するソースがあるかどうか疑問に思っていますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.