タグ付けされた質問 「correlation」

変数のペア間の線形関連の度合いの尺度。

29
教育の例:相関は因果関係を意味しない
「相関は因果関係を意味するものではありません」という古いことわざがあります。私が教えるとき、この点を説明するために次の標準的な例を使用する傾向があります。 デンマークのコウノトリの数と出生率。 アメリカの司祭の数とアルコール依存症; 20世紀の初めには、「ラジオの数」と「非常識な亡命者の数」との間に強い相関関係があったことが注目されました。 そして私のお気に入り:海賊は地球温暖化を引き起こします。 しかし、私はこれらの例については何も言及していませんが、面白い一方で、明らかに間違っています。 誰か他の良い例はありますか?


8
既存の変数と定義された相関関係を持つランダム変数を生成します
シミュレーション研究のために、既存の変数に対する事前定義された(母集団)相関を示すランダム変数を生成する必要があります。YYY 私は、に見えたRパッケージcopulaとCDVine特定の依存構造を持つランダムな多変量分布を生成することができました。ただし、結果の変数の1つを既存の変数に修正することはできません。 アイデアや既存の機能へのリンクを歓迎します! 結論: さまざまなソリューションで、2つの有効な答えが出ました。 カラカルによるR スクリプト。事前定義された変数との正確な(サンプル)相関を持つランダム変数を計算します 事前定義された変数に対する定義された母集団相関を持つランダム変数を計算するR 関数 [@ttnphnsの追加:質問のタイトルを単一の固定変数の場合から任意の数の固定変数に拡大するために自由を取りました。すなわち、いくつかの固定された既存の変数と事前定義された相関を持つ変数を生成する方法]



1
どの相関関係が行列を特異にし、特異点またはほぼ特異点の意味は何ですか?
私はさまざまな行列(主にロジスティック回帰)でいくつかの計算を行っていますが、一般的に「行列は特異です」というエラーが表示されます。ここでの私の質問は、「高度な」相関行列とは何だと思いますか?この単語を表す相関のしきい値はありますか?変数が別の変数と相関している0.97のように、これは行列を特異にするのに十分な「高」ですか? 質問が非常に基本的なものである場合、おthisび申し上げますが、この問題について言及している参考資料を見つけることができませんでした(参考資料へのヒントは大きなプラスになります!)。

4
見て、あなたは見つける(相関関係)
数百の測定値があります。今、私は何らかのソフトウェアを利用して、すべてのメジャーをすべてのメジャーに関連付けることを検討しています。これは、数千の相関があることを意味します。これらの中には、データが完全にランダムである場合でも(統計的に)高い相関があります(各メジャーには約100個のデータポイントしかありません)。 相関関係を見つけた場合、相関関係を探したときの情報をどのように含めることができますか? 私は統計のレベルが高いわけではありませんので、ご容赦ください。

8
AとBがCと相関している場合、なぜAとBは必ずしも相関しないのですか?
私は経験的にそれが事実であることを知っています。この難問にぶつかるモデルを開発しました。また、必ずしもyes / noの答えではないのではないかと思います。つまり、AとBの両方がCと相関している場合、これはAとBの間の相関に関して何らかの意味を持つかもしれません。しかし、この意味は弱いかもしれません。それは単なる標識の方向であり、他には何もないかもしれません。 これが私が意味することです... AとBの両方がCと0.5の相関関係を持っているとしましょう。それを考えると、AとBの間の相関関係は1.0になります。0.5またはそれ以下になることもあると思います。しかし、マイナスになる可能性は低いと思います。それに同意しますか? また、標準のピアソン相関係数を検討している場合、または代わりにスピアマン(ランク)相関係数を検討している場合、影響はありますか?私の最近の経験的観測は、スピアマン相関係数に関連付けられていました。

4
相関のある乱数を生成する方法(与えられた平均、分散、相関度)
これが少し基本的すぎるように思える場合は申し訳ありませんが、ここで理解を確認しようとしているだけだと思います。2つのステップでこれを行う必要があるという感覚が得られ、相関行列を理解しようとし始めましたが、実際には複雑に見え始めています。相関乱数を生成するための、理想的で迅速な優れた方法の簡潔な説明を(理想的には擬似コードソリューションへのヒントとともに)探しています。 既知の平均と分散を持つ2つの疑似ランダム変数の高さと重み、および特定の相関関係を考えると、この2番目のステップがどのように見えるかを基本的に理解しようとしていると思います。 height = gaussianPdf(height.mean, height.variance) weight = gaussianPdf(correlated_mean(height.mean, correlation_coefficient), correlated_variance(height.variance, correlation_coefficient)) 相関平均と分散を計算するにはどうすればよいですか?しかし、ここで本当に関連する問題であることを確認したいと思います。 マトリックス操作に頼る必要がありますか?それとも、この問題に対する基本的なアプローチに何か他の非常に間違ったものがありますか?


4
XとXYのランダム変数間の相関係数が0.7になる傾向があるのはなぜですか
ダグラス・アルトマンが285ページで書いている医学研究のための実践統計から取られた: ... XとYの2つの数量について、XはXYと相関します。実際、XとYが乱数のサンプルであっても、XとXYの相関関係は0.7であると予想されます。 私はRでこれを試しましたが、そうであるようです: x <- rnorm(1000000, 10, 2) y <- rnorm(1000000, 10, 2) cor(x, x-y) xu <- sample(1:100, size = 1000000, replace = T) yu <- sample(1:100, size = 1000000, replace = T) cor(xu, xu-yu) 何故ですか?この背後にある理論は何ですか?

4
相関= 0.2は、「5人に1人だけ」の関連があることを意味しますか?
In The Indiot Brain:A Neuroscientist Explains What Your Head are Real Up To、ディーン・バーネットは書いている 高さと知性の間の相関は通常約あるものとして引用さ高さと知性だけで関連しているように見えるという意味、で人。0.20.20.2111555 私には、これは間違っているように聞こえます:その人について知っている唯一のものが他の測定値(ここでは身長)である場合、一方の測定値(ここでは知性)を予測しようとするときに生じるエラー(より少ない)のような相関関係を理解し​​ています。相関がまたは場合、予測にエラーはありません。相関が場合、さらにエラーがあります。したがって、相関関係は、人に人だけでなく、誰にも適用されます。111−1−1-10.80.80.8111555 私はこの質問を見てきましたが、答えを理解するには数学の面で十分ではありません。線形関係の強さについて語るこの回答は、私の理解ではあるが確かではないように思われる。

3
時系列でピアソン相関を正しく使用する方法
2つの時系列(両方とも滑らか)があるので、相互相関を調べて、それらの相関関係を確認します。 ピアソン相関係数を使用するつもりです。これは適切ですか? 2番目の質問は、2つの時系列を好きなようにサンプリングできることです。つまり、データポイントの数を選択できます。これは、出力される相関係数に影響しますか?これを説明する必要がありますか? 説明のため option(i) [1, 4, 7, 10] & [6, 9, 6, 9, 6] option(ii) [1,2,3,4,5,6,7,8,9,10] & [6,7,8,9,8,7,6,7,8,9,8,7,6]

3
対数変換された予測子および/または応答の解釈
従属変数のみ、従属変数と独立変数の両方、または独立変数のみが対数変換されるかどうかの解釈に違いがあるのか​​と思います。 の場合を考えます log(DV) = Intercept + B1*IV + Error IVはパーセントの増加として解釈できますが、 log(DV) = Intercept + B1*log(IV) + Error または私が持っているとき DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.