タグ付けされた質問 「correlation」

変数のペア間の線形関連の度合いの尺度。

18
説明変数と応答変数が回帰前に個別にソートされるとどうなりますか?
ポイントのデータセットとします。線形回帰を実行したいが、最初に値と値を互いに独立してソートし、データセット形成するn(Xi,Yi)(Xi,Yi)(X_i,Y_i)nnnXiXiX_iYiYiY_i(Xi,Yj)(Xi,Yj)(X_i,Y_j)。新しいデータセットに回帰の意味のある解釈はありますか?これには名前がありますか? これはばかげた質問だと思うので、謝罪します。統計の正式な訓練を受けていません。私の考えでは、これはデータを完全に破壊し、回帰は無意味です。しかし、私のマネージャーは、彼がこれを行うと、「ほとんどの場合、より良い回帰」を得ると言います(ここで「より良い」とは、より予測可能という意味です)。私は彼が自分を欺いていると感じています。 編集:あなたの素敵で忍耐強い例のすべてに感謝します。彼に@ RUser4512と@gungの例を示しましたが、彼は頑固なままです。彼はイライラし、私は疲れ果てています。落ち込んでいるように感じます。すぐに他の仕事を探し始めるでしょう。


8
Facebookは終了しますか?
最近、この論文は多くの注目を集めました(例えばWSJから)。基本的に、著者はFacebookが2017年までにメンバーの80%を失うと結論付けています。 彼らは、疫学でよく使用されるコンパートメントモデルであるSIRモデルの外挿に基づいて主張しています。彼らのデータは「Facebook」のGoogle検索から得られ、著者はMyspaceの終miseを利用して結論を​​検証します。 質問: 著者は「相関は因果関係を暗示するものではない」という間違いを犯していますか?このモデルとロジックはMyspaceで機能していたかもしれませんが、どのソーシャルネットワークでも有効ですか? 更新:Facebookが反撃 「相関は因果関係に等しい」という科学的原則に沿って、私たちの研究は、プリンストンが完全に消滅する危険があることを明確に示しました。 私たちは、プリンストンや世界の空気供給がすぐにどこかへ行くとは考えていません。私たちはプリンストン(と空気)が大好きです」と、「すべての研究が平等に作成されているわけではありません。また、いくつかの分析方法はかなりおかしな結論に導く」という最後のリマインダーを追加します。

6
順序付けされていないカテゴリ変数との相関
多くの観測と多くの変数を含むデータフレームがあります。それらの一部はカテゴリカル(順不同)であり、その他は数値です。 これらの変数間の関連を探しています。私は数値変数の相関(スピアマンの相関)を計算できましたが、 順序付けされていないカテゴリ変数間の相関を測定する方法がわかりません。 順序付けられていないカテゴリ変数と数値変数の相関を測定する方法がわかりません。 誰もこれがどのように行われるか知っていますか?ある場合、これらのメソッドを実装するR関数はありますか?


8
因果関係は相関関係を意味しますか?
相関関係には多くの説明があるため、相関関係は因果関係を意味するものではありません。しかし、因果関係は相関関係を意味しますか?直観的に、因果関係の存在は必然的に何らかの相関関係があることを意味すると思います。しかし、私の直観は常に統計でうまく機能していません。因果関係は相関関係を意味しますか?

4
非正規データとのピアソンまたはスピアマンの相関
統計コンサルティングの仕事でこの質問を頻繁に受け取っているので、ここに投稿したいと思いました。答えは下にありますが、他の人の意見を聞きたいと思いました。 質問:正規分布していない2つの変数がある場合、相関にスピアマンのrhoを使用する必要がありますか?


6
相関と共分散の違いをどのように説明しますか?
この質問に続いて、平均のみを理解している人に共分散をどのように説明しますか?、素人に共分散を説明する問題に対処し、私の心の中で同様の質問を持ち出しました。 共分散と相関の違いを統計初心者にどのように説明しますか?どちらも別の変数にリンクされている1つの変数の変更を参照しているようです。 言及された質問と同様に、式の欠如が望ましいでしょう。


9
xを使用したyとyを使​​用したxの線形回帰の違いは何ですか?
xとyのピアソン相関係数は、pearson(x、y)とpearson(y、x)のどちらを計算しても同じです。これは、xが与えられたyまたはyが与えられたxの線形回帰を行うことは同じであるべきであることを示唆していますが、そうではないと思います。 関係が対称ではない場合に誰かが光を当てることができ、それがどのようにピアソン相関係数に関連するのか(私は常にこれを最適なラインを要約すると考えています)?


16
相関はどのような条件下で因果関係を意味しますか?
私たちは皆、「相関関係は因果関係を意味するものではない」というマントラを知っています。アイデアを説明するための良い例がここにあります。 しかし、相関は因果関係を意味する場合があります。次の例は、このウィキペディアのページから取っています たとえば、テストで一貫して同じグレードを取得することがわかっている一卵性双生児で実験を実行できます。1人の双子は6時間勉強するために送られ、もう1人は遊園地に送られます。彼らのテストスコアが突然大幅に分岐した場合、これは学習(または遊園地に行く)がテストスコアに因果関係を持っているという強力な証拠になります。この場合、学習スコアとテストスコアの相関関係は、ほぼ確実に因果関係を意味します。 相関が因果関係を意味する他の状況はありますか?


3
例:バイナリ結果にglmnetを使用したLASSO回帰
私は興味のある結果が二分されglmnetているLASSO回帰の使用に手を出し始めています。以下に小さな模擬データフレームを作成しました。 age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, 2, 2, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.