タグ付けされた質問 「pearson-r」

ピアソンの積率相関係数は、2つの変数間の線形関係の尺度です。 X そして Y、+ 1と-1の間の値を与えます。


4
非正規データとのピアソンまたはスピアマンの相関
統計コンサルティングの仕事でこの質問を頻繁に受け取っているので、ここに投稿したいと思いました。答えは下にありますが、他の人の意見を聞きたいと思いました。 質問:正規分布していない2つの変数がある場合、相関にスピアマンのrhoを使用する必要がありますか?

9
xを使用したyとyを使​​用したxの線形回帰の違いは何ですか?
xとyのピアソン相関係数は、pearson(x、y)とpearson(y、x)のどちらを計算しても同じです。これは、xが与えられたyまたはyが与えられたxの線形回帰を行うことは同じであるべきであることを示唆していますが、そうではないと思います。 関係が対称ではない場合に誰かが光を当てることができ、それがどのようにピアソン相関係数に関連するのか(私は常にこれを最適なラインを要約すると考えています)?

3
時系列でピアソン相関を正しく使用する方法
2つの時系列(両方とも滑らか)があるので、相互相関を調べて、それらの相関関係を確認します。 ピアソン相関係数を使用するつもりです。これは適切ですか? 2番目の質問は、2つの時系列を好きなようにサンプリングできることです。つまり、データポイントの数を選択できます。これは、出力される相関係数に影響しますか?これを説明する必要がありますか? 説明のため option(i) [1, 4, 7, 10] & [6, 9, 6, 9, 6] option(ii) [1,2,3,4,5,6,7,8,9,10] & [6,7,8,9,8,7,6,7,8,9,8,7,6]



3
Rのピアソン相関のp値を見つける
Rのピアソン相関のp値を見つけることは可能ですか? ピアソン相関を見つけるために、私は通常これを行います col1 = c(1,2,3,4) col2 = c(1,4,3,5) cor(col1,col2) # [1] 0.8315218 しかし、どのようにしてこのp値を見つけることができますか?

2
縮退
ピアソン相関係数の人口値の2種類の推定量について、私の頭の中にいくつかの混乱がありました。 A. フィッシャー(1915)二変量正規母集団実証するためにあることを示したである負にバイアスの推定量ρバイアスだけ小さいサンプルサイズ(のために実際にかなりの量であることができるが、N &lt; 30)。サンプルrは、ρよりも0に近いという意味でρを過小評価しています。(後者が0または± 1の場合を除き、rは不偏です。)ρのほぼ不偏の推定量がいくつか提案されています。rrrρρ\rhon&lt;30n&lt;30n<30rrrρρ\rho000ρρ\rho000±1±1\pm 1rrrρρ\rhoオルキンとプラット(1958)は修正しました。rrr runbiased=r[1+1−r22(n−3)]runbiased=r[1+1−r22(n−3)]r_\text{unbiased} = r \left [1+\frac{1-r^2}{2(n-3)} \right ] B.回帰では、は対応する母集団のR平方を過大評価していると言われています。または、単回帰で、それはつまり、R 2つの過大評価はρ 2。事実に基づいて、私はそれを言って、多くのテキストを見てきましたrがされ積極相対バイアスにρを絶対値を意味する、:rは遠くからである0よりρ(?その文が真です)。テキストは、サンプル値による標準偏差パラメーターの過大評価と同じ問題であると述べています。観測されたR 2を「調整」するための多くの式が存在しますR2R2R^2r2r2r^2ρ2ρ2\rho^2rrrρρ\rhorrr000ρρ\rhoR2R2R^2人口パラメータに近いWherryの(1931) は最もよく知られています(ただし、最良ではありません)。そのような調整されたr 2 adjのルートはshrunken rと呼ばれます:R2adjRadj2R_\text{adj}^2r2adjradj2r_\text{adj}^2 rrr rshrunk=±1−(1−r2)n−1n−2−−−−−−−−−−−−−−√rshrunk=±1−(1−r2)n−1n−2r_\text{shrunk} = \pm\sqrt{1-(1-r^2)\frac{n-1}{n-2}} 2つの異なる推定量が存在します。非常に異なる:最初のものはrを膨張させ、2番目はrを収縮させます。それらを調整する方法は?1つをどこで使用/報告し、もう1つを報告しますか?ρρ\rhorrrrrr 特に、「縮められた」推定量も(ほぼ)偏りのない「偏りのない」推定値であるが、異なるコンテキストでのみ-回帰の非対称コンテキストであるというのは事実でしょうか。というのは、OLS回帰では、片側(予測子)の値を固定値と見なし、サンプルからサンプルへのランダムエラーなしで対応するためですか?(そして、ここに追加するために、回帰は二変量正規性を必要としません。)

6
3x3相関行列の完成:3つの与えられた2つの係数
私はインタビューでこの質問をされました。 我々は、フォームの相関行列を持っていると言うことができます ⎡⎣⎢10.60.80.61γ0.8γ1⎤⎦⎥[10.60.80.61γ0.8γ1]\begin{bmatrix}1&0.6&0.8\\0.6&1&\gamma\\0.8&\gamma&1\end{bmatrix} この相関行列から、ガンマの値を見つけるように求められました。 固有値はすべて0以上である必要があるため、固有値を使用して何かを実行できると考えました(行列は半正定でなければなりません)-しかし、このアプローチでは答えが得られないと思います。トリックがありません。 同じ問題を解決するためのヒントを教えてください。

1
ランクが相関している場合にのみ、ランダム変数は相関していますか?
は有限の2次モーメントを持つ連続ランダム変数であると仮定します。スピアマンの順位相関係数ρ_sの母集団バージョンは、確率積分変換F_X(X)およびF_Y(Y)のピアソンの積モーメント係数ρとして定義できます。ここで、F_X、F_YはXおよびYの累積分布関数です。ρ S F X(X )F Y(Y )F X、F Y X Yバツ、Yバツ、YX,Yρsρsρ_sFバツ(X)Fバツ(バツ)F_X(X)FY(Y)FY(Y)F_Y(Y)Fバツ、FYFバツ、FYF_X,F_YバツバツXYYY ρs(X、Y)= ρ(F(X)、F(Y))ρs(バツ、Y)=ρ(F(バツ)、F(Y))ρ_s(X,Y)=ρ(F(X),F(Y))。 私は一般的にそれを結論付けることができるのだろうか ρ(X、Y)≠ 0 ↔ ρ(F(X),F(Y))≠ 0ρ(バツ、Y)≠0↔ρ(F(バツ)、F(Y))≠0ρ(X,Y)≠0↔ρ(F(X),F(Y))≠0? すなわち、ランク間に線形相関がある場合にのみ線形相関がありますか? 更新:コメントには2つの例が示されています。 ρ(Fバツ(X)、FY(Y))= 0 → ρ (X、Y)= 0ρ(Fバツ(バツ)、FY(Y))=0→ρ(バツ、Y)=0\rho(F_X(X),F_Y(Y))=0\rightarrow \rho(X,Y) = 0 バツバツXとYYY分布が同じであっても、一般には当てはまりません。したがって、質問は次のように再定式化する必要があります。 ρ(X、Y)= 0 → ρ (Fバツ(X)、FY(Y))ρ(バツ、Y)=0→ρ(Fバツ(バツ)、FY(Y))\rho(X,Y) = 0 \rightarrow \rho(F_X(X),F_Y(Y))? バツバツXとYYYが同じ分布を持っている場合、これがtrue / falseであるかどうかも非常に興味深いです。 (注:バツバツXとYYYが正の象限依存、つまりδ(x、y)= Fバツ、Y(x 、y)− Fバツ(x )FY(y)&gt; 0δ(バツ、y)=Fバツ、Y(バツ、y)−Fバツ(バツ)FY(y)&gt;0δ(x,y)=F_{X,Y}(x,y)−F_X(x)F_Y(y)>0場合、Hoeffdingの共分散式Co v …

3
ピアソンがパラメトリックでスピアマンがノンパラメトリックである理由
どうやらピアソンの相関係数はパラメトリックであり、スピアマンのローはノンパラメトリックです。 これを理解するのに苦労しています。私が理解しているように、ピアソンはr x y = c o v (X 、Y )として計算されます と我々は彼らのランクですべての値を代入以外スピアマンは、同じ方法で計算されます。rx y= c o v (X、Y)σバツσyrバツy=cov(バツ、Y)σバツσy r_{xy} = \frac{cov(X,Y)}{\sigma_x\sigma_y} ウィキペディアによると パラメトリックモデルとノンパラメトリックモデルの違いは、前者には固定数のパラメーターがあり、後者にはトレーニングデータの量に応じてパラメーターの数が増えることです。 しかし、サンプル自体以外のパラメーターは表示されません。いくつかの発言パラメトリック検定は、正規分布を仮定し、するために行くことを言うピアソンは、通常の分散データを前提としないことが、私はピアソンはそれを必要とする理由を見ることができません。 だから私の質問は、統計の文脈でパラメトリックとノンパラメトリックが何を意味するのですか?そして、ピアソンとスピアマンはどうやってそこに収まるのでしょうか?

2
マシューズ相関係数(MCC)の解釈方法
phi、Matthews、Pearsonの相関係数の関係の質問に対する答えは?3つの係数メソッドがすべて同等であることを示しています。 私は統計学者ではないので、簡単な質問です。 マシューズのペーパー(www.sciencedirect.com/science/article/pii/0005279575901099)では次のことを説明しています。 "A correlation of: C = 1 indicates perfect agreement, C = 0 is expected for a prediction no better than random, and C = -1 indicates total disagreement between prediction and observation"`. ウィキペディア(http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient)によると、ピアソンの相関関係は次のように説明されています: giving a value between +1 and −1 inclusive, where: 1 is total positive correlation, …

3
3変数のピアソン相関の類似
3つの変数の「相関」が何かであるかどうかに興味があります。 ピアソンの積率相関係数 E{(X−μX)(Y−μY)}Var(X)Var(Y)−−−−−−−−−−−−√E{(X−μX)(Y−μY)}Var(X)Var(Y)\frac{\mathrm{E}\{(X-\mu_X)(Y-\mu_Y)\}}{\sqrt{\mathrm{Var}(X)\mathrm{Var}(Y)}} ここで、3つの変数の質問:Is E{(X−μX)(Y−μY)(Z−μZ)}Var(X)Var(Y)Var(Z)−−−−−−−−−−−−−−−−−−√E{(X−μX)(Y−μY)(Z−μZ)}Var(X)Var(Y)Var(Z)\frac{\mathrm{E}\{(X-\mu_X)(Y-\mu_Y)(Z-\mu_Z)\}} {\sqrt{\mathrm{Var}(X)\mathrm{Var}(Y)\mathrm{Var}(Z)}} 何か? Rでは、解釈可能なもののように見えます: &gt; a &lt;- rnorm(100); b &lt;- rnorm(100); c &lt;- rnorm(100) &gt; mean((a-mean(a)) * (b-mean(b)) * (c-mean(c))) / (sd(a) * sd(b) * sd(c)) [1] -0.3476942 通常、3番目の変数の値が固定されている2つの変数間の相関関係を調べます。誰かが明確にできますか?

2
共同分布が多変量正規分布である場合、ピアソンのρは関連性の網羅的な尺度にすぎないのはなぜですか?
この主張はこの質問への一番の回答で提起されました。「なぜ」という質問は、新しいスレッドを保証するほど十分に異なると思います。グーグルの「関連性の徹底的な尺度」はヒットを生み出さず、そのフレーズが何を意味するのか分かりません。

1
相関係数の式を理解する方法は?
ピアソン相関式の理解を助けてくれる人はいますか?サンプルrrr =変数XXXおよび標準スコアの積の平均YYY。 XXXとを標準化する必要がある理由YYYを理解していますが、zスコアの両方の積を理解する方法はありますか? この式は「製品モーメント相関係数」とも呼ばれますが、製品アクションの根拠は何ですか?質問を明確にしたかどうかはわかりませんが、式を直感的に覚えておきたいだけです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.