タグ付けされた質問 「spearman-rho」

スピアマンの順位相関係数、通常は次のように表されます ρは、2つの確率変数間の一致の尺度です。


4
非正規データとのピアソンまたはスピアマンの相関
統計コンサルティングの仕事でこの質問を頻繁に受け取っているので、ここに投稿したいと思いました。答えは下にありますが、他の人の意見を聞きたいと思いました。 質問:正規分布していない2つの変数がある場合、相関にスピアマンのrhoを使用する必要がありますか?



5
連続変数とカテゴリー変数(名義変数)の相関
連続(従属変数)変数とカテゴリ(名目:性別、独立変数)変数の間の相関関係を見つけたいと思います。連続データは通常は配布されません。以前は、スピアマンのを使用して計算していました。しかし、私はそれが正しくないと言われました。ρρ\rho インターネットで検索しているときに、箱ひげ図がそれらがどの程度関連付けられているかについてのアイデアを提供できることがわかりました。ただし、ピアソンの積率係数やスピアマンのなどの定量化された値を探していました。これを行う方法について私を助けてもらえますか?または、どの方法が適切かを教えてください。ρρ\rho Point Biserial Coefficientは正しいオプションでしょうか?

3
Goodman-KruskalガンマとKendall tauまたはSpearman rho相関はどのように比較されますか?
私の仕事では、いくつかのデータセットについて、予測されたランキングと実際のランキングを比較しています。最近まで、Kendall-Tauを単独で使用していました。同様のプロジェクトに取り組んでいるグループは、代わりにGoodman-Kruskal Gammaを使用しようとし、彼らがそれを好むことを提案しました。ランクの異なる相関アルゴリズムの違いは何なのかと思いまして。 私が見つけた最高の答えは、スピアマンが通常の線形相関の代わりに使用され、ケンドール-タウは直接的ではなく、グッドマン-クラスカルガンマにより似ていると主張するこの答えでした。私が使用しているデータには、明らかな線形相関はないようです。また、データは大きく歪んでおり、正常ではありません。 また、スピアマンは通常、データについてケンドール・タウよりも高い相関性を報告しており、データについて具体的に何を言っているのか疑問に思っていました。私は統計学者ではないので、これらのことについて読んでいる論文のいくつかは、私には専門用語のように見えます、ごめんなさい。



1
ランクが相関している場合にのみ、ランダム変数は相関していますか?
は有限の2次モーメントを持つ連続ランダム変数であると仮定します。スピアマンの順位相関係数ρ_sの母集団バージョンは、確率積分変換F_X(X)およびF_Y(Y)のピアソンの積モーメント係数ρとして定義できます。ここで、F_X、F_YはXおよびYの累積分布関数です。ρ S F X(X )F Y(Y )F X、F Y X Yバツ、Yバツ、YX,Yρsρsρ_sFバツ(X)Fバツ(バツ)F_X(X)FY(Y)FY(Y)F_Y(Y)Fバツ、FYFバツ、FYF_X,F_YバツバツXYYY ρs(X、Y)= ρ(F(X)、F(Y))ρs(バツ、Y)=ρ(F(バツ)、F(Y))ρ_s(X,Y)=ρ(F(X),F(Y))。 私は一般的にそれを結論付けることができるのだろうか ρ(X、Y)≠ 0 ↔ ρ(F(X),F(Y))≠ 0ρ(バツ、Y)≠0↔ρ(F(バツ)、F(Y))≠0ρ(X,Y)≠0↔ρ(F(X),F(Y))≠0? すなわち、ランク間に線形相関がある場合にのみ線形相関がありますか? 更新:コメントには2つの例が示されています。 ρ(Fバツ(X)、FY(Y))= 0 → ρ (X、Y)= 0ρ(Fバツ(バツ)、FY(Y))=0→ρ(バツ、Y)=0\rho(F_X(X),F_Y(Y))=0\rightarrow \rho(X,Y) = 0 バツバツXとYYY分布が同じであっても、一般には当てはまりません。したがって、質問は次のように再定式化する必要があります。 ρ(X、Y)= 0 → ρ (Fバツ(X)、FY(Y))ρ(バツ、Y)=0→ρ(Fバツ(バツ)、FY(Y))\rho(X,Y) = 0 \rightarrow \rho(F_X(X),F_Y(Y))? バツバツXとYYYが同じ分布を持っている場合、これがtrue / falseであるかどうかも非常に興味深いです。 (注:バツバツXとYYYが正の象限依存、つまりδ(x、y)= Fバツ、Y(x 、y)− Fバツ(x )FY(y)> 0δ(バツ、y)=Fバツ、Y(バツ、y)−Fバツ(バツ)FY(y)>0δ(x,y)=F_{X,Y}(x,y)−F_X(x)F_Y(y)>0場合、Hoeffdingの共分散式Co v …

3
ピアソンがパラメトリックでスピアマンがノンパラメトリックである理由
どうやらピアソンの相関係数はパラメトリックであり、スピアマンのローはノンパラメトリックです。 これを理解するのに苦労しています。私が理解しているように、ピアソンはr x y = c o v (X 、Y )として計算されます と我々は彼らのランクですべての値を代入以外スピアマンは、同じ方法で計算されます。rx y= c o v (X、Y)σバツσyrバツy=cov(バツ、Y)σバツσy r_{xy} = \frac{cov(X,Y)}{\sigma_x\sigma_y} ウィキペディアによると パラメトリックモデルとノンパラメトリックモデルの違いは、前者には固定数のパラメーターがあり、後者にはトレーニングデータの量に応じてパラメーターの数が増えることです。 しかし、サンプル自体以外のパラメーターは表示されません。いくつかの発言パラメトリック検定は、正規分布を仮定し、するために行くことを言うピアソンは、通常の分散データを前提としないことが、私はピアソンはそれを必要とする理由を見ることができません。 だから私の質問は、統計の文脈でパラメトリックとノンパラメトリックが何を意味するのですか?そして、ピアソンとスピアマンはどうやってそこに収まるのでしょうか?

5
実際に使用されている堅牢な相関法はどれですか?
いくつかのロバストな相関手法のパフォーマンスを異なる分布(スキュー、外れ値など)と比較するシミュレーション研究を行う予定です。で堅牢、私は)歪んだ分布、b)の外れ値、およびc)重い尾に対して堅牢であることの理想的なケースを意味します。 ベースラインとしてのピアソン相関に加えて、次のより堅牢な測定を含めることを考えていました。 スピアマンのρρ\rho パーセント曲げ相関(Wilcox、1994、[1]) 最小量は(共分散行列式、最小楕円体cov.mve/ cov.mcdとcor=TRUEオプション) おそらく、ウィンザー化された相関 もちろん、さらに多くのオプションがあります(特に堅牢な回帰手法も含める場合)が、ほとんど使用されている/ほとんど有望なアプローチに限定したいと思います。 現在、3つの質問があります(1つだけお気軽に回答してください)。 他に含めることができる/含めるべき堅牢な相関法はありますか? あなたの分野で実際に 使用されて いる堅牢な相関技術はどれですか?(心理学の研究について言えば、スピアマンの除いて、技術論文以外ではロバストな相関技術を見たことはありません。ブートストラップはますます一般的になっていますが、他のロバストな統計は多かれ少なかれ存在しません)。ρρ\rho すでに知っている複数の相関手法の体系的な比較はありますか? また、上記のメソッドのリストにコメントしてください。 [1]ウィルコックス、RR(1994)。曲げ相関係数のパーセンテージ。Psychometrika、59、601から616まで。

2
ランク相関を使用した正準相関分析
正準相関分析(CCA)は、2つのデータセットの線形結合の通常のピアソンの積率相関(すなわち線形相関係数)を最大化することを目的としています。 これは、我々はまた、例えば、Spearman-使用する理由は非常に理由である-今、組合の直線のみの措置この相関係数があるという事実を検討またはKendall- τの間の任意のモノトーンを測定する(ランク)相関係数(必ずしも直線的ではない)の接続を変数。ρρ\rhoττ\tau したがって、私は次のことを考えていました:CCAの1つの制限は、目的関数のために、形成された線形の組み合わせ間の線形の関連付けをキャプチャしようとすることです。それが最大化することによって、ある意味でCCAを拡張することが可能ではないでしょう、Spearman-は、言う代わりPearson-ののR?ρρ\rhorrr そのような手順は、統計的に解釈可能で意味のあるものにつながりますか?(たとえば、ランクでCCAを実行することは理にかなっていますか?)非正常なデータを処理するときに役立つかどうか疑問に思っています...

1
lmerモデルに使用する多重比較方法:lsmeansまたはglht?
1つの固定効果(条件)と2つのランダム効果(被験者内のデザインとペアによる参加者)を含む混合効果モデルを使用して、データセットを分析しています。モデルはlme4パッケージで生成されました:exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp)。 次に、固定効果(条件)のないモデルに対してこのモデルの尤度比検定を実行しましたが、有意差があります。データセットには3つの条件があるため、多重比較を行いたいのですが、どの方法を使用すればよいかわかりません。CrossValidatedや他のフォーラムで同様の質問をいくつか見つけましたが、それでもかなり混乱しています。 私が見たものから、人々は使用することを提案しました 1.lsmeansパッケージ- lsmeans(exp.model,pairwise~condition)私に次のような出力が得られます。 condition lsmean SE df lower.CL upper.CL Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552 Confidence level used: 0.95 $contrasts contrast estimate SE df t.ratio p.value Condition1 - Condition2 -0.04893538 0.03813262 62.07 -1.283 0.4099 Condition1 - …

4
スピアマン相関の次の2つの式の等価性を証明する
ウィキペディアから、スピアマンのランク相関は、変数およびをランク変数およびに変換し、ランク変数間のピアソンの相関を計算することにより計算されます。XiXiX_iYiYiY_ixixix_iyiyiy_i ただし、この記事では、変数と間に関係がない場合、上記の式はXiXiX_iYiYiY_i ここで、、ランクの差。di=yi−xidi=yi−xid_i = y_i - x_i 誰かがこれの証拠をお願いできますか?ウィキペディアの記事で参照されている教科書にアクセスできません。

1
順序変数と連続変数の間の相関を正しく評価する方法は?
以下の間の相関関係を推定したいと思います。 順序変数:被験者は、6種類の果物に対する好みを1〜5のスケール(非常に不快なものから非常においしいものまで)で評価するよう求められます。平均して、被験者はスケールの3ポイントのみを使用します。 連続変数:同じ被験者にこれらの果物をすばやく特定するように依頼します。これにより、6つの果物の平均精度が得られます。 Spearman rhoはこれらのデータを分析するための最良の方法であるか、および/または私が検討できる他の良い方法はありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.