タグ付けされた質問 「correlation」

変数のペア間の線形関連の度合いの尺度。

2
事前に指定されたスパースパターンで対称正定行列を生成します
事前に指定されたスパース構造(ノードのグラフで指定)を使用して相関行列(対称psd)を生成しようとしています。グラフで接続されているノードには相関関係、残りはすべて0、対角線はすべて1です。p×pp×pp\times ppppρ∼U(0,1)ρ∼U(0,1)\rho \sim U(0,1) この行列を何度か生成しようとしましたが、有効な相関行列が得られることはまれです。 相関行列whpを保証する方法はありますか?私は正の相関しか持つことができないので、などはオプションではないことに注意してください。ρ∼U(−1,1)ρ∼U(−1,1)\rho \sim U(-1,1) どんな助けでも大歓迎です!

2
正規性の仮定にもかかわらず、ランクのピアソン相関が有効なのはなぜですか?
私は現在、ピアソン相関の仮定について読んでいます。次のt検定の重要な仮定は、両方の変数が正規分布に由来することです。そうでない場合は、Spearman rhoなどの代替手段の使用が推奨されます。スピアマン相関はピアソン相関のように計算され、XとY自体の代わりにXとYのランクを使用するだけですよね? 私の質問は、ピアソン相関への入力変数を正規分布する必要がある場合、入力変数がランクであるにもかかわらず、スピアマン相関の計算が有効なのはなぜですか?私のランクは確かに正規分布からのものではありません... これまでに出てきた唯一の説明は、ローの有意性はピアソン相関t検定のそれとは異なる方法で検定される可能性があることです(正規性を必要としない方法で)が、これまでのところ式は見つかりませんでした。ただし、いくつかの例を実行した場合、rhoおよびランクのピアソン相関のt検定のp値は常に一致し、最後の数桁を除いて保存します。私にとって、これは画期的に異なる手順のようには見えません。 あなたが持っているかもしれないどんな説明やアイデアもいただければ幸いです!

1
順序付けられたデータの相関係数:ケンドールのタウvsポリコリックvsスピアマンのrho
順序付けられた測定を使用して管理する場合、研究者は通常ポリコリック相関を扱います。(例えば、因子分析を行う前に行列を作成する場合。)なぜそうするのですか? ケンドールタウの順位相関係数とスピアマンの順位相関係数も、順序付けられたデータに適しています。 これらの相関係数の「賛成」と「反対」の点は大歓迎です。

2
カテゴリー名義変数間のカテゴリー間の相関
2つのカテゴリー名義変数(両方とも5つのカテゴリー)を持つデータセットがあります。これらの2つの変数からカテゴリ間の潜在的な相関関係を特定できるかどうか(およびその方法)を知りたいのですが。 言い換えると、たとえば変数1のカテゴリの結果が変数2の特定のカテゴリと強い相関を示すかどうか。5つのカテゴリを持つ2つの変数があるため、すべてのカテゴリの相関分析の合計は25の結果になります。 (少なくともそれが私が望むように/期待するように機能する場合)iiijjj 私は問題を具体的な質問に定式化しようとしました: 質問1:カテゴリ変数を値(カテゴリ)ごとに5つの異なるダミー変数に転送するとします。これと同じ手順を2番目の変数に対しても実行します。次に、ダミーの1.iと2.i(たとえば)の相関関係を調べたいと思います。通常の相関係数手順を使用してこの手順を実行するのは統計的に正しいですか?この手順から得られる相関係数は、2つのダミー変数間の相関関係について適切な洞察を提供しますか? 質問2:質問1で説明されている手順が有効な手順である場合、この分析を2つ(またはそれ以上)のカテゴリ名義変数のすべてのカテゴリに対して一度に実行する方法はありますか? 私が使用しているプログラムはSPSS(20)です。

1
2D点の2つの配列間の相関係数?
2Dポイントの2つの配列があり、それらの相関を推定する必要があります。どんな式を使うべきですか? 配列の例: X:((1,5),(2,5),(1,7),(4,1)),X:((1,5),(2,5),(1,7),(4,1)),X: ((1,5),(2,5),(1,7),(4,1)), Y:((3,4),(1,6),(4,6),(4,3)).Y:((3,4),(1,6),(4,6),(4,3)).Y: ((3,4),(1,6),(4,6),(4,3)).

2
最初のPCで説明される分散の量が平均ペアワイズ相関に非常に近いのはなぜですか?
最初の主成分と相関行列の平均相関との関係は何ですか? たとえば、経験的なアプリケーションでは、平均相関は、全分散(すべての固有値の合計)に対する最初の主成分(最初の固有値)の分散の比率とほぼ同じであることがわかります。 数学的な関係はありますか? 以下は、実験結果のグラフです。ここで、相関は、15日間のローリングウィンドウで計算されたDAX株価指数コンポーネントのリターンの平均相関であり、説明された分散は、同じく15日間のローリングウィンドウで計算された最初の主成分によって説明された分散のシェアです。 これは、CAPMなどの一般的なリスク要因モデルで説明できますか?

3
ピアソンの相関と線形回帰によるボンフェローニ補正
私は5つのIV(5つの性格特性、外向性、快適さ、良心、神経症、開放性)について、PCTに対する態度、CBTに対する態度、PCTに対する態度、CBTに対する統計を実行しています。他にどのような影響があるかを確認するために、年齢と性別も追加しました。 私は、性格特性がDVの態度を予測できるかどうかをテストしています。 私は最初にすべての変数にピアソンの相関を使用しました(45テスト)。 主な発見は、外向性がPCTの態度とp = 0.05で相関していたことでした。しかし、45のテストを実行していたため、アルファ= 0.05 / 45 = 0.001のボンフェローニ補正を実行したため、この結果は重要ではありません。 その後、すべての変数に対して単純な線形回帰を実行しましたが、PCTに対する態度では外向性が有意でした。ボンフェローニ修正を行うと、これは重要ではなくなります。 質問: ピアソンの相関でボンフェローニを修正する必要がありますか? 私がそうし、PCTへの態度を無視した外向性を作る場合、線形回帰を行うことにまだ意味がありますか? 線形回帰を行う場合、これについてもボンフェローニ補正を行う必要がありますか? 修正された値のみ、または修正されていない値と修正された値の両方を報告しますか?


1
統計的有意性を定量化する方法は?
私は統計学に比較的慣れていないので、私の質問は完全に誤解されているかもしれません。私は自分のアルゴリズムを他のものと比較してテストしています。出力は同一ではありませんが、違いが「統計的に取るに足らない」ことを示したいと思います。私の主張をするために、これをどのように定量化できますか?

2
混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックブートストラップ
以下の移植片は、この記事から引用したものです。私はブートストラップの初心者であり、R bootパッケージを使用した線形混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックのブートストラップブートストラップを実装しようとしています。 Rコード これが私のRコードです: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) Out ご質問 …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 


3
Rの行列間の相関
cor()およびcor.test()関数の使用に問題があります。 2つの行列(数値のみで、行と列の数は同じ)があり、相関数と対応するp値が欲しいのです。 使用するcor(matrix1, matrix2)と、すべてのセルの相関係数が得られます。corの結果として単一の番号が欲しいだけです。 さらに、私が行うcor.test(matrix1, matrix2)と次のエラーが発生します Error in cor.test.default(matrix1, matrix2) : 'x' must be a numeric vector 行列のp値を取得するにはどうすればよいですか? ここで、関連付けたい単純なテーブルを見つけます。 http://dl.dropbox.com/u/3288659/table_exp1_offline_MEANS.csv http://dl.dropbox.com/u/3288659/table_exp2_offline_MEANS.csv
9 r  correlation 

3
変数の対数変換の前または後に相関を取る
対数変換を行う前または後に、2つの確率変数XおよびYのピアソン相関を計算する必要があるかどうかに関する一般原則はありますか?より適切なテスト手順はありますか?対数変換は非線形であるため、値は似ていますが異なる値になります。XまたはYがログ後に正常に近いかどうかに依存しますか?もしそうなら、それはなぜ問題なのですか?これは、XとYとlog(X)とlog(Y)の正規性検定を行う必要があることを意味し、それに基づいて、pearson(x、y)がpearson(log(x)、log( y))?

5
ピアソン相関を超えて何ができますか?
2つの変数が相関しているかどうかを確認しているときに、ピアソン相関を適用すると0.1と低い数値が得られ、相関がないことを示しました。この主張を強化するために私にできることはありますか? 私が見ているデータセット(投稿制限のためのサブセット)はこれです: 6162.178176 0.049820046 4675.14432 0.145022261 5969.056896 0.47210138 5357.506176 0.052263122 33.796224 16.45154204 6162.178176 0.064262991 6725.448576 0.419005508 3247.656192 0.867394771 5357.506176 0.052263122 3612.97728 0.091337414 6162.178176 0.053065652 867.436416 0.129116092 556.833024 1.01107509 1517.611392 168.1484478 1517.611392 35.11570899 4675.14432 0.053902079 4182.685056 0.070289777 2808.30528 0.071929502 5969.056896 0.47193385 3247.656192 0.896646636 4387.071744 0.056985619 6273.222912 0.046547047 4387.071744 0.034875199 7946.940672 0.074997414 …

2
上限のある1つの変数を考慮して、どのタイプの回帰を使用しますか?
次のように説明されている実験で、2つの変数(と)間の関係をモデル化するためにどの方法を使用すべきかわかりません。yxxxyyy 3つの変数があります:、および。 x yxaimxaimx_{aim}xxxyyy の値は、実験の操作時に設定されます。ただし、とは常に等しいとは限りません。 x x a i mxaimxaimx_{aim}xxxxaimxaimx_{aim} と間のピアソンの相関係数は約0.9です。 xxaimxaimx_{aim}xxx と間のピアソンの相関係数ははるかに小さく、約0.5です。yxxxyyy y m a xyyyには最大値()があり、これを超えることはできません。ymaxymaxy_{max} 各データポイントは、を設定してとを読み取った後に取得されます。 x yxaimxaimx_{aim}xxxyyy 間のピアソンの相関係数がと大きくないように、それは見え伴って増加する傾向がある。y y xxxxyyyyyyxxx と単純な線形回帰を実行した後(および後者をに変換し直して、たとえばと同じグラフに表示されるようにした後)、両方の勾配陽性であるが、傾きのそれよりも大きい。x = g (y )g − 1 f g − 1 fy=f(x)y=f(x)y=f(x)x=g(y)x=g(y)x=g(y)g−1g−1g^{-1}fffg−1g−1g^{-1}fff またはと言っても意味がありますか?(は、2番目のケースで早く到達します。)x m a x = g (y m a x)x m a xxmax=f−1(ymax)xmax=f−1(ymax)x_{max} = f^{-1}(y_{max})xmax=g(ymax)xmax=g(ymax)x_{max} …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.