タグ付けされた質問 「correlation」

変数のペア間の線形関連の度合いの尺度。

2
R初心者向けのアイテム分析
20項目のマルチプル選択テストを評価しようとしています。この例で見られるようなアイテム分析を実行したいと思います。したがって、質問ごとに、P値、合計との相関、および選択したオプションの分布が必要です。 さまざまな統計ソフトウェアパッケージについては何も知りませんが、プログラミングに慣れており、Rはオープンソースであるため、Rを使用したいと思います。私が想定している擬似ワークフローは次のとおりです。 Excelでデータを準備し、CSVにエクスポートする Rにデータをロードする 必要なことを行うパッケージをロードする そのパッケージのコマンドを実行する エクスポートとレポート。 私は1と2には自信がありますが、おそらくCRANで閲覧したパッケージを比較する統計用語がないので、3には問題があります。 ltm適切なパッケージになりそうですが、私にはわかりません。どのパッケージを使用しても、コマンドはどうなりますか? サイドの質問:リンクされた例では、MCとMIは何を表していると思いますか?

3
相関行列を計算するときに欠損値のある観測を削除することで深刻な問題はありますか?
2500の変数と142の観測値のような巨大なデータセットがあります。 変数Xと残りの変数の間の相関関係を実行したいと思います。しかし、多くの列では、エントリが不足しています。 「ペアワイズ完全」引数(use=pairwise.complete.obs)を使用してRでこれを実行しようとすると、一連の相関が出力されました。しかし、StackOverflowの誰かがこの記事http://bwlewis.github.io/covar/missing.htmlへのリンクを投稿したため、Rの「pairwise-complete」メソッドが使用できなくなっています。 私の質問:「ペアワイズコンプリート」オプションを使用するのが適切な場合はどうすればわかりますか? 私がuse = complete.obs戻ってきたno complete element pairsので、それが何を意味するのかを説明できれば、それは素晴らしいことです。

2
序数と連続確率変数の間の関連の強さのノンパラメトリック測定
私はそれを受け取ったのでここに問題を投げています。 2つの確率変数があります。1つは連続(Y)で、もう1つは離散で序数(X)として処理されます。クエリと共に受け取ったプロットの下に置きます。 データを送ってくれた人は、 XとYの関連性の強さを測定したいと考えています。データを生成したプロセスについての仮定が前に詰め込まれていないアイデアを探しています。これは、関係の強さをテストするための非パラメトリックな方法を見つけることではなく(ブートストラップなど)、それを測定する非パラメトリックな方法を見つけることに注意してください。 一方、データポイントが多いため、効率は問題になりません。

2
「部分的」および「限界的」相関の名前の背後にある直観
2つの変数間の条件付き相関が「部分」相関と呼ばれ、それらの間の単純な相関(他の変数で条件付けされていない場合)が「限界」相関と呼ばれる理由について誰かが知っていますか?「部分的」および「限界的」という言葉の背後にある直観は何ですか?彼らは「パーツ」や「マージン」をどのように扱いますか? これらの概念をよりよく理解するには、答えを学ぶのが良いでしょう。

1
指数確率変数の達成可能な相関
指数分布の確率変数とのペアの達成可能な相関の範囲は何ですか。ここで、はレートパラメータ?X1∼Exp(λ1)X1∼Exp(λ1)X_1 \sim {\rm Exp}(\lambda_1)X2∼Exp(λ2)X2∼Exp(λ2)X_2 \sim {\rm Exp}(\lambda_2)λ1,λ2>0λ1,λ2>0\lambda_1, \lambda_2 > 0

2
スピアマンの相関がピアソンよりも明確な量が少ない場合、それは何を示していますか?
関連するデータセットがたくさんあります。それらのペア間のピアソン相関は通常、スピアマン相関よりも明らかに大きくなります。これは、相関関係が線形であることを示唆していますが、ピアソンとスピアマンが同じであったとしても、予想されるかもしれません。ピアソンとスピアマンの相関関係に明確なギャップがあり、ピアソンが大きい場合、それはどういう意味ですか?これは、私のデータセット全体で一貫した機能のようです。


2
非二項名目変数と順序変数または数値変数の相関係数
私は問題の答えを見つけるためにこのサイトのすべてのページをすでに読んでいますが、誰も私から正しいものではないようです... まず、私が扱っているデータの種類について説明します... 300人のユーザーごとに1つずつ、複数の都市名を持つ配列ベクトルがあるとします。また、別の配列ベクトルを使用して、各ユーザーの調査に対するスコアの応答または各ユーザーの継続的な値を取得しています。 これらの2つの変数の相関関係を計算する相関係数が存在するかどうかを知りたいので、名義変数と数値変数 私はインターネットで検索しましたが、いくつかのページでは、偶発係数またはCramerのVまたはLambda係数またはEtaを使用するように提案されています。この測定値のそれぞれについて、名目変数と区間変数または数値変数があるようなデータに適用できると言ってください。問題は、検索して検索し、それらのすべてを理解しようとすることですが、Cramer's Vを除いて、二項公称変数がある場合にそれらを使用するのが合理的である例が書かれている、または見られていることもあります。データのタイプ。他の多くのページでは、代わりに回帰を適用するのが正しいと言っていますが、そうですが、この種類のデータにピアソン/スピアマンのような係数があるかどうかを知りたいだけです。 また、都市はソートできないため、Spearman Correlation coeffを使用するのはそれほど適切ではないと思います。 私はCramer'sVとEtaの関数も自分で作成しました(私はMatlabを使用しています)が、Etaについては係数が統計的に有意であるかどうかを確認するためにp値について話しません... matlabWorksサイトには、eta ^ 2を計算するように指示する素晴らしいツールボックスもありますが、必要な入力の種類は理解できません。 ここに私のようなテストをした人はいますか?私が使用しているデータの種類を理解するためにさらに詳細が必要な場合は、私に尋ねてください。私はあなたをよりよく説明しようとします。

4
XとXYの相関
2つの独立したランダム変数XとYがある場合、Xと積XYの間にはどのような相関関係がありますか?これが不明な場合は、XとYの平均がゼロで正常であるという特定のケースで何が起こるかを理解することに興味があります。

2
時系列データの空間的自己相関
一連のポリゴン(約200の不規則な形状の連続したポリゴン)の種の数の年間数の20年のデータセットがあります。私は回帰分析を使用して、各ポリゴンの傾向(1年あたりの数の変化)と、管理境界に基づくポリゴンデータの集約を推測しています。 データに空間的自己相関があると確信しています。これは、集約されたデータの回帰分析に影響を与えます。私の質問は-時系列データのSACテストを実行するにはどうすればよいですか?毎年の回帰の残差のSAC(グローバルモランI)を確認する必要がありますか?または、すべての年で1つのテストを実行できますか? はい、SACがあることをテストしたら、これに対処するのは簡単でしたか?私の統計の背景は最小限であり、私が時空間モデリングで読んだすべては非常に複雑に聞こえます。Rに距離重み付けされた自己共変量関数があることを知っています-これは使用するのが簡単ですか? 私はこの問題についてSACを評価/追加する方法について非常に混乱しており、提案、リンク、または参考資料をいただければ幸いです。前もって感謝します!

2
2つの名義変数間の相関測定をどのようにして見つけますか?
人々が自分の出身国を表すために特定のスマイリーを使用するものを選択し、出身国に入る調査が行われました。テキスト応答を数値に再コーディングしました。 人々がどこから来たのかと彼らが選択した表現との間の相関のレベルをチェックするために、どのような形式の分析を使用する必要があります(できればSPSS)。

3
因子分析の前提条件は何ですか?
[クラシック、線形] 因子分析(FA)、特にFAの前(および場合によっては後で)に行われる仮定を本当に理解しているかどうかを確認したいと思います。 一部のデータは最初に相関する必要があり、それらの間には可能な線形関係があります。因子分析を行った後、データは通常分布され(各ペアの2変量分布)、因子(共通と詳細)の間に相関はなく、1つの因子の変数と他の因子の変数の間に相関はありません。 それが正しいか?

1
rのフィッシャーzへの変換はメタ分析にメリットがありますか?
通常、はフィッシャーzに変換され、2つのr値の差をテストします。しかし、メタ分析を実行する場合、なぜそのようなステップを踏む必要があるのでしょうか。測定誤差または非サンプリング誤差を修正しますか?また、rが母相関の不完全な推定であると仮定する必要があるのはなぜですか?rrrzzzrrrrrr

7
相関関係が因果関係を意味しない場合、2つの変数間の相関関係を知ることの価値は何ですか?
ビジネスオーナー(またはマーケティングまたは散布図を理解している人)が2つの変数の散布図を表示しているとしましょう:過去5年間(またはより多くのサンプルがあります。これを作成しました)。 今、彼/彼女は散布図を見て、相関係数(corr)が次のようであると伝えられます: 1または 0.5または 0.11または 0または -0.75または -1 基本的に有効な値 corr 質問:これは、意思決定者や散布図の消費者にとってどのような意味がありますか?これだけに基づいてどのような決定を下すことができますか? つまり、任意の2つの変数間の相関関係を確認する用途は何ですか。また、その情報を単独で使用して何ができるのでしょうか。回帰分析に含めるために何を考慮すべきか、何を考慮しないかを確認するためだけのものですか、それとももっと実用的な用途がありますか? 興味津々ですが、私はいつもこのテクニックを使用してきましたが、相関関係だけではあまり役に立たないと言われています。

3
-on-
でa = 1.6およびb = 0.4の回帰モデルがあり、相関係数はr = 0.60302です。Y= a + b XY=a+bXY = a + bXa = 1.6a=1.6a = 1.6b = 0.4b=0.4b=0.4r = 0.60302r=0.60302r = 0.60302 場合及びYはその後の周りに切り替えられると方程式となるX = C + D Y C = 0.4545及びD = 0.9091、それはまた持っているのRの値0.60302を。バツXXYYYバツ= c + dYX=c+dYX = c + dYc = 0.4545c=0.4545c=0.4545d= 0.9091d=0.9091d=0.9091rrr0.603020.603020.60302 も0.60302である理由を誰かが説明できることを願っています。(d× b )0.5(d×b)0.5(d\times b)^{0.5}0.603020.603020.60302

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.