タグ付けされた質問 「r」

このタグは、(a)質問の重要な部分または予想される回答として「R」が含まれる* on-topic *の質問に使用します。&(b)「R」の使い方について「*」だけではありません。

2
ロバスト線形モデルの重み付き
MASSパッケージのRを使用してrlm()、MMの重みでロバストな線形モデルを推定しました。`R``はモデルの値を提供しませんが、意味のある量であればR 2が欲しいです。また、ロバスト回帰で観測値に重みが付けられたのと同じ方法で、合計分散と残差を重み付けするR 2値を持つことに意味があるかどうかを知りたいと思っています。私の一般的な考え方は、回帰の目的で、何らかの方法で外れ値であるため、いくつかの推定値の影響が少ない重みを本質的に使用している場合、r 2を計算するためにそれらを与える必要があるかもしれないということです同じ見積もりは影響が少ない?R2R2R^2R2R2R^2r2r2r^2 と重み付きR 2の2つの簡単な関数を書きました。それらは以下にあります。また、HI9と呼ばれる私のモデルに対してこれらの関数を実行した結果も含めました。編集:私は式を与えるUNSWのアデルコスターのウェブページが見つかりそれは両方の計算の計算に重みベクトルを含んでいると、私がやったように、そしてより正式な参照のために彼女に尋ねた:のhttp://web.maths。 unsw.edu.au/~adelle/Garvan/Assays/GoodnessOfFit.html(この重み付けされたr 2の解釈方法については、Cross Validatedからのヘルプを引き続き探しています。)R2R2R^2R2R2R^2R2SSeSStr2r2r^2 #I used this function to calculate a basic r-squared from the robust linear model r2 <- function(x){ + SSe <- sum((x$resid)^2); + observed <- x$resid+x$fitted; + SSt <- sum((observed-mean(observed))^2); + value <- 1-SSe/SSt; + return(value); + } r2(HI9) [1] 0.2061147 #I …

1
LDA決定境界の計算とグラフ化
The Statistics Learning of Elementsの決定境界を持つLDA(線形判別分析)プロットを見ました。 データは低次元の部分空間に投影されることを理解しています。ただし、元の次元で決定境界を取得する方法を知りたいので、決定境界を低次元のサブスペースに投影できます(上の画像の黒い線のように)。 元の(より高い)次元の決定境界を計算するために使用できる式はありますか?はいの場合、この式にはどのような入力が必要ですか?


1
Rの「マルチノム」のp値の取得(nnetパッケージ)
パッケージのmultinom関数を使用してp値を取得するにはどうすればよいですか?nnetR 結果変数として「病理スコア」(不在、軽度、重度)、および2つの主な効果で構成されるデータセットがあります。 ATB1;感染+ ATB2;感染+ ATB3)。 最初に、順序変数回帰モデルを適合させようとしました。これは、私の従属変数(順序)の特性を考えると、より適切と思われます。ただし、オッズの比例性の仮定は(グラフィック的に)大きく違反しているため、代わりにnnetパッケージを使用して多項モデルを使用する必要がありました。 最初に、ベースラインカテゴリとして使用する必要がある結果レベルを選択しました。 Data$Path <- relevel(Data$Path, ref = "Absent") 次に、独立変数のベースラインカテゴリを設定する必要がありました。 Data$Age <- relevel(Data$Age, ref = "Twenty") Data$Treat <- relevel(Data$Treat, ref="infected without ATB") モデル: test <- multinom(Path ~ Treat + Age, data = Data) # weights: 18 (10 variable) initial value 128.537638 iter 10 value 80.623608 final …

1
Rのglmでの「NA」値の処理方法
データテーブルT1があり、これには約1000個の変数(V1)と約2億個のデータポイントが含まれています。データはまばらで、ほとんどのエントリはNAです。各データポイントには、他と区別するための一意のIDと日付のペアがあります。 別の変数セット(V2)を含む別のテーブルT2があります。このテーブルには、T2のエントリを一意に識別するIDと日付のペアもあります。 T1のデータを使用して、T2の変数の値を予測できると思われます。 これを証明するために、Rに「glm」モデルを適用し、T1の変数に依存するT2の変数を本当に見つけることができるかどうかを確認することを考えました。 T2の各変数について、同じidと日付のペアを持つT1のすべてのデータを引き出し始め、テスト変数のいくつかについて、はるかに小さい〜50Kデータポイントになりました。 glmの適用で今直面している問題は次のとおりです。 場合によっては、「フィットが見つかりません」というエラーと「glm.fit:アルゴリズムが収束しませんでした」という警告が表示されます。なぜ表示されるのか分かりませんか? NAはglmでどのように扱われますか?最初に「NA」を含むすべてのレコードを削除してから、フィッティングを実行しますか? 最初にすべてのNAを削除してから「glm」を呼び出すのは良い戦略ですか?それらのほとんどがNAであるため、これによりデータポイントが大幅に削減される可能性があることを恐れています。 係数の計算に使用される方法。出力がどのように計算されるかを議論するウェブサイト、論文、または本を見つけることができませんでした。 「NA」を使用して、または使用せずにglmをテストし、データをフィッティングする際にNAが考慮される点について、difftの回答を見つけました。 例1: > tmpData x1 x2 x3 Y 1 1 1 1 3 2 1 0 4 5 3 1 2 3 6 4 0 3 1 4 Call: glm(formula = as.formula(paste(dep, " ~ ", paste(xn, collapse = "+"))), na.action …

2
ロジスティック回帰におけるカテゴリカル予測子の重要性
ロジスティック回帰のカテゴリ変数のz値の解釈に問題があります。以下の例では、3つのクラスを持つカテゴリ変数があり、z値に応じて、CLASS2が関連する場合とそうでない場合があります。 しかし、これはどういう意味ですか? 他のクラスを1つにマージできますか? 変数全体が良い予測子ではないかもしれないということですか? これは単なる例であり、ここでの実際のz値は実際の問題からのものではなく、それらの解釈に問題があるだけです。 Estimate Std. Error z value Pr(>|z|) CLASS0 6.069e-02 1.564e-01 0.388 0.6979 CLASS1 1.734e-01 2.630e-01 0.659 0.5098 CLASS2 1.597e+00 6.354e-01 2.514 0.0119 *


3
「混合モデル」の3つの形式の解釈
混合モデルで私をつまずかせている区別があり、私はそれを明確にすることができるかどうか疑問に思っています。カウントデータの混合モデルがあるとします。固定効果(A)と時間の別の変数(T)として必要なことがわかっている変数があり、「サイト」変数でグループ化されています。 私が理解したように: glmer(counts ~ A + T, data=data, family="Poisson") 固定効果モデルです。 glmer(counts ~ (A + T | Site), data=data, family="Poisson") ランダム効果モデルです。 私の質問は次のようなものがあるときです。 glmer(counts ~ A + T + (T | Site), data=data, family="Poisson")Tとは?ランダム効果ですか?固定効果?Tを両方の場所に置くことで実際に何が達成されますか? ときに何かがなければならない唯一のモデル式のランダムなエフェクト・セクションに表示されますか?



1
ブートストラップ配布の標準エラーの使用
(私の主な質問は言語に依存しないため、必要に応じてRコードを無視します) 単純な統計(例:平均)の変動性を調べたい場合、次のような理論を介してそれを行うことができます。 x = rnorm(50) # Estimate standard error from theory summary(lm(x~1)) # same as... sd(x) / sqrt(length(x)) または次のようなブートストラップで: library(boot) # Estimate standard error from bootstrap (x.bs = boot(x, function(x, inds) mean(x[inds]), 1000)) # which is simply the standard *deviation* of the bootstrap distribution... sd(x.bs$t) しかし、私が疑問に思っているのは、特定の状況でブートストラップディストリビューションの標準エラーを調べることは有用/有効ですか?私が扱っている状況は、次のような比較的ノイズの多い非線形関数です。 # Simulate dataset set.seed(12345) …

8
Rを使用した混合型データのクラスタリング
ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け入れていません。 データ変数が混在するデータのクラスタリングをR内で実行できるかどうか疑問に思います。つまり、数値変数とカテゴリ変数の両方を含むデータセットがあり、それらをクラスター化する最適な方法を見つけています。SPSSでは、2ステップクラスターを使用します。Rで同様の手法を見つけることができるかどうか疑問に思います。poLCAパッケージについて言われましたが、よくわかりません...

1
Rでの複数のメディエーション分析
Rで複数のメディエーションモデルを実行する方法を誰かが知っているのではないかと思っています。メディエーションパッケージでは複数の単純なメディエーションモデルを使用できますが、複数のメディエーションモデルを同時に評価する1つのモデルを実行したいと思います。 私はこれをSEMフレームワーク(パス分析)で行うことができると仮定していますが、複数のメディエーターのメディエーション分析に典型的な統計を計算するパッケージの新しい人(間接効果、メディエーションによるトータル効果の割合など)、ブートストラップを利用できます。私はこれが長いショットであることを知っていますが、ゼロから開発する時間を投資する前に尋ねるべきだと思いました。 更新日:(11/11/2013) 数年前にこの質問をして以来、私は素晴らしいRパッケージlavaanを使用して複数の調停を行うことを学びました。 コードの例を次に示します。 model <- ' # outcome model outcomeVar ~ c*xVar + b1*medVar1 + b2*medVar2 # mediator models medVar1 ~ a1*xVar medVar2 ~ a2*xVar # indirect effects (IDE) medVar1IDE := a1*b1 medVar2IDE := a2*b2 sumIDE := (a1*b1) + (a2*b2) # total effect total := c + (a1*b1) …

3
lm()とrlm()の違いは何ですか?
この質問は、相互検証で回答できるため、Stack Overflowから移行されました。 8年前に移行され ました。 ライブラリで「線形モデルのロバスト近似」rlm() 関数MASSを見つけました。 この関数と標準線形回帰関数の違いを知りたいlm()です。 誰かが簡単な説明をくれますか?
19 r  regression 

2
2つの被験者内因子について、Rのlme / lmerを使用した反復測定ANOVA
パッケージから使用lmeして、反復測定ANOVAのnlme結果を複製しようとしていますaov。これは、単一因子の反復測定実験と、被験者間因子と被験者内因子を1つずつ含む2因子実験で行いましたが、2因子を含む2因子実験ではうまくいきません。 -対象因子。 以下に例を示します。AおよびBは固定効果因子でsubjectあり、変量効果因子です。 set.seed(1) d <- data.frame( Y = rnorm(48), subject = factor(rep(1:12, 4)), A = factor(rep(1:2, each=24)), B = factor(rep(rep(1:2, each=12), 2))) summary(aov(Y ~ A*B + Error(subject/(A*B)), data=d)) # Standard repeated measures ANOVA library(nlme) # Attempts: anova(lme(Y ~ A*B, data=d, random = ~ 1 | subject)) # not same …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.