タグ付けされた質問 「r」

このタグは、(a)質問の重要な部分または予想される回答として「R」が含まれる* on-topic *の質問に使用します。&(b)「R」の使い方について「*」だけではありません。

4
回帰モデルの係数の標準誤差を参照するにはどうすればよいですか?[閉まっている]
閉まっている。この質問はトピックから外れています。現在、回答を受け付けていません。 この質問を改善してみませんか? 質問を更新することがありますので、話題のクロス検証済みのため。 3年前休業。 Estimate Std. Error t value Pr(>|t|) (Intercept) 10.2758 0.5185 19.817 < 2e-16 *** rprice2 -1.8581 0.5139 -3.616 0.000696 *** 標準を使用したいと思います。他の計算を行うためのrprice2のエラー。モデル内のオブジェクトを参照することはわかっていますが、model $ objectという構文を使用していますが、stdエラーを参照するための構文は何ですか?

1
ポアソン分布のロバストな推定
ポアソン分布からのものであると想定される一連の数値があります。セットにはいくつかの外れ値もあり、そのため、最尤推定値は悪影響を受けます。このような状況では、堅牢な推定手順が役立つと聞きました。誰でもこれを行う方法を説明できますか?私は統計学の学生ではありません。 glmrobR の関数がこれに使用できることがわかりました。(私はRにかなり新しいです)。しかし、マニュアルページを読んだにもかかわらず、それをどのように使用するのか理解できませんでした。特にforumula、glmrob関数の最初の引数であるaを取得する方法を理解できません。 ありがとう。

1
Rの行列から複数の列を抽出する[終了]
閉まっている。この質問はトピックから外れています。現在、回答を受け付けていません。 この質問を改善してみませんか? 質問を更新することがありますので、話題のクロス検証済みのため。 7年前休業。 M15列の行列がある場合M1、1,7,9,11,13および15列からなる行列を抽出するR構文は何ですか?
8 r  matrix 

1
RまたはMATLABでキャリブレーションされたブーストされた決定木
で教師付き学習アルゴリズムのアン実証的比較(2006 ICML)著者(リッチカルアナとアレクサンドル・ニクレスク-Mizil)は、いくつかの分類アルゴリズム(SVMを、ANN、KNN、ランダムフォレスト、決定木など)を評価した、と報告した校正ブースト木々こと8つの異なるメトリック(Fスコア、ROC面積、平均精度、クロスエントロピーなど)全体で最高の学習アルゴリズムとしてランク付けされています。 キャリブレーションされたブーストされた決定木をテストしたい私のプロジェクトの1つでと思います。誰かがこれに適したRパッケージまたはMATLABライブラリを提案できるかどうか疑問に思っていました。 私はRに比較的慣れていませんが、MATLABおよびPythonでの経験は豊富です。私はRさんについて読んだことがGBM、木、およびRPARTが、これらのパッケージが調整されたブーストされた決定木を実装しているかどうか、またはそれらを実装している他のパッケージがあるかどうかはません。 ありがとう

2
混合モデルのコンポーネントパラメータの計算に使用するRパッケージ
混合モデルをモンテカルロ生成データに当てはめたいと思いますが、確率密度は通常、添付の画像と同じです。 視覚的な検査からは、通常の混合モデルが適用できる可能性があるように見えますが、CRANタスクビューのチェックでは、どのパッケージが自分のニーズに適しているのか本当にわかりません。 基本的に私がやりたいのは、データのベクトルを提供し、次にパッケージ関数に混合モデルの各コンポーネントの平均、分散、および比例重みを返させ、モデルにあるコンポーネントの数を特定することです。
8 r  mixed-model 

1
時系列クラスタリング
この形式の多くの時系列があり、日付(d / m / yr)形式の1列と、次のようなさまざまな時系列を表す多くの列があります。 DATE TS1 TS2 TS3 ... 24/03/2003 0.00 0.00 ... 17/04/2003 -0.05 1.46 11/05/2003 0.46 -3.86 04/06/2003 -2.21 -1.08 28/06/2003 -1.18 -2.16 22/07/2003 0.00 0.23 Rを使用して、同様の傾向を示す時系列をどのようにグループ化できますか?

1
Rを使用してArimaエラーのある回帰のR-2乗を計算するにはどうすればよいですか?
私のようなarimaオブジェクトがある場合a: set.seed(100) x1 <- cumsum(runif(100)) x2 <- c(rnorm(25, 20), rep(0, 75)) x3 <- x1 + x2 dummy = c(rep(1, 25), rep(0, 75)) a <- arima(x3, order=c(0, 1, 0), xreg=dummy) print(a) 。 Series: x3 ARIMA(0,1,0) Call: arima(x = x3, order = c(0, 1, 0), xreg = dummy) Coefficients: dummy 17.7665 s.e. …


1
Rのロジスティック回帰のハット行列を計算する方法は?
ロジットモデルのハット行列をRで直接計算したいと思います。Long(1997)によれば、ロジットモデルのハットマトリックスは次のように定義されます。 H=VX(X′VX)−1X′VH=VX(X′VX)−1X′VH = VX(X'VX)^{-1} X'V Xは独立変数のベクトルであり、Vはが対角にある対角行列です。π(1−π)−−−−−−−√π(1−π)\sqrt{\pi(1-\pi)} このoptim関数を使用して、可能性を最大化し、ヘッセ行列を導出します。だから私は私の質問だと思います: Rでを計算する方法は?VVV 注:尤度関数は次のようになります。 loglik <- function(theta,x,y){ y <- y x <- as.matrix(x) beta <- theta[1:ncol(x)] loglik <- sum(-y*log(1 + exp(-(x%*%beta))) - (1-y)*log(1 + exp(x%*%beta))) return(-loglik) } そして、これを次のようにoptim関数に送ります: logit <- optim(c(1,1),loglik, y = y, x = x, hessian = T) ここで、xは独立変数の行列であり、yは従属変数を持つベクトルです。 注:これを行うための既定の手順があることは知っていますが、最初から行う必要があります
8 r  logistic  deviance 

1
私が見ている問題の種類を理解するのを手伝ってくれる人はいますか?これが仮説検定として分類されるかどうかわからない
この質問が明確でない場合はご容赦ください。適切な用語を使用しているかどうかはわかりません。 さまざまな環境で何度も実験を行いました。だから私のデータは次のようになります: Environment1 1.2 2.1 1.1 1.5 1.6 Environment2 4.2 2.6 3.5 2.5 2.9 Environment3 7.2 4.6 5.3 4.5 1.6 Environment4 0.0 0.0 1.2 15.0 0.0 Environment5 3.2 2.4 7.2 5.5 6.6 Environment6 23.2 32.1 18.1 1.5 19.6 実験がEnvironment4(低すぎて変動が激しい)とEnvironment5(高すぎる)で適切に行われなかったことははっきりと(またはおそらく私の直感では)わかりますが、これを証明する方法がわかりません。私は仮説を用いた仮説テストに依存することになっていますか? 実験は、環境4および6では適切に行われませんでした。 そして、これを証明するためにいくつかの手順を使用しますか?またはこれを示す標準的な方法はありますか?誰かが私にこの種の問題に取り組む方法を助けてくれませんか?私はRを使用しています。

1
予測パッケージのauto.arima()とets()を組み合わせる
多くの単変量時系列を予測するために、予測パッケージのets()およびauto.arima()関数を使用しています。私は次の関数を使用して2つの方法のいずれかを選択していますが、CrossValidatedに自動予測の優れた(またはそれほど単純ではない)アイデアがあるかどうか疑問に思っていました。 auto.ts <- function(x,ic="aic") { XP=ets(x, ic=ic) AR=auto.arima(x, ic=ic) if (get(ic,AR)<get(ic,XP)) { model<-AR } else { model<-XP } model } /編集:この関数はどうですか? auto.ts <- function(x,ic="aic",holdout=0) { S<-start(x)[1]+(start(x)[2]-1)/frequency(x) #Convert YM vector to decimal year E<-end(x)[1]+(end(x)[2]-1)/frequency(x) holdout<-holdout/frequency(x) #Convert holdout in months to decimal year fitperiod<-window(x,S,E-holdout) #Determine fit window if (holdout==0) { testperiod<-fitperiod } …

2
サンプルの尖度は絶望的に偏っていますか?
かなり歪んだ確率変数の尖度のサンプルを調べていますが、結果に一貫性がないようです。問題を簡単に説明するために、対数正規RVのサンプル尖度を調べました。R(私はゆっくりと学習しています): library(moments); samp_size = 2048; n_trial = 4096; kvals <- rep(NA,1,n_trial); #preallocate for (iii in 1:n_trial) { kvals[iii] <- kurtosis(exp(rnorm(samp_size))); } print(summary(kvals)); 私が得る要約は Min. 1st Qu. Median Mean 3rd Qu. Max. 11.87 28.66 39.32 59.17 61.70 1302.00 Wikipediaによると、この対数正規RVの尖度は約114であるはずです。明らかに、サンプルの尖度は偏っています。 いくつかの調査を行ったところ、サンプルの尖度はサンプルサイズが小さいと偏っていることがわかりました。e1071CRAN のパッケージで提供される「G2」推定量を使用して、このサンプルサイズで非常に類似した結果を得ました。 質問:次のどれが起こっているのかを特徴づけます: サンプルの尖度の標準誤差は、このRVの場合は非常に大きくなります(標準的な誤差の一般的な推定値は)。または、この研究では使用したサンプルが少なすぎます(2048)。1/n−−√1/n1/\sqrt{n} サンプルの尖度のこれらの実装は、たとえば Terriberryの方法(Welfordの方法がサンプルの分散の単純な方法よりも優れた結果を与えるのとほぼ同じ方法)によって修正される可能性がある数値の問題に悩まされています。 人口尖度を誤って計算しました。(痛い) サンプルの尖度は本質的にバイアスされており、このような小さなサンプルサイズでは修正できません。

2
prop.testによって返された信頼区間におけるイェーツの連続性補正
これは、prop.testによって推定された信頼区間です n <- 600; x <- 276; p <- 0.40 prop.test(x, n, p, alternative="two.sided", conf.level=0.95, correct=T) 95 percent confidence interval: 0.4196787 0.5008409 prop.testの下のコードを読んで、それを再現しようとしました。これらの2つの制限を取得する簡単な方法を次に示します ESTIMATE <- x/n YATES <- 0.5 conf.level <- 0.95 z <- qnorm((1 + conf.level)/2) YATES <- min(YATES, abs(x - n * p)) z22n <- z^2/(2 * n) …

4
2つのデータポイントと専門家の制約に一致する、おそらく珍しい分布を求めていますか?
ベイジアンメタアナリシスの以前の分布を述べようとしています。 確率変数に関する次の情報があります。 2つの観察:3.0、3.6 変数を研究する科学者は、であり、6という高い値はゼロ以外の確率を持つと私に言っています。P(X&lt;2)=P(X&gt;8)=0P(X&lt;2)=P(X&gt;8)=0P(X<2)=P(X>8)=0 私は、最適化に次のアプローチを使用している(ログ-Nのモードを= :eμ−σ2)eμ−σ2)e^{\mu-\sigma^2)} prior &lt;- function(parms, x, alpha) { a &lt;- abs(plnorm(x[1], parms[1], parms[2]) - (alpha/2)) b &lt;- abs(plnorm(x[2], parms[1], parms[2]) - (1-alpha/2)) mode &lt;- exp(parms[1] - parms[2]^2) c &lt;- abs(mode-3.3) return(a + b + c) } v = nlm(prior,c(log(3.3),0.14),alpha=0.05,x=c(2.5,7.5)) x &lt;- seq(1,10,0.1) plot(x, dlnorm(x, v$estimate[1], v$estimate[2])) …

1
通常の線形モデルに対するANOVAの利点は何ですか?
Rを試してみたところ、anova()にはlmタイプのオブジェクトが必要であることがわかりました。しかし、なぜこの後anovaを続けるべきなのでしょうか。 &gt; x &lt;- data.frame(rand=rnorm(100), factor=sample(c("A","B","C"),100,replace=TRUE)) &gt; head(x) rand factor 1 0.9640502 B 2 -0.5038238 C 3 -1.5699734 A 4 -0.8422324 B 5 0.2489113 B 6 -1.4685439 A &gt; model &lt;- lm(x$rand ~ x$factor)) &gt; summary(model) Call: lm(formula = x$rand ~ x$factor) Residuals: Min 1Q Median 3Q Max -2.74118 -0.89259 …
8 r  anova 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.