タグ付けされた質問 「r」

このタグは、(a)質問の重要な部分または予想される回答として「R」が含まれる* on-topic *の質問に使用します。&(b)「R」の使い方について「*」だけではありません。


4
Rでの箱ひげ図のラベル付け
ロックされています。この質問とトピックへの回答はロックされています。質問はトピックから外れていますが、歴史的に重要です。現在、新しい回答や相互作用を受け入れていません。 軸なしで箱ひげ図を作成して現在のプロット(ROC曲線)に追加する必要がありますが、箱ひげ図にさらにテキスト情報を追加する必要があります。最小と最大のラベルです。現在のコード行は次のとおりです(現在のグラフも)。 助力に感謝します。 boxplot(data, horizontal = TRUE, range = 0, axes=FALSE, col = "grey", add = TRUE) 他の解決策は、(x軸ではなく)0から1までの線を追加することですが、中心線を通るようにしたいです...たとえば、このグラフィックのように
11 r  boxplot 

6
Rでmlogit関数を実行した後に予測する
これが私がやりたいことですがpredict、mlogitの方法がないようです。何か案は? library(mlogit) data("Fishing", package = "mlogit") Fish <- mlogit.data(Fishing, varying = c(2:9), shape = "wide", choice = "mode") Fish_fit<-Fish[-1,] Fish_test<-Fish[1,] m <- mlogit(mode ~price+ catch | income, data = Fish_fit) predict(m,newdata=Fish_test)

2
dynlm Rパッケージによる1ステップ先の予測
dynlmパッケージを使用して、いくつかの独立変数を持つモデルを適合させました。そのうちの1つは従属変数のラグです。 独立変数の1ステップ先の予測があると仮定すると、従属変数の1ステップ先の予測を取得するにはどうすればよいですか? 次に例を示します。 library(dynlm) y<-arima.sim(model=list(ar=c(.9)),n=10) #Create AR(1) dependant variable A<-rnorm(10) #Create independant variables B<-rnorm(10) C<-rnorm(10) y<-y+.5*A+.2*B-.3*C #Add relationship to independant variables data=cbind(y,A,B,C) #Fit linear model model<-dynlm(y~A+B+C+L(y,1),data=data) #Forecast A<-c(A,rnorm(1)) #Assume we already have 1-step forecasts for A,B,C B<-c(B,rnorm(1)) C<-c(C,rnorm(1)) y=window(y,end=end(y)+c(1,0),extend=TRUE) newdata<-cbind(y,A,B,C) predict(model,newdata) そして、これが機能するdynパッケージの使用例です。 library(dyn) #Fit linear model model<-dyn$lm(y~A+B+C+lag(y,-1),data=data) #Forecast predict(model,newdata)the dyn …

2
どのようにしてggplot2の連続的な相互作用によって連続的にプロットできますか?
データがあるとしましょう: x1 <- rnorm(100,2,10) x2 <- rnorm(100,2,10) y <- x1+x2+x1*x2+rnorm(100,1,2) dat <- data.frame(y=y,x1=x1,x2=x2) res <- lm(y~x1*x2,data=dat) summary(res) x1がX軸上にあり、x2が3本の線で表されるように、連続的な相互作用による連続をプロットしたいと思います。 Zスコアは-1で、各線は個別の色でラベル付けされています。ggplot2を使用してこれを行うにはどうすればよいですか? たとえば、次のようになります(もちろん、線の種類が異なるのではなく、色付きの線が異なります)。

4
YとXの相関関係のおかげで、説明された分散でゲインをどのように提示するのですか?
単純な線形相関を1年生に(視覚的に)説明する方法を探しています。 視覚化する古典的な方法は、Y〜X散布図に直線回帰直線を与えることです。 最近、プロットに3つの画像を追加してこのタイプのグラフィックスを拡張するというアイデアに思いつきました:y〜1の散布図、次にy〜xの散布図、resid(y〜x)〜x、そして最後に残差の(y〜x)〜1(平均値の中心) このような視覚化の例を次に示します。 そしてそれを生成するRコード: set.seed(345) x <- runif(50) * 10 y <- x +rnorm(50) layout(matrix(c(1,2,2,2,2,3 ,3,3,3,4), 1,10)) plot(y~rep(1, length(y)), axes = F, xlab = "", ylim = range(y)) points(1,mean(y), col = 2, pch = 19, cex = 2) plot(y~x, ylab = "", ) abline(lm(y~x), col = 2, lwd = …

5
ホームランを打つ際の平均への回帰の測定
野球をフォローしている人なら誰でも、トロントのホセバウティスタのどこからともなくMVPタイプのパフォーマンスについて聞いたことがあるでしょう。前の4年間で、彼はシーズンあたり約15のホームランを打った。昨年彼は54を打った、野球の歴史の中でわずか12人の選手を超えた数。 2010年には240万ドルが支払われ、2011年にはチームに1,050万ドルを要求しています。760万ドルを提供しています。彼が2011年にそれを繰り返すことができれば、彼はどちらかの額に値するでしょう。しかし、彼が繰り返す確率は何ですか?私たちは彼が平均に後退することをどれほど難しいと期待できますか?彼のパフォーマンスのうちどれだけが偶然によるものであると期待できますか?彼の平均への回帰調整後の2010年の合計は何になると予想できますか?どうすれば解決できますか? 私はLahman Baseball Databaseをいじくり回しており、シーズンごとに少なくとも50打席があった過去5シーズンのすべてのプレーヤーのホームランの合計を返すクエリを絞り出しました。 テーブルは次のようになります(行10のJose Bautistaに注意) first last hr_2006 hr_2007 hr_2008 hr_2009 hr_2010 1 Bobby Abreu 15 16 20 15 20 2 Garret Anderson 17 16 15 13 2 3 Bronson Arroyo 2 1 1 0 1 4 Garrett Atkins 29 25 21 9 1 5 Brad Ausmus 2 …
11 r  regression  modeling 

5
反復測定anovaの正規性の仮定をテストしますか?(R)
したがって、anovaの正規性の仮定のテストにポイントがあると仮定します(1および2を参照)。 Rでどのようにテストできますか? 私は次のようなことを期待しています: ## From Venables and Ripley (2002) p.165. utils::data(npk, package="MASS") npk.aovE <- aov(yield ~ N*P*K + Error(block), npk) residuals(npk.aovE) qqnorm(residuals(npk.aov)) 「残差」には、反復測定anovaの場合の方法(つまり、予測)がないため、これは機能しません。 それでは、この場合何をすべきでしょうか? 残差は、エラー項なしで同じフィットモデルから単純に抽出できますか?私はこれが有効であるかどうかを知るのに十分なほど文献に精通していません。

3
動的線形モデルのパラメーターの推定
私は(Rで)私は2つの持っているため、以下の非常に単純な動的な線形モデルを実装したい未知の時間変化のパラメータ(観測誤差の分散と状態誤差の分散ε 2 tで)。ε1tϵt1\epsilon^1_tε2tϵt2\epsilon^2_t Ytθt + 1==θt+ ϵ1tθt+ ϵ2tYt=θt+ϵt1θt+1=θt+ϵt2 \begin{matrix} Y_t & = & \theta_t + \epsilon^1_t\\ \theta_{t+1} & = & \theta_{t}+\epsilon^2_t \end{matrix} 先読みバイアスなしで、各時点でこれらのパラメーターを推定したいと思います。私が理解していることから、MCMC(先読みバイアスを回避するためにローリングウィンドウ上)またはパーティクルフィルター(またはシーケンシャルモンテカルロ-SMC)のいずれかを使用できます。 どちらの方法は、あなたが使用して、 これらの2つの方法の長所と短所は何ですか? おまけの質問:これらの方法では、パラメーターの変更速度をどのように選択しますか?大量のデータを使用してパラメーターを推定することと、少ないデータを使用してパラメーターの変更により迅速に反応することの間に取引があるため、ここに情報を入力する必要があると思いますか?
11 r  mcmc  dlm  particle-filter 

2
Rの因子変数ごとに自動的に要約を作成する
私は次のようなデータフレームを持っています: case simulation temp plank oxygen 1 1 1 8 7 11 2 2 1 16 10 15 ... 17 17 2 26 12 17 18 18 2 15 8 12 19 19 2 28 11 21 20 20 2 24 6 14 シミュレーション変数のレベルで要約を分割したいのですが。たとえばtemp、simulation == 1とSimulation == 2 の平均と、標準偏差も同じです。 現在、私は次のコードを使用していますが、これはかなり恐ろしいことです。 …
11 r 


1
Rのprincomp()オブジェクトのsummary()とloadings()の違いは何ですか?
コード例: (pc.cr <- princomp(USArrests)) summary(pc.cr) loadings(pc.cr) ## note that blank entries are small but not zero それぞれから異なる出力を取得していますが、違いが何であるかを理解できません。 出力は次のとおりです。 > summary(pc.cr) Importance of components: Comp.1 Comp.2 Comp.3 Comp.4 Standard deviation 82.8908472 14.06956001 6.424204055 2.4578367034 Proportion of Variance 0.9655342 0.02781734 0.005799535 0.0008489079 Cumulative Proportion 0.9655342 0.99335156 0.999151092 1.0000000000 > loadings(pc.cr) ## note …
11 r  pca 

2
Rの順序付けられたカテゴリカルデータ間の相関関係を(視覚的に)すばやく評価しますか?
アンケートのさまざまな質問への回答間の相関関係を探しています(「うーん、質問11への回答が質問78の回答と相関しているかどうかを見てみましょう」)。すべての回答はカテゴリ型です(そのほとんどは「非常に不幸」から「非常に満足」までの範囲です)が、いくつかの回答は異なるセットです。それらのほとんどは序数と見なすことができるので、ここでこのケースを考えてみましょう。 私は商用統計プログラムにアクセスできないので、Rを使用する必要があります。 Rattle(Rのフリーウェアデータマイニングパッケージ、非常に気の利いたもの)を試してみましたが、残念ながらカテゴリカルデータはサポートされていません。私が使用できるハックの1つは、「非常に不幸」ではなく数値(1..5)を含む調査のコード化されたバージョンをRにインポートして、それらが数値データであるとラトルに信じさせることです。 私は散布図を作成し、ドットサイズを各ペアの数値の数に比例させることを考えていました。グーグルで検索した後、http: //www.r-statistics.com/2010/04/correlation-scatter-plot-matrix-for-ordered-categorical-data/を見つけましたが、(私にとって)非常に複雑に見えます。 私は統計学者ではありませんが(プログラマーです)、この件について少し読んだことがあります。私が正しく理解していれば、ここではスピアマンのrhoが適切でしょう。 だから、急いでいる人のための質問の短いバージョン:Rでスピアマンのローをすばやくプロットする方法はありますか?プロットは、数値の行列よりも簡単です。これは、目を簡単に見ることができ、材料にも含めることができるためです。 前もって感謝します。 PS私はこれをメインのSOサイトに投稿するか、ここに投稿するかについてしばらく考えました。両方のサイトでR相関を検索した後、このサイトは質問により適していると感じました。

6
Rのdata.frame内の因子のすべての一意の組み合わせの要約統計を見つける方法は?[閉まっている]
閉まっている。この質問はトピックから外れています。現在、回答を受け付けていません。 この質問を改善してみませんか? 質問を更新することがありますので、話題のクロス検証済みのため。 2年前休業。 data.frame内の因子の一意の組み合わせごとに、data.frame内の変数の要約を計算したいと思います。これを行うにはplyrを使用する必要がありますか?apply()ではなくループを使用しても問題ありません。したがって、それぞれの固有の組み合わせを見つけるだけで十分です。

1
RのPCAバイプロットの基礎となる変数の矢印
質問をソフトウェア固有のものにするリスクがあり、その遍在性と特異性を言い訳にしてbiplot()、R の関数について、より具体的には、対応するデフォルトの重ねられた赤い矢印の計算とプロットについて質問したいと思います。基になる変数に。 [コメントの一部を理解するために、最初に投稿されたプロットには希少な問題があり、現在は消去されています。]
11 r  pca  biplot 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.