タグ付けされた質問 「r」

このタグは、(a)質問の重要な部分または予想される回答として「R」が含まれる* on-topic *の質問に使用します。&(b)「R」の使い方について「*」だけではありません。

1
混合モデルの結果を視覚化する
混合モデルで私が常に抱えていた問題の1つは、結果が得られたら、データの視覚化(紙やポスターに掲載されるようなもの)を把握することです。 現在、私は次のような式のポアソン混合効果モデルに取り組んでいます: a <- glmer(counts ~ X + Y + Time + (Y + Time | Site) + offset(log(people)) glm()に適合するものを使用すると、predict()を使用して簡単に新しいデータセットの予測を取得し、それから何かを構築できます。しかし、このような出力では-Xからのシフト(およびおそらくYの設定値)を使用して、経時的なレートのプロットのようなものをどのように構築しますか?固定効果の推定値からフィットを十分に予測できると思いますが、95%CIはどうですか? 他の誰かが結果を視覚化するのに役立つと考えることができるものはありますか?モデルの結果は以下のとおりです。 Random effects: Groups Name Variance Std.Dev. Corr Site (Intercept) 5.3678e-01 0.7326513 time 2.4173e-05 0.0049167 0.250 Y 4.9378e-05 0.0070270 -0.911 0.172 Fixed effects: Estimate Std. Error z value Pr(>|z|) (Intercept) …

5
大学院の統計コースが提供するレベルの統計用のオープンソースJavaライブラリ
GK BhattacharyyaとRA Johnsonによる、統計の概念と方法の次のテキストを使用して、応用統計の大学院コースを受講しています。 教授は、宿題にSASを使用することを要求しています。 私の質問は、そのようなクラスで一般的に見られる問題のためにSASの代わりに使用できるJavaライブラリがありますか? 私は現在、Apache Math Commonsで間に合わせようとしていますが、ライブラリには感銘を受けていますが(使いやすさと理解しやすさ)、ヒストグラムを描画する機能(チャートライブラリと組み合わせることを考えると)のような単純なことすら欠けているようです)。 私はコルトを見てきましたが、私の最初の関心はすぐになくなりました。 ご意見をお寄せいただければ幸いです。Stackoverflowで同様の質問を見ましたが、説得力のあるものは見つかりませんでした。 注:R、SciPy、Octave、およびそれらを呼び出すjavaライブラリを認識しています-一緒に探している機能を提供できるJavaネイティブライブラリまたはライブラリのセットを探しています。 注:このようなクラスでカバーされるトピックには、通常、1標本および2標本検定、平均値と中央値の信頼区間、記述統計、適合度検定、一元配置および二元配置分散分析、同時推論、検定が含まれます。分散、回帰分析、およびカテゴリーデータ分析。
15 r  sas  java 

3
シェーンフェルト残差が良くない場合の比例ハザード回帰モデルのオプションは何ですか?
を使用してRでCox比例ハザード回帰を実行していcoxphます。これには多くの変数が含まれています。マーチンゲール残差は見栄えが良く、シェーンフェルト残差はすべての変数のALMOSTに最適です。シェーンフェルトの残差が平坦でない3つの変数があり、変数の性質は、時間とともに変化することが理にかなっています。 これらは私があまり興味を持たない変数なので、階層にすると良いでしょう。ただし、それらはすべて連続変数であり、カテゴリ変数ではありません。そのため、私は地層が実行可能なルートではないと認識しています*。ここで説明したように、変数と時間の相互作用を構築しようとしましたが、エラーが発生します。 In fitter(X, Y, strats, offset, init, control, weights = weights, : Ran out of iterations and did not converge 私はほぼ1000個のデータポイントで作業しており、それぞれ多くの要因を持つ6個の変数で作業しているので、このデータをスライスしてさいの目に切る方法の限界を押し上げているように感じます。残念ながら、含まれる変数を減らして試したより単純なモデルはすべて明らかに悪化しています(例:シェーンフェルトの残差は、変数が増えるとより汚れやすくなります)。 私のオプションは何ですか?私はこれらの特定の不適切な動作の変数を気にしないので、それらの出力を単に無視したいのですが、それは有効な解釈ではないと思います! * 1つは連続、1つは100を超える範囲の整数、1つは6の範囲の整数です。おそらくビニングですか?

2
3つの相関した一様分布のランダム変数を生成する
私たちが持っていると仮定します X 2〜UNIF(nは、0 、1 )、X1∼unif(n,0,1),X1∼unif(n,0,1),X_1 \sim \textrm{unif}(n,0,1), X2∼unif(n,0,1),X2∼unif(n,0,1),X_2 \sim \textrm{unif}(n,0,1), ここで、unif(n,0,1)unif(n,0,1)\textrm{unif}(n,0,1)はサイズnの一様ランダムサンプルであり、 Y=X1,Y=X1,Y=X_1, Z=0.4X1+1−0.4−−−−−−√X2.Z=0.4X1+1−0.4X2.Z = 0.4 X_1 + \sqrt{1 - 0.4}X_2. この場合、と相関はです。Z 0.4YYYZZZ0.40.40.4 これを3つの変数、、に拡張するにはどうすればよいですか?X 2 X 3X1X1X_1X2X2X_2X3X3X_3

1
Rのrlm()回帰係数の推定値がlm()と異なるのはなぜですか?
R MASSパッケージのrlmを使用して、多変量線形モデルを回帰しています。多くのサンプルでうまく機能しますが、特定のモデルの準ヌル係数を取得しています: Call: rlm(formula = Y ~ X1 + X2 + X3 + X4, data = mymodel, maxit = 50, na.action = na.omit) Residuals: Min 1Q Median 3Q Max -7.981e+01 -6.022e-03 -1.696e-04 8.458e-03 7.706e+01 Coefficients: Value Std. Error t value (Intercept) 0.0002 0.0001 1.8418 X1 0.0004 0.0000 13.4478 X2 -0.0004 …

2
グループ化変数の効果を非線形モデルでテストする方法は?
非線形モデルでのグループ化変数の使用に関して質問があります。nls()関数は因子変数を許可しないため、モデルの適合に対する因子の効果をテストできるかどうかを判断するのに苦労していました。「季節化されたvon Bertalanffy」成長モデルをさまざまな成長処理(魚の成長に最も一般的に適用)に適合させたい例を以下に示します。魚が育った湖と与えられた食物の効果をテストしたい(ちょうど人工的な例)。私はこの問題の回避策に精通しています-陳らによって概説されているように、プールされたデータにフィットするモデルと個別のフィットを比較するF検定を適用します。(1992)(ARSS-「残差平方和の分析」)。つまり、以下の例では、 Rでnlme()を使用してこれを行う簡単な方法があると思いますが、私は問題に直面しています。まず、グループ化変数を使用することにより、自由度は個別のモデルのフィッティングで得られるよりも高くなります。第二に、グループ化変数をネストできません。問題がどこにあるのかわかりません。nlmeまたは他の方法を使用したヘルプは大歓迎です。以下は私の人工的な例のコードです: ###seasonalized von Bertalanffy growth model soVBGF <- function(S.inf, k, age, age.0, age.s, c){ S.inf * (1-exp(-k*((age-age.0)+(c*sin(2*pi*(age-age.s))/2*pi)-(c*sin(2*pi*(age.0-age.s))/2*pi)))) } ###Make artificial data food <- c("corn", "corn", "wheat", "wheat") lake <- c("king", "queen", "king", "queen") #cornking, cornqueen, wheatking, wheatqueen S.inf <- c(140, 140, 130, 130) k <- c(0.5, 0.6, 0.8, …
15 r  mixed-model  nls 

3
Rを使用して摩耗を視覚化する最良の方法は?
スルーこのサイト私は最近サンキーダイアグラム、で何が起こっているかを視覚化するのに最適な方法を発見してきた伝統的なフローチャートを。 以下は、ジョージM.ホワイトサイドとジョージW.クラブツリー、 ソースによるサンキー図の良い例です。2007年2月9日:エネルギー、科学の長期基礎研究を忘れないでください 315。5813、pp.796-798。 Sankey Rパッケージが存在しないことに気付いた後、オンラインでRスクリプトを見つけましたが、残念ながらこのスクリプトはかなり生で、ある程度制限されています。stackoverflowでSankey Rパッケージまたはより成熟した関数を求めましたが、驚いたことに、RでSankey Diagramsを構築するための成熟した関数がないようです。 報奨金を投稿した後、Geek On Acidは、既存のスクリプトに小さなハックを提案するのに十分なほど親切で、特定の目的で多かれ少なかれ機能しました。 改良されたRスクリプトにより、この図が作成されました 。stackoverflow.com。 しかし、Rパッケージがないことは、上記の図に示されているようなデータフローでRを使用して損耗を視覚化するのにSankey Diagramsがそれほど驚くべき方法ではないことを示しています(データとRコードの最初のstackoverflowの質問を参照してください。減耗を視覚化するより良い方法があります。 Rを使用してデータフローの減少を視覚化する最良の方法は何だと思いますか?

1
黄土適合のR平方を取得する方法は?
および/または関数出力のRのR 二乗()統計を計算する方法は?このデータの例:r2r2r^2loesspredict cars.lo <- loess(dist ~ speed, cars) cars.lp <- predict(cars.lo, data.frame(speed = seq(5, 30, 1)), se = TRUE) cars.lpfitモデルse.fit用と標準エラー用の2つの配列があります。
15 r  r-squared  loess 

3
Rでデータフレームを展開する方法
ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け入れていません。 Rでいくつかの分析を行っているときに、次の問題が発生しています。 このようなデータフレームがあります: Name | Group | Count Person 1 | A | 3 Person 2 | A | 1 Person 3 | A | 0 Person 1 | B | 5 Person 2 | B | 0 Person 3 | B | 1 Person 1 | C | 1 …
15 r 

3
CARETのパラメーターチューニング(グリッド)機能を無効にする方法はありますか?
CARETは、事前に指定されたチューニンググリッドを使用してさまざまなモデルを自動的に構築してから、最終モデルを選択し、完全なトレーニングデータで最終モデルをトレーニングします。パラメーターの組み合わせを1つだけ使用して、独自のチューニンググリッドを提供できます。ただし、この場合でも、CARETは(この場合は1つしかありませんが)調整パラメーターから最適なモデルを「選択」し、最終モデルをすべてのトレーニングデータに適合させます。これは私が避けたい余分なステップです。 チューニンググリッドのバリエーション全体でモデル検索ステップをスキップし、すべてのトレーニングデータに基づいてCARETを強制するにはどうすればよいですか(基礎となるモデルライブラリを直接呼び出す以外)。
15 r  caret 

1
SASとRのANOVAでのタイプIIIの二乗和の矛盾する結果
私は両方のアンバランス要因実験からのデータを分析していますSASとR。両方SASとR正方形の類似のタイプI和を提供するが、正方形のそのタイプIIIの和は互いに異なります。以下はSASとRコードと出力。 DATA ASD; INPUT Y T B; DATALINES; 20 1 1 25 1 2 26 1 2 22 1 3 25 1 3 25 1 3 26 2 1 27 2 1 22 2 2 31 2 3 ; PROC GLM DATA=ASD; CLASS T B; MODEL Y=T|B; RUN; SASのタイプI SS …
15 r  anova  sas  sums-of-squares 

2
Rでのツリーの分割:パーティとrpart
木を分割するのを見てからしばらく経ちました。前回このようなことをしたとき、R(Hothornが作成)のパーティーが好きです。サンプリングによる条件付き推論のアイデアは私にとって理にかなっています。しかし、rpartにも魅力がありました。 現在のアプリケーションでは(詳細は説明できませんが、逮捕者の大規模なサンプルの中で誰が刑務所に入るかを決定することを伴います)ランダムフォレスト、バギング、ブースティングなどの高度な方法は使用できません-簡単に説明できるものが必要ですルール。 また、Zhang&Singer(2010)Recursive Partitioning and Applicationsで推奨されているように、どのノードを分割するかを手動で制御したいと思います。その本に付属しているフリーウェアはこれを可能にしますが、それ以外の点ではユーザー入力がかなり原始的です。 推奨事項や提案はありますか?
15 r  cart  rpart  partitioning 

3
コンピューターラボでRを教える良い方法は何ですか?
そこいくつかの良い質問と入門帳簿上の回答のセットとなってまたはRなど学習に近づいてきたこことここ。しかし、少し異なる問題があります。コンピューターラボで1時間のセッション(またはいくつかのそのようなセッション)を実行し、Rで開始する基本的なアプローチなどに慣れる最適な方法です。 私の現在の計画は、VerzaniのSimpleRのような入門章を効果的に処理し、おなじみのデータセットを導入することですが、他の有用なアプローチはありますか?たとえば、実際のデータをすぐに紹介したり、より抽象的な方法で問題に対処したりするのは良いことでしょうか?角括弧の使用方法を徹底的に検討する必要がありますか、または格子グラフィックスの例で人々を興奮させる必要がありますか? 私のターゲットオーディエンスは、統計情報(エキスパートではありませんが)と有能なSPSSユーザーに精通しています。SPSSなどで得られるマクロやスクリプトの種類を超えるプログラミング言語に精通していない。 レッスンプランへのヒントや参照をいただければ幸いです。ただし、Rを紹介するオンライン資料の多くの優れたリストを複製したくはありません-厳密に対面の指導質問への参照です。
15 r  teaching 

1
ggplotで階段関数をプロットする方法は?
ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け入れていません。 私はこのようなグラフを持っています: それを生成するためのRコードは次のとおりです。 DF <- data.frame(date = as.Date(runif(100, 0, 800),origin="2005-01-01"), outcome = rbinom(100, 1, 0.1)) DF <- DF[order(DF$DateVariable),] #Sort by date DF$x <- seq(length=nrow(DF)) #Add case numbers (in order, since sorted) DF$y <- cumsum(DF$outcome) library(ggplot2) ggplot(DF, aes(x,y)) + geom_path() + #Ploting scale_y_continuous(name= "Number of failures") + scale_x_continuous(name= "Operations performed") 私はこのようなものが欲しい: …

2
Rのカーネル密度推定の「pdf」の下の領域
Rの「密度」関数を使用してカーネル密度の推定を試みています。結果を解釈してさまざまなデータセットを比較するのは、曲線下の面積が必ずしも1であるとは限らないため、多少困難です。確率密度関数(pdf) には、面積。カーネル密度の推定値がpdfを報告すると仮定しています。私が使用していますintegrate.xyからsfsmisc曲線下面積を推定します。ϕ(x)ϕ(x)\phi(x)∫∞−∞ϕ(x)dx=1∫−∞∞ϕ(x)dx=1\int_{-\infty}^\infty \phi(x) dx = 1 > # generate some data > xx<-rnorm(10000) > # get density > xy <- density(xx) > # plot it > plot(xy) > # load the library > library(sfsmisc) > integrate.xy(xy$x,xy$y) [1] 1.000978 > # fair enough, area close to 1 > # use another …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.