タグ付けされた質問 「r」

このタグは、(a)質問の重要な部分または予想される回答として「R」が含まれる* on-topic *の質問に使用します。&(b)「R」の使い方について「*」だけではありません。

3
Auto.arima with daily data:季節性/周期性をキャプチャする方法?
毎日の時系列にARIMAモデルを当てはめています。データは2010年2月1日から2011年7月30日まで毎日収集され、新聞販売に関するものです。週ごとの販売パターンを見つけることができるので(販売されたコピーの1日の平均量は月曜日から金曜日まで通常同じで、土曜日と日曜日に増加します)、この「季節」を捉えようとしています。売上データ「データ」を指定して、次のように時系列を作成します。 salests<-ts(data,start=c(2010,1),frequency=365) そして、auto.arima(。)関数を使用して、AIC基準を介して最適なARIMAモデルを選択します。結果は常に非季節ARIMAモデルですが、例として次の構文でいくつかのSARIMAモデルを試してみると: sarima1<-arima(salests, order = c(2,1,2), seasonal = list(order = c(1, 0, 1), period = 7)) より良い結果を得ることができます。tsコマンド/ arimaの仕様に何か問題はありますか?毎週のパターンは非常に強いので、キャプチャするのにそれほど多くの困難はないと思います。任意のヘルプは非常に便利です。ありがとう、ジュリア・デッピエーリ 更新: すでにいくつかの引数を変更しました。より正確には、プロシージャはを設定するとARIMA(4,1,3)を最良のモデルとして選択しますがD=7、AICおよびその他の適合指数および予測もまったく改善されません。季節性と周期性の混同によるいくつかの間違いがあると思います。 Auto.arima呼び出しが使用され、取得された出力: modArima<-auto.arima(salests,D=7,max.P = 5, max.Q = 5) ARIMA(2,1,2) with drift : 1e+20 ARIMA(0,1,0) with drift : 5265.543 ARIMA(1,1,0) with drift : 5182.772 ARIMA(0,1,1) with drift : 1e+20 ARIMA(2,1,0) with …

1
データへの指数モデルのあてはめ
この質問は、相互検証で回答できるため、Stack Overflowから移行されました。 8年前に移行され ました。 私は2つの変数を持っています、両方ともクラス「数値」から: > head(y) [1] 0.4651804 0.6185849 0.3766175 0.5489810 0.3695258 0.4002567 > head(x) [1] 59.32820 68.46436 80.76974 132.90824 216.75995 153.25551 私はそれらをプロットしましたが、指数モデルをデータに当てはめたい(そしてプロットに追加したい)のですが、Rの多変量データにモデルを当てはめることに関する情報が見つかりません!単変量データに対してのみ、誰かが助けることができますか?どこから始めればいいのかさえわかりません...ありがとう!
21 r 

2
Rの関数lmで重みを使用する方法は?
ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け入れていません。 誰かweightsがRのlm関数で引数を使用する方法についていくつかのポインタを提供できますか?たとえば、交通量データにモデルを適合させようとしていて、数百の行があり、各行が(異なる人口を持つ)都市を表しているとします。モデルが母集団のサイズに基づいて各観測の相対的な影響を調整するようにしたい場合、単に指定できますweights=[the column containing the city's population]か?それが入るようなベクトルweightsですか?または、別のR関数/パッケージ/アプローチを完全に使用する必要がありますか? 人々がこの問題にどのように取り組んでいるか聞いて興味があります-私がそこで見たどの線形モデリングのチュートリアルでもそれがカバーされているのを見ませんでした。ありがとう!
21 r  regression 

1
相関二項確率変数の生成
線形変換アプローチに従って相関ランダム二項変数を生成できるかどうか疑問に思っていましたか? 以下では、Rで簡単なものを試してみました。しかし、私はこれを行うための原則的な方法があるかどうか疑問に思っていましたか? X1 = rbinom(1e4, 6, .5) ; X2 = rbinom(1e4, 6, .5) ; X3 = rbinom(1e4, 6, .5) ; a = .5 Y1 = X1 + (a*X2) ; Y2 = X2 + (a*X3) ## Y1 and Y2 are supposed to be correlated cor(Y1, Y2)

2
逆変換方法はどのように機能しますか?
反転法はどのように機能しますか?密度 over ランダムサンプルとし、したがって cdfで。次に、反転法により、の分布をとして取得します。 f (x ; θ )= 1X1,X2,...,XnX1,X2,。。。、バツnX_1,X_2,...,X_n 0&lt;X&lt;1FX(X)=X1/θ(0、1)XF - 1 X(U)=Uθf(x;θ)=1θx(1−θ)θf(バツ;θ)=1θバツ(1−θ)θf(x;\theta)={1\over \theta} x^{(1-\theta)\over \theta} 0&lt;x&lt;10&lt;バツ&lt;10<x<1FX(x)=x1/θFバツ(バツ)=バツ1/θF_X(x)=x^{1/\theta}(0,1)(0、1)(0,1)XバツXF−1X(u)=uθFバツ−1(あなたは)=あなたはθF_X^{-1}(u)=u^\theta それで、はの分布がありますか?これは反転方法の仕組みですか? Xuθあなたはθu^\thetaXバツX u&lt;-runif(n) x&lt;-u^(theta)

1
GLMの準ポアソンが負の二項分布の特殊なケースとして扱われないのはなぜですか?
私は、一般化線形モデルを、過剰分散の場合とそうでない場合のあるカウントデータのセットに適合させようとしています。ここで適用される2つの正準分布は、ポアソンおよび負の二項(Negbin)、EVおよび分散ですμμ\mu VRP= μVarP=μVar_P = \mu VRNB= μ + μ2θVarNB=μ+μ2θVar_{NB} = \mu + \frac{\mu^2}{\theta} これは、それぞれglm(..,family=poisson)とを使用してRに適合させることができますglm.nb(...)。quasipoisson私の理解では同じEVと分散を持つ調整されたポアソンである家族もあります VRQ P= φ μVarQP=ϕμVar_{QP} = \phi\mu、 すなわち、ポアソンとネビンの間のどこかに落ちます。準ポアソンファミリの主な問題は、それに対応する尤度がないことであり、したがって、非常に有用な統計的検定と適合度測定(AIC、LRなど)の多くが利用できません。 QPとNegbinの分散を比較すると、置くことでそれらを等化できることに気付くかもしれません。このロジックを続けると、準ポアソン分布をNegbinの特殊なケースとして表現することができます。ϕ = 1 + μθϕ=1+μθ\phi = 1 + \frac{\mu}{\theta} Q P(μ 、ϕ )= NB(μ 、θ = μϕ − 1)QP(μ、ϕ)=NB(μ、θ=μϕ−1)QP\,(\mu,\phi) = NB\,(\mu,\theta = \frac{\mu}{\phi-1})、 すなわち、線形に依存する持つNegbin です。上記の式に従ってランダムな数列を生成し、それを当てはめることにより、このアイデアを検証しようとしました:μθθ\thetaμμ\muglm #fix parameters phi = …

4
分布がマルチモーダルかどうかをテストするにはどうすればよいですか?
データのヒストグラムをプロットすると、2つのピークがあります。 それは潜在的なマルチモーダル分布を意味しますか?dip.testR(library(diptest))を実行しましたが、出力は次のとおりです。 D = 0.0275, p-value = 0.7913 私のデータにはマルチモーダル分布があると結論付けることができますか? データ 10346 13698 13894 19854 28066 26620 27066 16658 9221 13578 11483 10390 11126 13487 15851 16116 24102 30892 25081 14067 10433 15591 8639 10345 10639 15796 14507 21289 25444 26149 23612 19671 12447 13535 10667 11255 8442 11546 15958 21058 …

3
glm(R)で適合度を計算する方法
この質問は、相互検証で回答できるため、Stack Overflowから移行されました。 6年前に移行され ました。 glm関数を実行すると、次の結果が得られます。 次の値をどのように解釈できますか? ヌル逸脱 残留偏差 AIC 彼らはフィットの良さに関係がありますか?これらの結果から、R平方またはその他の尺度などの適合度の尺度を計算できますか? Call: glm(formula = tmpData$Y ~ tmpData$X1 + tmpData$X2 + tmpData$X3 + as.numeric(tmpData$X4) + tmpData$X5 + tmpData$X6 + tmpData$X7) Deviance Residuals: Min 1Q Median 3Q Max -0.52628 -0.24781 -0.02916 0.25581 0.48509 Coefficients: Estimate Std. Error t value Pr(&gt;|t|) (Intercept -1.305e-01 1.391e-01 …

1
RでのGBMのn.minobsinnodeパラメーターの役割[終了]
この質問が将来の訪問者を助けることはまずありません。それは、小さな地理的エリア、特定の瞬間、またはインターネットの世界中の視聴者には一般に適用できない非常に狭い状況にのみ関連します。この質問の適用範囲を広げるには、ヘルプセンターをご覧ください。 7年前に閉鎖されました。 GBMパッケージのn.minobsinnodeパラメーターの意味を知りたいと思いました。私はマニュアルを読みましたが、それが何をするのか明確ではありません。結果を改善するために、その数を小さくするか、大きくする必要がありますか?
21 r  gbm 

3
nls()で「初期パラメーター推定での特異勾配行列」エラーが発生するのはなぜですか?
排出削減と車あたりのコストに関するいくつかの基本的なデータがあります。 q24 &lt;- read.table(text = "reductions cost.per.car 50 45 55 55 60 62 65 70 70 80 75 90 80 100 85 200 90 375 95 600 ",header = TRUE, sep = "") これは指数関数であることを知っているので、以下に適合するモデルを見つけることができると期待しています。 model &lt;- nls(cost.per.car ~ a * exp(b * reductions) + c, data = q24, start = …

4
新しいベクターをPCA空間に投影する方法は?
主成分分析(PCA)を実行した後、新しいベクトルをPCA空間に投影します(つまり、PCA座標系で座標を見つけます)。 を使用してR言語でPCAを計算しましたprcomp。これで、ベクトルにPCA回転行列を掛けることができるはずです。このマトリックスの主成分を行または列に配置する必要がありますか?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

2
lmer()での「モデルの収束に失敗しました」という警告
次のデータセットでは、サイト、季節、期間、およびそれらの相互作用に関して応答(効果)が変化するかどうかを確認したかったのです。統計に関するいくつかのオンラインフォーラムでは、線形混合効果モデルを使用するよう勧められましたが、問題は各ステーション内で複製がランダム化されるため、連続する季節にまったく同じ場所からサンプルを収集する機会がほとんどないことです(たとえば、モンスーン後のs1のrepl-1は、モンスーンのものとは異なる場合があります。同じ被験者を季節ごとに繰り返し測定する臨床試験(被験者内設計)とは異なります。ただし、サイトと季節をランダムな要因と見なして、次のコマンドを実行し、警告メッセージを受け取りました。 Warning messages: 1: In checkConv(attr(opt, "derivs"), optpar,ctrl=controlpar,ctrl=controlcheckConv, : unable to evaluate scaled gradient 2: In checkConv(attr(opt, "derivs"), optpar,ctrl=controlpar,ctrl=controlcheckConv, : Model failed to converge: degenerate Hessian with 1 negative eigenvalues 誰も私が問題を解決するのを助けることができますか?コードは次のとおりです。 library(lme4) read.table(textConnection("duration season sites effect 4d mon s1 7305.91 4d mon s2 856.297 4d mon s3 649.93 4d mon …

4
任意の共分散行列を作成する方法
たとえばR、のMASS::mvrnorm()関数は、統計のさまざまなことを示すデータを生成するのに役立ちます。Sigma変数の共分散行列を指定する対称行列である必須引数を取ります。任意のエントリを持つ対称行列を作成するにはどうすればよいですか?n×nn×nn\times n

1
lme()とlmer()が矛盾する結果を与える
私は、繰り返し測定に問題のあるいくつかのデータを扱ってきました。間そうすることで、私は非常に異なる行動に気づいたlme()し、lmer()私のテストデータを使用して理由を知りたいです。 私が作成した偽のデータセットには、10人の被験者の身長と体重の測定値があり、それぞれ2回取得されています。被験者間では身長と体重の間には正の関係があり、各個人内で繰り返される測定の間には負の関係があるようにデータを設定しました。 set.seed(21) Height=1:10; Height=Height+runif(10,min=0,max=3) #First height measurement Weight=1:10; Weight=Weight+runif(10,min=0,max=3) #First weight measurement Height2=Height+runif(10,min=0,max=1) #second height measurement Weight2=Weight-runif(10,min=0,max=1) #second weight measurement Height=c(Height,Height2) #combine height and wight measurements Weight=c(Weight,Weight2) DF=data.frame(Height,Weight) #generate data frame DF$ID=as.factor(rep(1:10,2)) #add subject ID DF$Number=as.factor(c(rep(1,10),rep(2,10))) #differentiate between first and second measurement これは、各個人の2つの測定値を結ぶ線を使用したデータのプロットです。 だから私は2つのモデルを実行しました。1つlme()はnlmeパッケージから、もう1つはlmer()from lme4でした。両方のケースで、身長に対する体重の回帰を実行し、IDのランダム効果を使用して、各個人の反復測定を制御しました。 library(nlme) Mlme=lme(Height~Weight,random=~1|ID,data=DF) library(lme4) Mlmer=lmer(Height~Weight+(1|ID),data=DF) …

3
この分布の乱数をシミュレートする方法を見つける
累積分布関数を使用して、分布からの擬似乱数をシミュレートするプログラムをRで作成しようとしています。 F(x)=1−exp(−ax−bp+1xp+1),x≥0F(x)=1−exp⁡(−ax−bp+1xp+1),x≥0F(x)= 1-\exp \left(-ax-\frac{b}{p+1}x^{p+1}\right), \quad x \geq 0 ここa,b&gt;0,p∈(0,1)a,b&gt;0,p∈(0,1)a,b>0, p \in (0,1) 私は逆変換サンプリングを試みましたが、逆は分析的に解決できないようです。この問題の解決策をご提案いただければ幸いです

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.