タグ付けされた質問 「r」

このタグは、(a)質問の重要な部分または予想される回答として「R」が含まれる* on-topic *の質問に使用します。&(b)「R」の使い方について「*」だけではありません。

2
Rでの超幾何関数の計算
R のパッケージでを評価するのは非常に困難です。私の場合、、、値は常に正の実数です。それでも、超幾何関数はその値に非常に敏感です。私は極端な精度を求めていません。Excelを使用して、目的に適したGuass超幾何の大まかな見積もりを取得できます。a b c2F1(a,b;c;z)2F1(a,b;c;z)_2F_1(a,b;c;z)hypergeoaaabbbccc 広範囲の値を持つ正の実数のガウシアン超幾何計算を非常に正確ではないにしても、高速でエラーのないRで実装するための提案はありますか? 編集:MATLABにはこれよりRよりはるかに多くのコードがあるようです。なぜかについての考えはありますか?

1
リレベルを使用するとモデルが変更されるのはなぜですか?
Rを使用して回帰モデルを計算するとき、私は定期的にrelevel関数を使用して、他のレベルの結果も得られるようにモデルを取得します。頻繁ではありませんが、これがモデルを変更したことに気づきました。これは、レベルを変更する前に重要だった他の要因のレベルがもはや変わらないという意味です。これは、レベル変更または例外的なものに固有のものですか、おそらく私のデータの問題が原因ですか?私のデータが線形モデルの前提条件の1つを満たしていない可能性が高いことを示していますか? これに関連して、リレベルを使用してモデルを再計算し、両方のモデルの有意性の値を記事に報告しても問題ありませんか?2つのモデル間で特定の要因の有意性が異なる場合、楽観的でないモデルを使用する必要があると思いますか? 私の質問は、基本レベルの必要性を把握するのに十分なlmについて知らないのではないかと思います。私はそれをかなりよく理解していると思いました;)どういうわけか私が読んだ導入のどれもその点を説明しなかった、または私はそれを理解するのが苦手でした。だから、誰かが私にlmの基本レベルを持っていることのポイントが説明されている、またはそれを自分で説明しているサイトに誘導できたら、それも素晴らしいことです! 編集:これは最小限の例です: library(datasets) sprays<-OrchardSprays model<-lm(decrease~treatment+rowpos+colpos,data=sprays) summary(model) 概要の一部は言う treatmentC 20.625 9.731 2.120 0.03866 * したがって、治療== Cの場合、これは「減少」に大きなプラスの影響を与えます。ここで、「治療」をBにレベル変更して、治療== Aがどのような影響を与えるかを調べます。 sprays$treatment<-relevel(sprays$treatment,"B") summary(model) そして今、治療== Cはこの新しいモデルでは重要ではありません: treatmentC 17.625 9.731 1.811 0.07567 . 間違った場所に投稿してすみません!質問をstats statexchangeに移動できますか、またはそこで新しい質問を開く必要がありますか?
8 r  regression 

3
Rのパネルデータのユニットルートテスト
私はplmパッケージを持っており、いくつかの変数に対してユニットルートテストを実行したいと考えています。次のエラーが発生します。 > purtest(data$tot.emp) Error in data.frame(baldwin = c(59870, 61259, 60397, 58919, 57856, 57227, : arguments imply differing number of rows: 14, 19, 11, 12, 1, 20, 18, 10, 13 私のパネルのバランスが悪いため、このエラーが発生していると思います。2つの質問: パネルのユニットルートテスト(Levin、Lin、Chu(2002)、Im、Pesaran、Shin(2003)など)を使用して、バランスの取れていないパネルを作成できますか? もしそうなら、それはRで実装されていますか?

2
一般化最小二乗モデル(GLS)からの非相関エラー
私たちは金融機関として、時系列データの分析を頻繁に実行します。多くの場合、時系列変数を使用して回帰を行うことになります。これが発生すると、多くの場合、OLS回帰における独立したエラーの基本的な仮定に違反する時系列構造の残差が発生します。最近、別のモデルを構築しています。自己相関エラーのある回帰があるlm(object)と思います。ACFとPACFから明らかなように、線形モデルの残差は明らかにAR(1)構造を持っています。私は2つの異なるアプローチをとりました。最初のアプローチは明らかgls()にRの一般化最小二乗法を使用してモデルを適合させることでした。私の期待は、gls(object)からの残差がホワイトノイズ(独立したエラー)になることでした。しかし、からの残差gls(object)通常の回帰と同じARIMA構造がまだあります。残念なことに、私がやっていることに、理解できないほどの問題があります。したがって、線形モデル(OLS推定)からの回帰係数を手動で調整することにしました。驚くべきことに、調整された回帰からの残差をプロットすると、それは機能しているようです(残差はホワイトノイズです)。私は本当にコーディングをパッケージで使用gls()したいnlmeので、コーディングはずっと簡単で簡単になります。ここで私が取るべきアプローチは何ですか?REMLを使用するはずですか?または、gls()オブジェクトからの相関のない残差(ホワイトノイズ)に対する私の期待は間違っていますか? gls.bk_ai <- gls(PRNP_BK_actINV ~ PRM_BK_INV_ENDING + NPRM_BK_INV_ENDING, correlation=corARMA(p=1), method='ML', data = fit.cap01A) gls2.bk_ai <- update(gls.bk_ai, correlation = corARMA(p=2)) gls3.bk_ai <- update(gls.bk_ai, correlation = corARMA(p=3)) gls0.bk_ai <- update(gls.bk_ai, correlation = NULL) anova(gls.bk_ai, gls2.bk_ai, gls3.bk_ai, gls0.bk_ai) ## looking at the AIC value, gls model with AR(1) will be the best bet …

1
RまたはRPyの逆ガンマ分布の最尤推定
3つのパラメーターの逆ガンマ分布をRまたはPythonのデータに適合させようとしています。最尤推定(MLE)を使用してこれを実行したいと思います。 3つのパラメーターの逆ガンマのpdfは、次の式で与えられます。 ここで、Γはガンマ関数、ρは形状、αはスケール、sは位置パラメーターです。 私はこのディストリビューションに対して直接MLEを実行できるRパッケージを発見していません(知っている場合はお知らせください!)。だから私はこれがどちらかを残すと思います: (A)式の対数尤度関数を計算する (B)データをガンマ分布に変換する。ただし、この分布には2つのパラメーターしかないため、3番目のパラメーターの計算方法がわかりません(私はあまり数学者ではありません!)。 MLEを使用して逆ガンマ分布を私のデータに合わせる方法についての助けがあれば大歓迎です!よろしくお願いします。

1
mcmcsamp関数を使用した分散の事後シミュレーション
mcmcsamp()関数を使用したlmer()モデルの分散コンポーネントの事後シミュレーションを取得したいと思います。実行する方法 ? たとえば、以下はlmer()フィッティングの結果です。 > fit Linear mixed model fit by REML Formula: y ~ 1 + (1 | Part) + (1 | Operator) + (1 | Part:Operator) Data: dat AIC BIC logLik deviance REMLdev 97.55 103.6 -43.78 89.18 87.55 Random effects: Groups Name Variance Std.Dev. Part:Operator (Intercept) 2.25724 1.50241 Part …

2
Rのウィルコクソン順位和検定の効果サイズを決定する方法は?
2つのグループ間で平均p値に差があるかどうかを確認したいと思います。これを行うために、ウィルコクソンの順位和検定を実行します(データは通常は分散されません)。ここまでは順調ですね。最後に、対応するエフェクトサイズを計算します。残念ながら、Rはこれを提供していません。また、次を使用して効果サイズを簡単に計算できるz値も提供しません。効果サイズ= z / sqrt(N) ここにいくつかのサンプルRコードがあります: a=rep(0:1,each=20) #grouping variable b=c(rnorm(20, .03,.01), rnorm(20, .02, .009)) #vector of p-values d=cbind(a,b) test = wilcox.test(b ~ a, data = d) #perform Wilcoxon rank-sum test test 誰かがエフェクトサイズを取得する方法を知っていますか?

1
Rの新しいデータの混合モデルから固定効果のみの予測を取得する
固定効果のみを使用し、ランダム効果を0に保持して、新しいデータセットで混合モデル(glmerを介したロジスティック)の予測を構築したいと思います。しかし、それらを計算できるようにモデルマトリックスを設定するのに問題があります。 merクラスには予測メソッドがないため、新しいデータセットの予測のランダム効果を省略したいので、元の構造で使用されているのと同じ構造の固定効果のモデル行列を作成する必要があると思いますモデルですが、新しいデータを使用しています。次に、モデルの固定効果係数を掛けます。 モデル式の固定効果部分には、数値の固定効果間の因子と交互作用項が含まれているため、行列から固定変数を抽出するよりも少し複雑です。たとえば、因子コントラスト展開が元と同じであること、相互作用項が適切にリストされていることなどを確認する必要があります。 だから私の質問は:モデルの作成に使用された元のモデルマトリックスの構造を模倣する新しいモデルマトリックスを構築するためのより簡単な一般的なアプローチは何ですか? 私はmodel.matrix(my.model、data = newdata)を試しましたが、それはnewdataに基づくものではなく、元のモデル行列を返すようです。 サンプルコード: library(lme4) cake2 <- head(cake) # cake2 is "new" data frame for future predictions # recipe is a fixed effect factor, temp is fixed effect numeric, replicate is random effect m <- lmer(angle ~ temp + recipe + (1 | replicate), data=cake) summary(m) …
8 r  mixed-model 

4
複数の点が与えられた線の勾配[閉じた]
閉まっている。この質問はトピックから外れています。現在、回答を受け付けていません。 この質問を改善してみませんか? 質問を更新することがありますので、話題のクロス検証済みのため。 4年前休業。 開始(y)値のデータがあり、日数で測定された(x)時間の経過に応じて順次増加/減少します。データの線形回帰を作成するためのこのリンクを見つけました http://www.easycalculation.com/statistics/regression.php 勾配計算をExcelで自動化したい。誰かがそれを行う方法についてのアイデアを持っていますか?ページの下部に数式が表示されます N∑ XY− ∑ X∑ YN∑ X2− (∑ X)2NΣバツY−ΣバツΣYNΣバツ2−(Σバツ)2\frac{N\sum XY- \sum X\sum Y}{N\sum X^2-(\sum X)^2} しかし、それをExcelの数式に変換する方法がわかりません。問題は主にとです。その他は、および関数で簡単です。私のx座標とy座標は、is とisのような行にあります。∑ XYΣバツY\sum XY∑ X2Σバツ2\sum X^2countsumpowC1x1D1x2
8 r  regression  excel 

1
lmeオブジェクトから予測を取得する際のエラー
lmeオブジェクトから観測の予測を取得しようとしています。これは非常に簡単なはずです。しかし、さまざまな試行でさまざまなタイプのエラーが発生するため、何かが足りないようです。私のモデルは次のとおりです: model <- lme(log(child_mortality) ~ as.factor(cluster)*time + my.new.time.one.transition.low.and.middle + ttd + maternal_educ+ log(IHME_id_gdppc) + hiv_prev-1, merged0,na.action=na.omit,method="ML",weights=varPower(form=~time), random= ~ time| country.x, correlation=corAR1(form = ~ time), control=lmeControl(msMaxIter = 200, msVerbose = TRUE)) それはうまく動作し、データによく適合し、結果は理にかなっています。予測を得るために、私は以下を試しました: test.pred <- data.frame(time=c(10,10,10,10),country.x=c("Poland","Brazil", "Argentina","France"), my.new.time.one.transition.low.and.middle=c(1,1,1,0), ttd=c(0,0,0,0),maternal_educ=c(10,10,10,10), IHME_id_gdppc=c(log(5000),log(8000),log(8000),log(15000)), hiv_prev=c(.005,.005,.005,.005), cluster=c("One Transition, Middle Income","One Transition, Middle Income","One Transition, Middle Income","Democracy, High …

2
Rでそれぞれが異なる質量関数を持つ確率変数に対してからサンプリングする方法は?
Rにおいて、私はN× KN×KN \times K行列P I「の行Pの上の分布に対応\ {1、...、K \を}。基本的に、各行から効率的にサンプリングする必要があります。素朴な実装は次のとおりです。PPP私iiPPP{ 1 、。。。、K}{1,...,K}\{1, ..., K\} X = rep(0, N); for(i in 1:N){ X[i] = sample(1:K, 1, prob = P[i, ]); } これは非常に遅いです。原則として、これをCに移動できますが、これを行う既存の方法があるはずです。私は次のコードの精神で何かを望みます(これは機能しません): X = sample(1:K, N, replace = TRUE, prob = P) 編集:動機付けのために、N= 10000N=10000N = 10000とK = 100を取るK= 100K=100K = 100。私が持っているP1、。。。、P5000P1,...,P5000P_1, ..., P_{5000}すべての行列N× KN×KN …
8 r  mcmc 

1
時系列モデルのジャックナイフ
前書き 私は、いくつかのマクロ経済指標( 1を示すYtYtY_t)の年間成長率を予測することを目指しています。タスクの1つは、外生変数(、行列)がある場合とない場合のライバル時系列モデルの予測パフォーマンスをテストすることです。ライバルモデルのリストは次のとおりです。XtXtX_tT×kT×kT\times k AR(I)MAモデル(年間成長率に「単位Roo」があるとは考えられませんが、後者は想定またはテストされています)A(L)Yt=μ+B(L)εtA(L)Yt=μ+B(L)εtA(L)Y_t =\mu+ B(L)\varepsilon_t ARMAエラーのある線形回帰モデルYt=Xtβ+ηt, A(L)ηt=B(L)εtYt=Xtβ+ηt, A(L)ηt=B(L)εtY_t = X_t\beta + \eta_t, \ \ A(L)\eta_t = B(L)\varepsilon_t 従属変数モデル(外生変数を含む自己回帰モデル) A(L)Yt=Xtβ+εtA(L)Yt=Xtβ+εtA(L)Y_t = X_t\beta + \varepsilon_t 線形回帰モデル Yt=Xtβ+εtYt=Xtβ+εtY_t = X_t\beta + \varepsilon_t ここで強い白色雑音であると仮定され、ゼロ平均定数の分散処理をIID。およびは、(バックシフト(ラグ)演算子を使用した自己回帰(次数)および移動平均(次数)の多項式です。εtεt\varepsilon_tA(L)A(L)A(L)B(L)B(L)B(L)pppqqqLLL 主で唯一の目標はパフォーマンスの予測であるため、パラメータ推定の「良い」プロパティは二次的な問題であることに注意してください。私が必要なのは、開始条件予測ツールに対して最も簡潔で堅牢なものをテストすることです。いずれかのaccuracy()オプションで決定しますが、最初に比較用の資料を入手する必要があります。 モデル1.および2.はauto.arima()、デフォルトの"CSS-ML"推定方法で推定されます。モデル3.および4.は、通常の最小二乗(lm())によって推定されます。は約クォーターです。TTT404040 これまでに試みたアプローチ ジャックナイフ残差を作成するために、「ローリング」で示される最初のアプローチが実装されました。時系列データの実行可能な大きなサブサンプルから開始して、パラメーターが推定され、関数によって先の予測が行われます(編集:これは、前半のRobの2番目の質問に対する回答と同じ提案です)。その後、1つのポイントが追加され、推定/予測のステップが繰り返されます。hhhpredict() このような実験の弱点は、パラメーターの推定に使用される時間ティック(サンプルサイズ)の数が異なることです。推定のサンプルサイズを固定したまま、開始条件に対する堅牢性をテストしたいと思います。 これを念頭において、私は、いくつかの後続の値に設定しようとした(編集:間隔の)におけるある欠損値(NA)。モデル2.-4の場合。これは、データ行列対応する後続の行を削除することも意味します。3.および4.の予測は簡単です(省略されたデータ行と同じです)。私のすべての懸念はモデル1と2に関するものです。k+p+q<t0<t1<T−h+1k+p+q<t0<t1<T−h+1k+p+q0q>0q>0q>0 編集:ARMAパーツのパラメーターが正しく推定されているので、最初のサブサンプルの推定パラメーターとデータのみを含めるようにarimaオブジェクトを合法的に再配置して、予測関数を使用できますか? modpredict.ArimaYt+1|tYt+1|tY_{t+1|t}A^(L)(Yt−Xtβ^)+Xtβ^+B^(L)ε^tA^(L)(Yt−Xtβ^)+Xtβ^+B^(L)ε^t\hat A(L)(Y_t-X_t\hat \beta)+ X_t\hat \beta+\hat B(L)\hat \varepsilon_t KalmanForecast()。これは、状態空間表現がではなく同じ推定されたで提供されるため、予想されたものです。したがって、残っている唯一の問題は、ポイント予測に影響を与えるために重要なとの違いですか?私は答えが否定的であることを望みます。θjθj\theta_jθn,jθn,j\theta_{n,j}θjθj\theta_jθn,jθn,j\theta_{n,j}

2
指数関数的に減衰する共分散関数を使用したガウス(Ornstein Uhlenbeck)プロセスのシミュレーション
ガウス過程、平均0と共分散関数。1 ≤ T ≤ T γ (S 、T )= EXP (- | T - S |)ei(t)ei(t)e_i(t)1≤t≤T1≤t≤T1\leq t \leq Tγ(s,t)=exp(−|t−s|)γ(s,t)=exp⁡(−|t−s|)\gamma(s,t)=\exp(-|t-s|) 共分散行列の平方根の計算を含まない、これを行う効率的な方法はありますか?または、誰でもこれを行うためのパッケージを推奨できますか?T×TT×TT \times TR



弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.