タグ付けされた質問 「exponential」

ポアソンプロセスのイベント間の時間を表す分布。幾何分布の連続的な類似物。

2
カイ2乗変量の無限コレクションの統計(たとえば、最小)を注文しますか?
今回が初めてなので、フォーマットやタグなど、何らかの形で質問を明確にできるかどうか教えてください。(うまくいけば、後で編集できます!)参照を見つけて、誘導を使用して自分自身を解決しようとしましたが、両方で失敗しました。 私は、自由度の異なる独立した確率変数の無数に無限の集合の次数統計に減少するように見える分布を単純化しようとしています。具体的には、独立した中で番目に小さい値の分布は何ですか? m個χ 2 2、χ 2 4、χ 2 6、χ 2 8、...χ2χ2\chi^2mmmχ22,χ24,χ26,χ28,…χ22,χ42,χ62,χ82,…\chi^2_2,\chi^2_4,\chi^2_6,\chi^2_8,\ldots 特別なケース興味があります:(独立した)の最小値の分布はどうですか?χ 2 2、χ 2 4、χ 2 6、...m=1m=1m=1χ22,χ24,χ26,…χ22,χ42,χ62,…\chi^2_2,\chi^2_4,\chi^2_6,\ldots 最小値の場合、累積分布関数(CDF)を無限積として書くことができましたが、それをさらに単純化することはできません。のCDF が (場合、これにより、期待値2の指数分布との等価性に関する以下の2番目のコメントが確認されます。)最小値のCDFは、として記述できます。 製品の最初の項はであり、「最後の」項は F 2 M(X )= γ (M 、X / 2 )/ Γ (M )= γ (M 、X / 2 )/(M - 1 )!= 1 − e − x / …

1
R / mgcv:なぜte()とti()テンソル積が異なる表面を生成するのですか?
のmgcvパッケージにRは、テンソル積の相互作用をフィッティングするための2つの関数がte()ありti()ます。私は2つの作業の基本的な分業を理解しています(非線形の相互作用を当てはめるか、この相互作用を主効果と相互作用に分解するか)。私が理解していないのは、なぜte(x1, x2)、そしてti(x1) + ti(x2) + ti(x1, x2)(わずかに)異なる結果を生成するのかということです。 MWE(から適応?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

3
逆指数分布の平均
確率変数与えられた場合、の平均と分散は何ですか?G = 1Y=Exp(λ)Y=Exp(λ)Y = Exp(\lambda)G=1YG=1YG=\dfrac{1}{Y} 私は逆ガンマ分布を調べますが、平均と分散はそれぞれとに対してのみ定義されています...α > 2α>1α>1\alpha>1α>2α>2\alpha>2

3
歪んだデータによる回帰
ユーザー属性とサービスから訪問数を計算しようとしています。データは非常に歪んでいます。 ヒストグラム: qqプロット(左は対数): m <- lm(d$Visits~d$Age+d$Gender+city+service) m <- lm(log(d$Visits)~d$Age+d$Gender+city+service) cityとservice因子変数です。 すべての変数で低いp値***が得られますが、rの2乗が.05と低くなっています。私は何をすべきか?指数関数などの別のモデルが機能しますか?

1
MLEである
仮定(X,Y)(X,Y)(X,Y) PDFを有します fθ(x,y)=e−(x/θ+θy)1x>0,y>0,θ>0fθ(x,y)=e−(x/θ+θy)1x>0,y>0,θ>0f_{\theta}(x,y)=e^{-(x/\theta+\theta y)}\mathbf1_{x>0,y>0}\quad,\,\theta>0 試料の密度(X,Y)=(Xi,Yi)1≤i≤n(X,Y)=(Xi,Yi)1≤i≤n(\mathbf X,\mathbf Y)=(X_i,Y_i)_{1\le i\le n}この集団から引き出され、したがってあります gθ(x,y)=∏i=1nfθ(xi,yi)=exp[−∑i=1n(xiθ+θyi)]1x1,…,xn,y1,…,yn>0=exp[−nx¯θ−θny¯]1x(1),y(1)>0,θ>0gθ(x,y)=∏i=1nfθ(xi,yi)=exp⁡[−∑i=1n(xiθ+θyi)]1x1,…,xn,y1,…,yn>0=exp⁡[−nx¯θ−θny¯]1x(1),y(1)>0,θ>0\begin{align} g_{\theta}(\mathbf x,\mathbf y)&=\prod_{i=1}^n f_{\theta}(x_i,y_i) \\&=\exp\left[{-\sum_{i=1}^n\left(\frac{x_i}{\theta}+\theta y_i\right)}\right]\mathbf1_{x_1,\ldots,x_n,y_1,\ldots,y_n>0} \\&=\exp\left[-\frac{n\bar x}{\theta}-\theta n\bar y\right]\mathbf1_{x_{(1)},y_{(1)}>0}\quad,\,\theta>0 \end{align} θθ\thetaの最尤推定量は、次のように導出できます。 θ^(X,Y)=X¯¯¯¯Y¯¯¯¯−−−√θ^(X,Y)=X¯Y¯\hat\theta(\mathbf X,\mathbf Y)=\sqrt\frac{\overline X}{\overline Y} このMLEの制限分布が正常かどうかを知りたいです。 のための十分統計ことは明らかであるθθ\thetaサンプルに基づいている(X¯¯¯¯,Y¯¯¯¯)(X¯,Y¯)(\overline X,\overline Y)。 さて、MLEが通常の1パラメータ指数ファミリーのメンバーであれば、疑いもなくMLEは漸近的に正常であると私は言ったでしょう。1次元のパラメーター(たとえば、N(θ,θ2)N(θ,θ2)N(\theta,\theta^2)分布のように)に対して2次元の十分な統計量があるため、そうではないと思います。 事実を使用していることをXXXとYYY実際の独立した指数変数であり、私がすることができます示しての正確な分布というθはそのようになっていますθ^θ^\hat\theta θ^θ=dF−−√, where F∼F2n,2nθ^θ=dF, where F∼F2n,2n\frac{\hat\theta}{\theta}\stackrel{d}{=} \sqrt F\quad,\text{ where }F\sim F_{2n,2n} ここから限界分布を見つけることはできません。 代わりに、私はそのWLLNで主張することができX¯¯¯¯⟶PθX¯⟶Pθ\overline X\stackrel{P}\longrightarrow\thetaとY¯¯¯¯⟶P1/θY¯⟶P1/θ\overline Y\stackrel{P}\longrightarrow 1/\thetaので、そのθθ^⟶Pθθ^⟶Pθ\hat\theta\stackrel{P}\longrightarrow\theta。 これは、と言われますθ分布の収束をしますθ。以来、しかし、これは、驚きと来ないθはの「良い」推定量ですθ。そして、この結果は√のようなものがθ^θ^\hat\thetaθθ\thetaθ^θ^\hat\thetaθθ\thetan−−√(θ^−θ)n(θ^−θ)\sqrt n(\hat\theta-\theta)で漸近的に正常かではありません。CLTを使用しても妥当な議論を思い付くことはできませんでした。 …

1
間隔の比率分布とサンプルの意味は何ですか?
レッツ平均でIID指数確率変数のサンプルで、および聞かせて、このサンプルから順序統計こと。ましょう。X1,…,XnX1,…,XnX_1,\dots,X_nββ\betaX(1),…,X(n)X(1),…,X(n)X_{(1)},\dots,X_{(n)}X¯=1n∑ni=1XiX¯=1n∑i=1nXi\bar X = \frac{1}{n}\sum_{i=1}^n X_i 間隔を定義各も指数関数的であり、平均がことを示すことができます。Wi=X(i+1)−X(i) ∀ 1≤i≤n−1.Wi=X(i+1)−X(i) ∀ 1≤i≤n−1.W_i=X_{(i+1)}-X_{(i)}\ \forall\ 1 \leq i \leq n-1\,. WiWiW_iβi=βn−iβi=βn−i\beta_i=\frac{\beta}{n-i} 質問:が既知で負でない場合、どのように見つけますか?P(WiX¯>t)P(WiX¯>t)\mathbb{P}\left( \frac{W_i}{\bar X} > t \right)ttt 試行:これは1-F_ {W_i} \ left(t \ bar X \ right)に等しいことを知っています1−FWi(tX¯)1−FWi(tX¯)1 - F_{W_i}\left(t \bar X\right)。したがって、私は次のような総確率の法則を使用しました: P(Wi>tX¯)=1−FWi(tX¯)=1−∫∞0FWi(ts)fX¯(s)ds,P(Wi>tX¯)=1−FWi(tX¯)=1−∫0∞FWi(ts)fX¯(s)ds, \mathbb{P}\left( W_i > t \bar X \right) = 1 - F_{W_i}\left( t \bar …

1
最小の指数分布のための最尤推定量
私はこの問題を解決する方法にこだわっています。 したがって、ランダム変数の2つのシーケンス、およびがあります。現在、とは、パラメータと持つ独立した指数分布です。ただし、とを観測する代わりに、とを観測し。、Y I、I = 1 、。。。、nはX Y λ μ X Y Z WXiXiX_iYiYiY_ii=1,...,ni=1,...,ni=1,...,nXXXYYYλλ\lambdaμμ\muXXXYYYZZZWWW Z=min(Xi,Yi)Z=min(Xi,Yi)Z=\min(X_i,Y_i)及びW=1W=1W=1であればZi=XiZi=XiZ_i=X_iと0の場合Zi=YiZi=YiZ_i=Y_i。ZとWに基づいてλλ\lambdaと\ muの最尤推定量の閉形式を見つける必要があります。さらに、これらがグローバルな最大値であることを示す必要があります。μμ\muZZZWWW これで、2つの独立した指数の最小値自体が指数であり、レートはレートの合計に等しいため、ZZZがパラメーター\ lambda + \ muで指数関数であることがわかりますλ+μλ+μ\lambda+\mu。したがって、最尤推定量はλ^+μ^=Z¯λ^+μ^=Z¯\hat{\lambda}+\hat{\mu}=\bar{Z}です。 しかし、私はここからどこへ行くべきか悩んでいます。WWWがパラメーターp = P(Z_i = X_i)のベルヌーイ分布であることは知っていますが、p=P(Zi=Xi)p=P(Zi=Xi)p=P(Z_i=X_i)これをパラメーターの1つに関するステートメントに変換する方法がわかりません。たとえば、MLEのW¯W¯\bar{W}はλλ\lambdaや\ muの観点から何を推定するμμ\muでしょうか?私は理解しているかのZi=XiZi=XiZ_i=X_i、その後、μ=0μ=0\mu=0が、私はここで、任意の代数の文を思い付く方法を考え出す苦労しています。 更新1:ZZZとWの共同分布の可能性を導き出すようコメントで言われましたWWW。 したがって、 whereです。正しい?この場合、とは独立していないため、共同分布を導出する他の方法がわかりません。f(Z,W)=f(Z|W=1)⋅p+f(Z|W=0)⋅(1−p)f(Z,W)=f(Z|W=1)⋅p+f(Z|W=0)⋅(1−p)f(Z,W)=f(Z|W=1)\cdot p+f(Z|W=0)\cdot (1-p)p=P(Zi=Xi)p=P(Zi=Xi)p=P(Z_i=X_i)ZZZWWW したがって、これは、上記のの定義により、を与えます。しかし、今何ですか?これではどこにも行けません。可能性を計算する手順を実行すると、次のようになります(混合物の各部分のサンプルサイズとしてとを使用...)f(Zi,Wi)=pλe−λzi+(1−p)μe−μzif(Zi,Wi)=pλe−λzi+(1−p)μe−μzif(Z_i,W_i)=p\lambda e^{-\lambda z_i}+(1-p)\mu e^{-\mu z_i}WWWmmmnnn L(λ,μ)=pmλme−λ∑zi+(1−p)nμne−μ∑ziL(λ,μ)=pmλme−λ∑zi+(1−p)nμne−μ∑ziL(\lambda,\mu)=p^m\lambda^m e^{-\lambda \sum{z_i}}+(1-p)^n\mu^n e^{-\mu \sum{z_i}} logL=mlogp+mlogλ−λ∑zi+nlog(1−p)+nlogμ−μ∑zilog⁡L=mlog⁡p+mlog⁡λ−λ∑zi+nlog⁡(1−p)+nlog⁡μ−μ∑zi\log L=m\log p+m\log\lambda-\lambda \sum{z_i}+n\log(1-p)+n\log\mu-\mu \sum{z_i} 偏微分をとると、これはと MLE推定が条件とするの平均にすぎないことを示してます。あれは、λλ\lambdaμμ\muZZZWWW λ^=∑Zimλ^=∑Zim\hat{\lambda}=\frac{\sum{Z_i}}{m} μ^=∑Zinμ^=∑Zin\hat{\mu}=\frac{\sum{Z_i}}{n} …

2
データが指数分布に適合する2つのサンプルの平均を比較する方法
データの2つのサンプル、ベースラインサンプル、および処理サンプルがあります。 仮説は、処理サンプルの平均がベースラインサンプルよりも高いというものです。 どちらのサンプルも指数関数的です。データはかなり大きいので、テストを実行するときの各サンプルの要素の平均と数しかありません。 どうすればその仮説を検証できますか?私はそれが非常に簡単であると思います、そして私はF-Testを使用するためのいくつかの参照に出くわしましたが、パラメーターがどのようにマップされるかわかりません。

1
正規分布クロックの不正確さの修正
特定のイベントの発生を測定する、世界中に分散した何百ものコンピューターで実行される実験があります。各イベントは互いに依存しているので、それらを昇順に並べてから、時間差を計算できます。 イベントは指数的に分布する必要がありますが、ヒストグラムをプロットすると、次のようになります。 コンピュータのクロックが不正確であるため、一部のイベントには、依存するイベントよりも早いタイムスタンプが割り当てられます。 PDFのピークが0ではない(全体が右にシフトした)ために、クロック同期が非難されるのではないかと思いますか? クロックの差が正規分布している場合、影響が互いに相殺し、計算された時間差だけを使用すると仮定できますか?

1
相互に排他的でないカテゴリを分類できる深層学習モデル
例:仕事の説明に「英国のJavaシニアエンジニア」という文があります。 私は2つのカテゴリとして、それを予測することは、深い学習モデルを使用したい:English とIT jobs。従来の分類モデルを使用する場合softmax、最後のレイヤーで機能を持つ1つのラベルのみを予測できます。したがって、2つのモデルのニューラルネットワークを使用して、両方のカテゴリで「はい」/「いいえ」を予測できますが、さらに多くのカテゴリがあると、コストがかかりすぎます。では、2つ以上のカテゴリを同時に予測するためのディープラーニングまたは機械学習モデルはありますか? 「編集」:従来のアプローチによる3つのラベルでは、[1,0,0]によってエンコードされますが、私の場合、[1,1,0]または[1,1,1]によってエンコードされます 例:3つのラベルがあり、文がこれらすべてのラベルに収まる場合。したがって、softmax関数からの出力が[0.45、0.35、0.2]である場合、3つのラベルまたは2つのラベルに分類する必要がありますか、それとも1つにすることができますか?それを行うときの主な問題は、1、2、または3つのラベルに分類するための適切なしきい値は何ですか?
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
シミュレーションによる重要度サンプリングのカバレッジが予想より低い
私はRの重要性サンプリング法と積分を評価する質問に答えようとしていました。基本的に、ユーザーは計算する必要があります ∫π0f(x)dx=∫π01cos(x)2+x2dx∫0πf(x)dx=∫0π1cos⁡(x)2+x2dx\int_{0}^{\pi}f(x)dx=\int_{0}^{\pi}\frac{1}{\cos(x)^2+x^2}dx 指数分布を重要度分布として使用する q(x)=λ exp−λxq(x)=λ exp−λxq(x)=\lambda\ \exp^{-\lambda x} そして、積分のより良い近似を与えるの値を見つけます(それはです)。私は、平均値の評価などの問題を書き直すμのF (X )上に[ 0 、π ]:積分次いでだけでπ μ。 λλ\lambdaself-studyμμ\muf(x)f(x)f(x)[0,π][0,π][0,\pi]πμπμ\pi\mu このように、聞かせてのPDFであるX 〜U(0 、π )、およびlet Y 〜のF (X )の目標は、現在推定することです。p(x)p(x)p(x)X∼U(0,π)X∼U(0,π)X\sim\mathcal{U}(0,\pi)Y∼f(X)Y∼f(X)Y\sim f(X) μ=E[Y]=E[f(X)]=∫Rf(x)p(x)dx=∫π01cos(x)2+x21πdxμ=E[Y]=E[f(X)]=∫Rf(x)p(x)dx=∫0π1cos⁡(x)2+x21πdx\mu=\mathbb{E}[Y]=\mathbb{E}[f(X)]=\int_{\mathbb{R}}f(x)p(x)dx=\int_{0}^{\pi}\frac{1}{\cos(x)^2+x^2}\frac{1}{\pi}dx 重要性サンプリングを使用します。Rでシミュレーションを実行しました。 # clear the environment and set the seed for reproducibility rm(list=ls()) gc() graphics.off() set.seed(1) # function to be integrated f <- function(x){ 1 …

1
尤度関数の計算方法
3つの電子部品の寿命は、およびです。確率変数は、パラメーターを使用した指数分布からサイズ3のランダムサンプルとしてモデル化されています。尤度関数は、X1=3,X2=1.5,X1=3,X2=1.5,X_{1} = 3, X_{2} = 1.5,X3=2.1X3=2.1X_{3} = 2.1θθ\thetaθ>0θ>0\theta > 0 f3(x|θ)=θ3exp(−6.6θ)f3(x|θ)=θ3exp(−6.6θ)f_{3}(x|\theta) = \theta^{3} exp(-6.6\theta)、ここで。x=(2,1.5,2.1)x=(2,1.5,2.1)x = (2, 1.5, 2.1) そして、問題はを最大化するの値を見つけることによってMLEを決定するために進み。私の質問は、どのようにして尤度関数を決定するのですか?指数分布のpdfを調べましたが、違います。それで、問題の中で尤度関数は常に私に与えられますか?それとも自分で決定する必要がありますか?もしそうなら、どうですか?θθ\thetalogf3(x|θ)logf3(x|θ)log f_{3}(x|\theta)

1
観測されたイベントと期待されたイベントを比較する方法は?
4つの可能なイベントの頻度の1つのサンプルがあるとします。 Event1 - 5 E2 - 1 E3 - 0 E4 - 12 そして、私は自分のイベントの発生が予想される確率を持っています: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 4つのイベントの観測頻度の合計(18)を使用して、イベントの予想頻度を計算できますか? expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 = 1.8 expectedE1 - …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

2
データのROC曲線を計算する
そのため、ハミング距離を使用して生体認証特性から個人を認証しようとしている16のトライアルがあります。しきい値は3.5に設定されています。私のデータは以下であり、トライアル1のみが真陽性です。 Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 私の混乱のポイントは、このデータからROC曲線(FPR対TPR OR FAR対FRR)を作成する方法が本当にわからないということです。どちらでもかまいませんが、どうやって計算するのか混乱しています。任意の助けいただければ幸いです。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

2
負のy値による指数関数的減衰の近似
高い減衰値で負になるy値に指数関数的減衰関数を適合させようとしていますが、nls関数を正しく構成できません。 目的 減衰関数の傾きに興味があります(いくつかの情報源によると)。この勾配をどのように取得するかは重要ではありませんが、モデルはできる限りデータに適合している必要があります(つまり、適合が良好であれば、問題の線形化は許容可能です。「線形化」を参照してください)。しかし、このトピックに関するこれまでの研究では、次の指数関数的減衰関数を使用しています(Stedmon et al。によるクローズドアクセスの記事、方程式3)。λλ\lambda f(y)=a×exp(−S×x)+Kf(y)=a×exp(−S×x)+Kf(y) = a \times exp(-S \times x) + K ここSで、私が関心を持っている勾配は、K負の値とa初期値x(つまり切片)を許可するための補正係数です。 私はこれをRで行う必要があります。発色団溶存有機物 (CDOM)の生の測定値を研究者が興味のある値に変換する関数を書いているからです。 データの例 データの性質上、PasteBinを使用する必要がありました。例えば、データはこちらから入手できます。 書くdt <-とあなたのRコンソールにコードFOMペーストビンをコピーします。すなわち dt <- structure(list(x = ... データは次のようになります。 library(ggplot2) ggplot(dt, aes(x = x, y = y)) + geom_point() 場合、負のy値が発生します。x>540nmx>540nmx > 540 nm を使用して解決策を見つけようとしています nls を使用nlsして最初に試行すると、特異性が生じます。これは、パラメータの開始値を目で確認しただけであっても、驚くことではありません。 nls(y ~ a * exp(-S * …
9 r  model  exponential 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.