統計とビッグデータ exponential

2

今回が初めてなので、フォーマットやタグなど、何らかの形で質問を明確にできるかどうか教えてください。（うまくいけば、後で編集できます！）参照を見つけて、誘導を使用して自分自身を解決しようとしましたが、両方で失敗しました。私は、自由度の異なる独立した確率変数の無数に無限の集合の次数統計に減少するように見える分布を単純化しようとしています。具体的には、独立した中で番目に小さい値の分布は何ですか？ m個χ 2 2、χ 2 4、χ 2 6、χ 2 8、...χ2χ2\chi^2mmmχ22,χ24,χ26,χ28,…χ22,χ42,χ62,χ82,…\chi^2_2,\chi^2_4,\chi^2_6,\chi^2_8,\ldots 特別なケース興味があります：（独立した）の最小値の分布はどうですか？χ 2 2、χ 2 4、χ 2 6、...m=1m=1m=1χ22,χ24,χ26,…χ22,χ42,χ62,…\chi^2_2,\chi^2_4,\chi^2_6,\ldots 最小値の場合、累積分布関数（CDF）を無限積として書くことができましたが、それをさらに単純化することはできません。のCDF が（場合、これにより、期待値2の指数分布との等価性に関する以下の2番目のコメントが確認されます。）最小値のCDFは、として記述できます。製品の最初の項はであり、「最後の」項は F 2 M（X ）= γ （M 、X / 2 ）/ Γ （M ）= γ （M 、X / 2 ）/（M - 1 ）！= 1 − e − x / …

11 distributions chi-squared exponential order-statistics minimum

1

R / mgcv：なぜte（）とti（）テンソル積が異なる表面を生成するのですか？

のmgcvパッケージにRは、テンソル積の相互作用をフィッティングするための2つの関数がte()ありti()ます。私は2つの作業の基本的な分業を理解しています（非線形の相互作用を当てはめるか、この相互作用を主効果と相互作用に分解するか）。私が理解していないのは、なぜte(x1, x2)、そしてti(x1) + ti(x2) + ti(x1, x2)（わずかに）異なる結果を生成するのかということです。 MWE（から適応?ti）： require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …

11 r gam mgcv conditional-probability mixed-model references bayesian estimation conditional-probability machine-learning optimization gradient-descent r hypothesis-testing wilcoxon-mann-whitney time-series bayesian inference change-point time-series anova repeated-measures statistical-significance bayesian contingency-tables regression prediction quantiles classification auc k-means scikit-learn regression spatial circular-statistics t-test effect-size cohens-d r cross-validation feature-selection caret machine-learning modeling python optimization frequentist correlation sample-size normalization group-differences heteroscedasticity independence generalized-least-squares lme4-nlme references mcmc metropolis-hastings optimization r logistic feature-selection separation clustering k-means normal-distribution gaussian-mixture kullback-leibler java spark-mllib data-visualization categorical-data barplot hypothesis-testing statistical-significance chi-squared type-i-and-ii-errors pca scikit-learn conditional-expectation statistical-significance meta-analysis intuition r time-series multivariate-analysis garch machine-learning classification data-mining missing-data cart regression cross-validation matrix-decomposition categorical-data repeated-measures chi-squared assumptions contingency-tables prediction binary-data trend test-for-trend matrix-inverse anova categorical-data regression-coefficients standard-error r distributions exponential interarrival-time copula log-likelihood time-series forecasting prediction-interval mean standard-error meta-analysis meta-regression network-meta-analysis systematic-review normal-distribution multiple-regression generalized-linear-model poisson-distribution poisson-regression r sas cohens-kappa

3

逆指数分布の平均

確率変数与えられた場合、の平均と分散は何ですか？G = 1Y=Exp(λ)Y=Exp(λ)Y = Exp(\lambda)G=1YG=1YG=\dfrac{1}{Y} 私は逆ガンマ分布を調べますが、平均と分散はそれぞれとに対してのみ定義されています...α > 2α>1α>1\alpha>1α>2α>2\alpha>2

11 variance mean exponential

3

歪んだデータによる回帰

ユーザー属性とサービスから訪問数を計算しようとしています。データは非常に歪んでいます。ヒストグラム： qqプロット（左は対数）： m <- lm(d$Visits~d$Age+d$Gender+city+service) m <- lm(log(d$Visits)~d$Age+d$Gender+city+service) cityとservice因子変数です。すべての変数で低いp値***が得られますが、rの2乗が.05と低くなっています。私は何をすべきか？指数関数などの別のモデルが機能しますか？

11 regression multiple-regression predictive-models exponential qq-plot

1

MLEである

仮定(X,Y)(X,Y)(X,Y) PDFを有します fθ(x,y)=e−(x/θ+θy)1x>0,y>0,θ>0fθ(x,y)=e−(x/θ+θy)1x>0,y>0,θ>0f_{\theta}(x,y)=e^{-(x/\theta+\theta y)}\mathbf1_{x>0,y>0}\quad,\,\theta>0 試料の密度(X,Y)=(Xi,Yi)1≤i≤n(X,Y)=(Xi,Yi)1≤i≤n(\mathbf X,\mathbf Y)=(X_i,Y_i)_{1\le i\le n}この集団から引き出され、したがってあります gθ(x,y)=∏i=1nfθ(xi,yi)=exp[−∑i=1n(xiθ+θyi)]1x1,…,xn,y1,…,yn>0=exp[−nx¯θ−θny¯]1x(1),y(1)>0,θ>0gθ(x,y)=∏i=1nfθ(xi,yi)=exp⁡[−∑i=1n(xiθ+θyi)]1x1,…,xn,y1,…,yn>0=exp⁡[−nx¯θ−θny¯]1x(1),y(1)>0,θ>0\begin{align} g_{\theta}(\mathbf x,\mathbf y)&=\prod_{i=1}^n f_{\theta}(x_i,y_i) \\&=\exp\left[{-\sum_{i=1}^n\left(\frac{x_i}{\theta}+\theta y_i\right)}\right]\mathbf1_{x_1,\ldots,x_n,y_1,\ldots,y_n>0} \\&=\exp\left[-\frac{n\bar x}{\theta}-\theta n\bar y\right]\mathbf1_{x_{(1)},y_{(1)}>0}\quad,\,\theta>0 \end{align} θθ\thetaの最尤推定量は、次のように導出できます。 θ^(X,Y)=X¯¯¯¯Y¯¯¯¯−−−√θ^(X,Y)=X¯Y¯\hat\theta(\mathbf X,\mathbf Y)=\sqrt\frac{\overline X}{\overline Y} このMLEの制限分布が正常かどうかを知りたいです。のための十分統計ことは明らかであるθθ\thetaサンプルに基づいている(X¯¯¯¯,Y¯¯¯¯)(X¯,Y¯)(\overline X,\overline Y)。さて、MLEが通常の1パラメータ指数ファミリーのメンバーであれば、疑いもなくMLEは漸近的に正常であると私は言ったでしょう。1次元のパラメーター（たとえば、N(θ,θ2)N(θ,θ2)N(\theta,\theta^2)分布のように）に対して2次元の十分な統計量があるため、そうではないと思います。事実を使用していることをXXXとYYY実際の独立した指数変数であり、私がすることができます示しての正確な分布というθはそのようになっていますθ^θ^\hat\theta θ^θ=dF−−√, where F∼F2n,2nθ^θ=dF, where F∼F2n,2n\frac{\hat\theta}{\theta}\stackrel{d}{=} \sqrt F\quad,\text{ where }F\sim F_{2n,2n} ここから限界分布を見つけることはできません。代わりに、私はそのWLLNで主張することができX¯¯¯¯⟶PθX¯⟶Pθ\overline X\stackrel{P}\longrightarrow\thetaとY¯¯¯¯⟶P1/θY¯⟶P1/θ\overline Y\stackrel{P}\longrightarrow 1/\thetaので、そのθθ^⟶Pθθ^⟶Pθ\hat\theta\stackrel{P}\longrightarrow\theta。これは、と言われますθ分布の収束をしますθ。以来、しかし、これは、驚きと来ないθはの「良い」推定量ですθ。そして、この結果は√のようなものがθ^θ^\hat\thetaθθ\thetaθ^θ^\hat\thetaθθ\thetan−−√(θ^−θ)n(θ^−θ)\sqrt n(\hat\theta-\theta)で漸近的に正常かではありません。CLTを使用しても妥当な議論を思い付くことはできませんでした。 …

10 maximum-likelihood convergence exponential asymptotics central-limit-theorem

1

間隔の比率分布とサンプルの意味は何ですか？

レッツ平均でIID指数確率変数のサンプルで、および聞かせて、このサンプルから順序統計こと。ましょう。X1,…,XnX1,…,XnX_1,\dots,X_nββ\betaX(1),…,X(n)X(1),…,X(n)X_{(1)},\dots,X_{(n)}X¯=1n∑ni=1XiX¯=1n∑i=1nXi\bar X = \frac{1}{n}\sum_{i=1}^n X_i 間隔を定義各も指数関数的であり、平均がことを示すことができます。Wi=X(i+1)−X(i) ∀ 1≤i≤n−1.Wi=X(i+1)−X(i) ∀ 1≤i≤n−1.W_i=X_{(i+1)}-X_{(i)}\ \forall\ 1 \leq i \leq n-1\,. WiWiW_iβi=βn−iβi=βn−i\beta_i=\frac{\beta}{n-i} 質問：が既知で負でない場合、どのように見つけますか？P(WiX¯>t)P(WiX¯>t)\mathbb{P}\left( \frac{W_i}{\bar X} > t \right)ttt 試行：これは1-F_ {W_i} \ left（t \ bar X \ right）に等しいことを知っています1−FWi(tX¯)1−FWi(tX¯)1 - F_{W_i}\left(t \bar X\right)。したがって、私は次のような総確率の法則を使用しました： P(Wi>tX¯)=1−FWi(tX¯)=1−∫∞0FWi(ts)fX¯(s)ds,P(Wi>tX¯)=1−FWi(tX¯)=1−∫0∞FWi(ts)fX¯(s)ds, \mathbb{P}\left( W_i > t \bar X \right) = 1 - F_{W_i}\left( t \bar …

10 probability distributions exponential order-statistics

1

最小の指数分布のための最尤推定量

私はこの問題を解決する方法にこだわっています。したがって、ランダム変数の2つのシーケンス、およびがあります。現在、とは、パラメータと持つ独立した指数分布です。ただし、とを観測する代わりに、とを観測し。、Y I、I = 1 、。。。、nはX Y λ μ X Y Z WXiXiX_iYiYiY_ii=1,...,ni=1,...,ni=1,...,nXXXYYYλλ\lambdaμμ\muXXXYYYZZZWWW Z=min(Xi,Yi)Z=min(Xi,Yi)Z=\min(X_i,Y_i)及びW=1W=1W=1であればZi=XiZi=XiZ_i=X_iと0の場合Zi=YiZi=YiZ_i=Y_i。ZとWに基づいてλλ\lambdaと\ muの最尤推定量の閉形式を見つける必要があります。さらに、これらがグローバルな最大値であることを示す必要があります。μμ\muZZZWWW これで、2つの独立した指数の最小値自体が指数であり、レートはレートの合計に等しいため、ZZZがパラメーター\ lambda + \ muで指数関数であることがわかりますλ+μλ+μ\lambda+\mu。したがって、最尤推定量はλ^+μ^=Z¯λ^+μ^=Z¯\hat{\lambda}+\hat{\mu}=\bar{Z}です。しかし、私はここからどこへ行くべきか悩んでいます。WWWがパラメーターp = P（Z_i = X_i）のベルヌーイ分布であることは知っていますが、p=P(Zi=Xi)p=P(Zi=Xi)p=P(Z_i=X_i)これをパラメーターの1つに関するステートメントに変換する方法がわかりません。たとえば、MLEのW¯W¯\bar{W}はλλ\lambdaや\ muの観点から何を推定するμμ\muでしょうか？私は理解しているかのZi=XiZi=XiZ_i=X_i、その後、μ=0μ=0\mu=0が、私はここで、任意の代数の文を思い付く方法を考え出す苦労しています。更新1：ZZZとWの共同分布の可能性を導き出すようコメントで言われましたWWW。したがって、 whereです。正しい？この場合、とは独立していないため、共同分布を導出する他の方法がわかりません。f(Z,W)=f(Z|W=1)⋅p+f(Z|W=0)⋅(1−p)f(Z,W)=f(Z|W=1)⋅p+f(Z|W=0)⋅(1−p)f(Z,W)=f(Z|W=1)\cdot p+f(Z|W=0)\cdot (1-p)p=P(Zi=Xi)p=P(Zi=Xi)p=P(Z_i=X_i)ZZZWWW したがって、これは、上記のの定義により、を与えます。しかし、今何ですか？これではどこにも行けません。可能性を計算する手順を実行すると、次のようになります（混合物の各部分のサンプルサイズとしてとを使用...）f(Zi,Wi)=pλe−λzi+(1−p)μe−μzif(Zi,Wi)=pλe−λzi+(1−p)μe−μzif(Z_i,W_i)=p\lambda e^{-\lambda z_i}+(1-p)\mu e^{-\mu z_i}WWWmmmnnn L(λ,μ)=pmλme−λ∑zi+(1−p)nμne−μ∑ziL(λ,μ)=pmλme−λ∑zi+(1−p)nμne−μ∑ziL(\lambda,\mu)=p^m\lambda^m e^{-\lambda \sum{z_i}}+(1-p)^n\mu^n e^{-\mu \sum{z_i}} logL=mlogp+mlogλ−λ∑zi+nlog(1−p)+nlogμ−μ∑zilog⁡L=mlog⁡p+mlog⁡λ−λ∑zi+nlog⁡(1−p)+nlog⁡μ−μ∑zi\log L=m\log p+m\log\lambda-\lambda \sum{z_i}+n\log(1-p)+n\log\mu-\mu \sum{z_i} 偏微分をとると、これはと MLE推定が条件とするの平均にすぎないことを示してます。あれは、λλ\lambdaμμ\muZZZWWW λ^=∑Zimλ^=∑Zim\hat{\lambda}=\frac{\sum{Z_i}}{m} μ^=∑Zinμ^=∑Zin\hat{\mu}=\frac{\sum{Z_i}}{n} …

10 self-study maximum-likelihood exponential minimum

2

データが指数分布に適合する2つのサンプルの平均を比較する方法

データの2つのサンプル、ベースラインサンプル、および処理サンプルがあります。仮説は、処理サンプルの平均がベースラインサンプルよりも高いというものです。どちらのサンプルも指数関数的です。データはかなり大きいので、テストを実行するときの各サンプルの要素の平均と数しかありません。どうすればその仮説を検証できますか？私はそれが非常に簡単であると思います、そして私はF-Testを使用するためのいくつかの参照に出くわしましたが、パラメーターがどのようにマップされるかわかりません。

10 hypothesis-testing statistical-significance exponential

1

正規分布クロックの不正確さの修正

特定のイベントの発生を測定する、世界中に分散した何百ものコンピューターで実行される実験があります。各イベントは互いに依存しているので、それらを昇順に並べてから、時間差を計算できます。イベントは指数的に分布する必要がありますが、ヒストグラムをプロットすると、次のようになります。コンピュータのクロックが不正確であるため、一部のイベントには、依存するイベントよりも早いタイムスタンプが割り当てられます。 PDFのピークが0ではない（全体が右にシフトした）ために、クロック同期が非難されるのではないかと思いますか？クロックの差が正規分布している場合、影響が互いに相殺し、計算された時間差だけを使用すると仮定できますか？

10 error measurement-error exponential

1

相互に排他的でないカテゴリを分類できる深層学習モデル

例：仕事の説明に「英国のJavaシニアエンジニア」という文があります。私は2つのカテゴリとして、それを予測することは、深い学習モデルを使用したい：English とIT jobs。従来の分類モデルを使用する場合softmax、最後のレイヤーで機能を持つ1つのラベルのみを予測できます。したがって、2つのモデルのニューラルネットワークを使用して、両方のカテゴリで「はい」/「いいえ」を予測できますが、さらに多くのカテゴリがあると、コストがかかりすぎます。では、2つ以上のカテゴリを同時に予測するためのディープラーニングまたは機械学習モデルはありますか？「編集」：従来のアプローチによる3つのラベルでは、[1,0,0]によってエンコードされますが、私の場合、[1,1,0]または[1,1,1]によってエンコードされます例：3つのラベルがあり、文がこれらすべてのラベルに収まる場合。したがって、softmax関数からの出力が[0.45、0.35、0.2]である場合、3つのラベルまたは2つのラベルに分類する必要がありますか、それとも1つにすることができますか？それを行うときの主な問題は、1、2、または3つのラベルに分類するための適切なしきい値は何ですか？

9 machine-learning deep-learning natural-language tensorflow sampling distance non-independent application regression machine-learning logistic mixed-model control-group crossover r multivariate-analysis ecology procrustes-analysis vegan regression hypothesis-testing interpretation chi-squared bootstrap r bioinformatics bayesian exponential beta-distribution bernoulli-distribution conjugate-prior distributions bayesian prior beta-distribution covariance naive-bayes smoothing laplace-smoothing distributions data-visualization regression probit penalized estimation unbiased-estimator fisher-information unbalanced-classes bayesian model-selection aic multiple-regression cross-validation regression-coefficients nonlinear-regression standardization naive-bayes trend machine-learning clustering unsupervised-learning wilcoxon-mann-whitney z-score econometrics generalized-moments method-of-moments machine-learning conv-neural-network image-processing ocr machine-learning neural-networks conv-neural-network tensorflow r logistic scoring-rules probability self-study pdf cdf classification svm resampling forecasting rms volatility-forecasting diebold-mariano neural-networks prediction-interval uncertainty

1

シミュレーションによる重要度サンプリングのカバレッジが予想より低い

私はRの重要性サンプリング法と積分を評価する質問に答えようとしていました。基本的に、ユーザーは計算する必要があります ∫π0f(x)dx=∫π01cos(x)2+x2dx∫0πf(x)dx=∫0π1cos⁡(x)2+x2dx\int_{0}^{\pi}f(x)dx=\int_{0}^{\pi}\frac{1}{\cos(x)^2+x^2}dx 指数分布を重要度分布として使用する q(x)=λ exp−λxq(x)=λ exp−λxq(x)=\lambda\ \exp^{-\lambda x} そして、積分のより良い近似を与えるの値を見つけます（それはです）。私は、平均値の評価などの問題を書き直すμのF （X ）上に[ 0 、π ]：積分次いでだけでπ μ。 λλ\lambdaself-studyμμ\muf(x)f(x)f(x)[0,π][0,π][0,\pi]πμπμ\pi\mu このように、聞かせてのPDFであるX 〜U（0 、π ）、およびlet Y 〜のF （X ）の目標は、現在推定することです。p(x)p(x)p(x)X∼U(0,π)X∼U(0,π)X\sim\mathcal{U}(0,\pi)Y∼f(X)Y∼f(X)Y\sim f(X) μ=E[Y]=E[f(X)]=∫Rf(x)p(x)dx=∫π01cos(x)2+x21πdxμ=E[Y]=E[f(X)]=∫Rf(x)p(x)dx=∫0π1cos⁡(x)2+x21πdx\mu=\mathbb{E}[Y]=\mathbb{E}[f(X)]=\int_{\mathbb{R}}f(x)p(x)dx=\int_{0}^{\pi}\frac{1}{\cos(x)^2+x^2}\frac{1}{\pi}dx 重要性サンプリングを使用します。Rでシミュレーションを実行しました。 # clear the environment and set the seed for reproducibility rm(list=ls()) gc() graphics.off() set.seed(1) # function to be integrated f <- function(x){ 1 …

9 r simulation exponential importance-sampling

1

尤度関数の計算方法

3つの電子部品の寿命は、およびです。確率変数は、パラメーターを使用した指数分布からサイズ3のランダムサンプルとしてモデル化されています。尤度関数は、X1=3,X2=1.5,X1=3,X2=1.5,X_{1} = 3, X_{2} = 1.5,X3=2.1X3=2.1X_{3} = 2.1θθ\thetaθ>0θ>0\theta > 0 f3(x|θ)=θ3exp(−6.6θ)f3(x|θ)=θ3exp(−6.6θ)f_{3}(x|\theta) = \theta^{3} exp(-6.6\theta)、ここで。x=(2,1.5,2.1)x=(2,1.5,2.1)x = (2, 1.5, 2.1) そして、問題はを最大化するの値を見つけることによってMLEを決定するために進み。私の質問は、どのようにして尤度関数を決定するのですか？指数分布のpdfを調べましたが、違います。それで、問題の中で尤度関数は常に私に与えられますか？それとも自分で決定する必要がありますか？もしそうなら、どうですか？θθ\thetalogf3(x|θ)logf3(x|θ)log f_{3}(x|\theta)

9 distributions maximum-likelihood exponential

1

観測されたイベントと期待されたイベントを比較する方法は？

4つの可能なイベントの頻度の1つのサンプルがあるとします。 Event1 - 5 E2 - 1 E3 - 0 E4 - 12 そして、私は自分のイベントの発生が予想される確率を持っています： p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 4つのイベントの観測頻度の合計（18）を使用して、イベントの予想頻度を計算できますか？ expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 = 1.8 expectedE1 - …

9 r statistical-significance chi-squared multivariate-analysis exponential joint-distribution statistical-significance self-study standard-deviation probability normal-distribution spss interpretation assumptions cox-model reporting cox-model statistical-significance reliability method-comparison classification boosting ensemble adaboost confidence-interval cross-validation prediction prediction-interval regression machine-learning svm regularization regression sampling survey probit matlab feature-selection information-theory mutual-information time-series forecasting simulation classification boosting ensemble adaboost normal-distribution multivariate-analysis covariance gini clustering text-mining distance-functions information-retrieval similarities regression logistic stata group-differences r anova confidence-interval repeated-measures r logistic lme4-nlme inference fiducial kalman-filter classification discriminant-analysis linear-algebra computing statistical-significance time-series panel-data missing-data uncertainty probability multivariate-analysis r classification spss k-means discriminant-analysis poisson-distribution average r random-forest importance probability conditional-probability distributions standard-deviation time-series machine-learning online forecasting r pca dataset data-visualization bayes distributions mathematical-statistics degrees-of-freedom

2

データのROC曲線を計算する

そのため、ハミング距離を使用して生体認証特性から個人を認証しようとしている16のトライアルがあります。しきい値は3.5に設定されています。私のデータは以下であり、トライアル1のみが真陽性です。 Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 私の混乱のポイントは、このデータからROC曲線（FPR対TPR OR FAR対FRR）を作成する方法が本当にわからないということです。どちらでもかまいませんが、どうやって計算するのか混乱しています。任意の助けいただければ幸いです。

9 mathematical-statistics roc classification cross-validation pac-learning r anova survival hazard machine-learning data-mining hypothesis-testing regression random-variable non-independent normal-distribution approximation central-limit-theorem interpolation splines distributions kernel-smoothing r data-visualization ggplot2 distributions binomial random-variable poisson-distribution simulation kalman-filter regression lasso regularization lme4-nlme model-selection aic r mcmc dlm particle-filter r panel-data multilevel-analysis model-selection entropy graphical-model r distributions quantiles qq-plot svm matlab regression lasso regularization entropy inference r distributions dataset algorithms matrix-decomposition regression modeling interaction regularization expected-value exponential gamma-distribution mcmc gibbs probability self-study normality-assumption naive-bayes bayes-optimal-classifier standard-deviation classification optimization control-chart engineering-statistics regression lasso regularization regression references lasso regularization elastic-net r distributions aggregation clustering algorithms regression correlation modeling distributions time-series standard-deviation goodness-of-fit hypothesis-testing statistical-significance sample binary-data estimation random-variable interpolation distributions probability chi-squared predictor outliers regression modeling interaction

2

負のy値による指数関数的減衰の近似

高い減衰値で負になるy値に指数関数的減衰関数を適合させようとしていますが、nls関数を正しく構成できません。目的減衰関数の傾きに興味があります（いくつかの情報源によると）。この勾配をどのように取得するかは重要ではありませんが、モデルはできる限りデータに適合している必要があります（つまり、適合が良好であれば、問題の線形化は許容可能です。「線形化」を参照してください）。しかし、このトピックに関するこれまでの研究では、次の指数関数的減衰関数を使用しています（Stedmon et al。によるクローズドアクセスの記事、方程式3）。λλ\lambda f(y)=a×exp(−S×x)+Kf(y)=a×exp(−S×x)+Kf(y) = a \times exp(-S \times x) + K ここSで、私が関心を持っている勾配は、K負の値とa初期値x（つまり切片）を許可するための補正係数です。私はこれをRで行う必要があります。発色団溶存有機物（CDOM）の生の測定値を研究者が興味のある値に変換する関数を書いているからです。データの例データの性質上、PasteBinを使用する必要がありました。例えば、データはこちらから入手できます。書くdt <-とあなたのRコンソールにコードFOMペーストビンをコピーします。すなわち dt <- structure(list(x = ... データは次のようになります。 library(ggplot2) ggplot(dt, aes(x = x, y = y)) + geom_point() 場合、負のy値が発生します。x>540nmx>540nmx > 540 nm を使用して解決策を見つけようとしています nls を使用nlsして最初に試行すると、特異性が生じます。これは、パラメータの開始値を目で確認しただけであっても、驚くことではありません。 nls(y ~ a * exp(-S * …

9 r model exponential

タグ付けされた質問 「exponential」

タグ付けされた質問「exponential」