タグ付けされた質問 「nonlinear-regression」

このタグは、応答がパラメーターの非線形関数である回帰モデルにのみ使用してください。このタグを非線形データ変換に使用しないでください。

1
最小二乗対一般化線形モデル対非線形最小二乗を使用して指数関数をフィッティング
指数関数的減衰を表すデータセットがあります。このデータに指数関数を当てはめたいと思います。応答変数をログ変換してから、最小二乗法を使用して線をフィットさせました。対数リンク関数と応答変数の周りのガンマ分布を持つ一般化線形モデルを使用します。非線形最小二乗法を使用します。2つの係数はそれぞれ類似していますが、それぞれの方法で異なる答えが得られます。私が混乱しているところは、どの方法が最適で、なぜ使用するのかわかりません。誰かがこれらの方法を比較して対比できますか?ありがとうございました。y=Beaxy=Beaxy = Be^{ax}


6
非線形回帰の異常値の特定
ダニの機能的反応の研究をしています。ロジャースタイプII関数のパラメーター(攻撃率と処理時間)を推定するために回帰を行いたいと思います。測定のデータセットがあります。 どうすれば外れ値を最も正確に特定できますか? 私の回帰のために私はR(非線形回帰)で次のスクリプトを使用します(datesetと呼ばれるシンプルな2カラムのテキストファイルであるdata.txtと、ファイルN0の値(初期獲物の数)とFR値(24時間の間に食べた獲物の数): library("nlstools") dat <- read.delim("C:/data.txt") #Rogers type II model a <- c(0,50) b <- c(0,40) plot(FR~N0,main="Rogers II normaal",xlim=a,ylim=b,xlab="N0",ylab="FR") rogers.predII <- function(N0,a,h,T) {N0 - lambertW(a*h*N0*exp(-a*(T-h*N0)))/(a*h)} params1 <- list(attackR3_N=0.04,Th3_N=1.46) RogersII_N <- nls(FR~rogers.predII(N0,attackR3_N,Th3_N,T=24),start=params1,data=dat,control=list(maxiter= 10000)) hatRIIN <- predict(RogersII_N) lines(spline(N0,hatRIIN)) summary(RogersII_N)$parameters カルセック残差グラフをプロットするには、次のスクリプトを使用します。 res <- nlsResiduals (RogersII_N) plot (res, type = 0) hist (res$resi1,main="histogram …

2
条件付き平均独立性は、OLS推定量の不偏性と一貫性を意味します
次の重回帰モデルについて考えてみますY=Xβ+Zδ+U.(1)(1)Y=Xβ+Zδ+U.Y=X\beta+Z\delta+U.\tag{1} ここで、は列のベクトルです。行列。 a列のベクトル; マトリックス。列ベクトル。そして、誤差項、列ベクトル。YYYn×1n×1n\times 1XXXn×(k+1)n×(k+1)n\times (k+1)ββ\beta(k+1)×1(k+1)×1(k+1)\times 1ZZZn×ln×ln\times lδδ\deltal×1l×1l\times 1UUUn×1n×1n\times1 質問 私の講師、教科書「計量経済学入門」第3版。 James H. StockおよびMark W. Watson著、p。281、および計量経済学:名誉の試験レビューセッション(PDF)、p。7、私に次のように表現しています。 いわゆる条件付き平均独立性を仮定すると、これは定義上、意味しE(U|X,Z)=E(U|Z),(2)(2)E(U|X,Z)=E(U|Z),E(U|X,Z)=E(U|Z),\tag{2} 条件付き平均ゼロの仮定以外の最小二乗仮定が満たされる場合(したがって、と仮定し)(1を参照) -3以下)、E(U|X,Z)=0E(U|X,Z)=0E(U|X,Z)=0E(U|X,Z)=E(U|Z)≠0E(U|X,Z)=E(U|Z)≠0E(U|X,Z)=E(U|Z) \neq 0 次に、OLS推定量のにおける公正なままであるとの仮定のこの弱いセットの下で、一貫。β^β^\hat{\beta}ββ\beta(1)(1)(1) この命題をどのように証明しますか?上記1及び2は、OLSの推定値があることを意味していること、すなわち、私たちのために公平かつ一貫性のある推定量与え?この命題を証明する研究記事はありますか?ββ\betaββ\beta コメント 最も単純なケースは、線形回帰モデルを考慮することによって与えられるおよびOLSを見積もることを証明のを各について場合、は不偏です。Yi=β0+β1Xi+β2Zi+ui,i=1,2,…,n,Yi=β0+β1Xi+β2Zi+ui,i=1,2,…,n,Y_i=\beta_0+\beta_1X_i+\beta_2Z_i+u_i,\quad i=1,2,\ldots,n,β 1 β 1 E (U I | X I、Z I)= E (U I | Z I)Iをβ^1β^1\hat{\beta}_1β1β1\beta_1E(ui|Xi,Zi)=E(ui|Zi)E(ui|Xi,Zi)=E(ui|Zi)E(u_i|X_i,Z_i)=E(u_i|Z_i)iii 仮定すると、不偏性の証明と JOINTLY正規分布していますUiUiU_iZiZiZ_i 定義し、次におよび定義ししたがって、はとして書き換えられによって、ここで、とは一緒に正規分布しているため、正規分布の理論については、多変量正規分布の条件付き分布を導出する、と言うこと(実際に、私たちは共同正常にのみ、このアイデンティティを想定する必要はありません)いくつかのためにによってベクトルV=U−E(U|X,Z)V=U−E(U|X,Z)V=U-E(U|X,Z)U=V+E(U|X,Z)U=V+E(U|X,Z)U=V+E(U|X,Z)E(V|X,Z)=0.(*)(*)E(V|X,Z)=0.E(V|X,Z)=0\tag{*}.(1)(1)(1)Y=Xβ+Zδ+E(U|X,Z)+V.(3)(3)Y=Xβ+Zδ+E(U|X,Z)+V.Y=X\beta+Z\delta+E(U|X,Z)+V.\tag{3}(2)(2)(2)Y=Xβ+Zδ+E(U|Z)+V.(4)(4)Y=Xβ+Zδ+E(U|Z)+V.Y=X\beta+Z\delta+E(U|Z)+V.\tag{4}UiUiU_iZiZiZ_i E (U | Z )= …

3
線形回帰モデルまたは非線形回帰モデルの間の決定
線形回帰モデルと非線形回帰モデルのどちらを使用するかをどのように決定すべきですか? 私の目標はYを予測することです。 単純なおよびyデータセットの場合、散布図をプロットすることで、どの回帰モデルを使用するかを簡単に決定できました。xxxyyy ような多変量の場合。。。x nおよびy。どの回帰モデルを使用する必要があるかをどのように決定できますか?つまり、単純な線形モデル、または2次、3次などの非線形モデルの使用をどのように決定しますか?x1,x2,...xnx1,x2,...xnx_1,x_2,...x_nyyy どの回帰モデルを使用する必要があるかを推論して決定するための手法、統計的アプローチ、またはグラフィカルプロットはありますか?

3
特定の非線形モデルの適合度を評価する方法は?[閉まっている]
ここで何が質問されているのかを理解することは困難です。この質問は、あいまいで、あいまいで、不完全で、過度に広い、または修辞的であり、現在の形では合理的に回答することができません。再開できるようにこの質問を明確にするヘルプについては、ヘルプセンターに アクセスしてください。 7年前休業。 私は非線形モデルを持っています。ここで、Φは標準正規分布の累積分布関数であり、fは非線形です(以下を参照)。このモデルとパラメーターaの適合度をデータ(x 1、y 1)、(x 2、y 2)、… 、(x n、y n)でテストしたいy= Φ (f(x 、a ))+ εy=Φ(f(x,a))+εy=\Phi(f(x,a)) + \varepsilonΦΦ\Phiaaa(x1、y1)、(x2、y2)、… 、(xん、yん)(x1,y1),(x2,y2),…,(xn,yn)(x_1,y_1),(x_2,y_2),\dots,(x_n,y_n)、検索するために使用最尤推定を持った後。適切なテストは何でしょうか?このテストを使用して、不良適合を不良としてラベル付けし、さらにデータを収集する必要があるかどうかを判断します。aaa 私は使用適合度のその対応する試験で、飽和モデルに対してこのモデルを比較して逸脱を用いに見てきた分布。これは適切でしょうか?私が逸脱について読んだことのほとんどは、それをGLMに適用していますが、それは私が持っているものではありません。逸脱度テストが適切である場合、テストを有効にするためにどのような仮定を保持する必要がありますか?χ2n − 1χn−12\chi^2_{n-1} 更新:のためのx>1、>0の場合にこのことができます。f= x − 1X2+ 1√f=x−1ax2+1f = \frac{x-1}{a\sqrt{x^2+1}}x > 1 、a > 0x>1,a>0x>1,a>0

1
混合モデルの予測子として時間を含めることはできますか?
時間は回帰(gamを含む)の予測子として使用するべきではないと常に信じていました。なぜなら、傾向そのものを単に「説明」するからです。研究の目的が、たとえば動物の活動の変動を説明する温度などの環境パラメータを見つけることである場合、時間はどのように役立つのでしょうか。測定されていないパラメータのプロキシとして? 港湾魚類の活動データの時間のいくつかの傾向をここで見ることができます:-> GAMMを行うときに時系列のギャップを処理する方法? 私の問題は、モデルに時間を含めると(ユリウス日で測定)、他のすべてのパラメーターの90%が重要でなくなる(mgcvからのts収縮がよりスムーズになる)。私がタイムアウトを残した場合、それらのいくつかは重要です... 問題は、予測変数として時間を許可されているか(多分必要なのか?)、それとも分析をめちゃくちゃにしているのでしょうか。 事前に感謝します

1
モデルの尤度がnullより有意に高くない場合の(GAM)回帰係数の有意性
私は、Rパッケージgamlssを使用して、データのゼロインフレベータ分布を想定して、GAMベースの回帰を実行しています。モデルには説明変数が1つしかないため、基本的には次のようになりますmymodel = gamlss(response ~ input, family=BEZI)。 アルゴリズムは、説明変数が平均(μ)に与える影響の係数と、k (input )= 0の関連するp値を次のように与えます。kkkμμ\muk (入力)= 0k(入力)=0k(\text{input})=0 Mu link function: logit Mu Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -2.58051 0.03766 -68.521 0.000e+00 input -0.09134 0.01683 -5.428 6.118e-08 上記の例でわかるように、仮説は高い信頼度で棄却されます。k (入力)= 0k(入力)=0k(\text{input})=0 次にnullモデルを実行null = gamlss(response ~ 1, family=BEZI)し、尤度比検定を使用して尤度を比較します。 p=1-pchisq(-2*(logLik(null)[1]-logLik(mymodel)[1]), df(mymodel)-df(null)). (上記のように)入力の係数が非常に有意であると報告されていても、多くの場合、になります。私はこれを非常に珍しいと思います-少なくとも、線形またはロジスティック回帰の経験では決して発生しませんでした(実際、これは、gamlssでゼロ調整されたガンマを使用しているときも発生しませんでした)。p > 0.05p>0.05p>0.05 私の質問は、これが当てはまる場合でも、応答と入力の間の依存関係を信頼できるかどうかです。

3
指数モデルの推定
指数モデルは、次の方程式で表されるモデルです: yi^=β0⋅eβ1x1i+…+βkxkiyi^=β0⋅eβ1x1i+…+βkxki\hat{y_{i}}=\beta_{0}\cdot e^{\beta_{1}x_{1i}+\ldots+\beta_{k}x_{ki}} このようなモデルを推定するために使用される最も一般的なアプローチは線形化です。これは、両側の対数を計算することで簡単に実行できます。他のアプローチは何ですか?いくつかの観測でを処理できるものに特に興味があります。yi=0yi=0y_{i}=0 更新31.01.2011 このモデルはゼロを生成できないという事実を知っています。私がモデリングしているものと、このモデルを選択する理由について少し詳しく説明します。クライアントが店でいくらお金を使うかを予測したいとしましょう。もちろん、多くのクライアントは見ているだけで何も購入していません。そのため、0が存在します。線形モデルを使用したくありませんでした。負の値が多くなり、意味がありません。もう1つの理由は、このモデルが非常に優れており、線形よりもはるかに優れていることです。遺伝的アルゴリズムを使用してこれらのパラメーターを推定したので、「科学的」なアプローチではありませんでした。もっと科学的な方法で問題に対処する方法を知りたいのですが。変数のほとんどまたはすべてがバイナリ変数であると仮定することもできます。

3
統計モデルの非線形性の基準と意思決定とは何ですか?
次の一般的な質問が意味をなすことを願っています。この特定の質問の目的のために、非線形性を導入するための理論的な(対象ドメイン)理由には興味がないことに注意してください。したがって、質問全体を次のように定式化します。 理論的(対象領域)以外の理由で統計モデルに非線形性を導入するための論理的なフレームワーク(基準、および可能であれば意思決定プロセス)とは何ですか? いつものように、関連するリソースやリファレンスも歓迎します。

1
非線形方程式の95%信頼区間を計算する方法は?
私はマナティーの体重を日数(日、ポルトガル語)で予測する方程式を持っています。 R <- function(a, b, c, dias) c + a*(1 - exp(-b*dias)) nls()を使用してRでモデル化し、次のグラフィックを取得しました。 次に、95%の信頼区間を計算し、それをグラフィックにプロットします。次のように、各変数a、b、cの下限と上限を使用しました。 lower a = a - 1.96*(standard error of a) higher a = a + 1.96*(standard error of a) (the same for b and c) 次に、低いa、b、cを使用して低い線をプロットし、高いa、b、cを使用して高い線をプロットします。しかし、それが正しい方法であるかどうかはわかりません。それは私にこのグラフィックを与えています: これはそれを行う方法ですか、それとも間違っていますか?

2
非線形関係を要約して比較する方法は?
約25の湖で、0 cm(つまり、堆積物-水界面)から9 cmまでの湖底堆積物中の有機物の割合に関するデータがあります。各湖で2つのコアが各場所から取得されたため、各湖の各堆積物深さでの有機物比率の2つの反復測定値があります。 有機物パーセントと堆積物の深さ(つまり、傾斜)の関係で湖がどのように異なるかを比較することに興味があります。一部の湖では、有機物パーセントと堆積物深さの関係は線形に見えますが、他の場合では、関係はより複雑です(以下の例を参照)。 私の最初の考えは、曲線が「主に」線形である場合は、曲線全体または曲線のサブセットのいずれかに適切な線形関係を当てはめ、有意な線形関係が見つかった湖のみを比較することでした。ただし、線形モデルに適合しない以外の理由でデータを削除する必要があり、有機物パーセントと堆積物の深さの関係に関する潜在的に興味深い情報を無視するという点で、このアプローチには不満です。 異なる湖からの曲線を要約して比較する良い方法は何でしょうか? ありがとうございました 曲線の例:すべての場合において、y軸は堆積物中の有機物の割合であり、x軸は堆積物深さです。ここで、0 =堆積物と水の界面です。 良い線形の例: 2つの非線形の例: 明らかな関係のない例:

1
相互に排他的でないカテゴリを分類できる深層学習モデル
例:仕事の説明に「英国のJavaシニアエンジニア」という文があります。 私は2つのカテゴリとして、それを予測することは、深い学習モデルを使用したい:English とIT jobs。従来の分類モデルを使用する場合softmax、最後のレイヤーで機能を持つ1つのラベルのみを予測できます。したがって、2つのモデルのニューラルネットワークを使用して、両方のカテゴリで「はい」/「いいえ」を予測できますが、さらに多くのカテゴリがあると、コストがかかりすぎます。では、2つ以上のカテゴリを同時に予測するためのディープラーニングまたは機械学習モデルはありますか? 「編集」:従来のアプローチによる3つのラベルでは、[1,0,0]によってエンコードされますが、私の場合、[1,1,0]または[1,1,1]によってエンコードされます 例:3つのラベルがあり、文がこれらすべてのラベルに収まる場合。したがって、softmax関数からの出力が[0.45、0.35、0.2]である場合、3つのラベルまたは2つのラベルに分類する必要がありますか、それとも1つにすることができますか?それを行うときの主な問題は、1、2、または3つのラベルに分類するための適切なしきい値は何ですか?
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

3
kカテゴリ変数に相当する回帰平滑化スプラインでのkノットの選択?
私は、患者の年齢(年で測定された整数量)が予測変数の1つである予測コストモデルに取り組んでいます。年齢と入院のリスクの間の強い非線形関係は明らかです: 患者の年齢に応じて、ペナルティ付き回帰平滑化スプラインを検討しています。よると、統計的学習の要素(Hastieら、2009、P.151)、最適な結び目の配置は、会員の年齢のユニークな値ごとに結び目があります。 年齢を整数として保持しているとすると、ペナルティ付きスムージングスプラインは、データセットで見つかった年齢の値ごとに1つ(マイナス1つ)の、101の異なる年齢インジケーター変数でリッジ回帰または投げ縄を実行することに相当しますか?各年齢インジケーターの係数がゼロに向かって縮小されるため、過剰パラメーター化は回避されます。

3
関係が線形か非線形かを確認する統計的検定
次のようなデータセットの例があります。 Volume <- seq(1,20,0.1) var1 <- 100 x2 <- 1000000 x3 <- 30 x4 = sqrt(x2/pi) H = x3 - Volume r = (x4*H)/(H + Volume) Power = (var1*x2)/(100*(pi*Volume/3)*(x4*x4 + x4*r + r*r)) Power <- jitter(Power, factor = 1, amount = 0.1) plot(Volume,Power) この図から、ある範囲の「ボリューム」と「パワー」の間の関係は線形であり、「ボリューム」が比較的小さくなると、関係は非線形になることが示唆されます。これを説明するための統計的検定はありますか? OPへの応答に示されているいくつかの推奨事項に関して: ここに示されている例は単なる例であり、私が持っているデータセットは、ここで見られる関係に似ていますが、騒々しいです。これまでに行った分析では、特定の液体の体積を分析すると、体積が小さいと信号のパワーが大幅に増加することを示しています。つまり、ボリュームが15から20の間の環境しかなかったとしましょう。それは、ほぼ線形の関係のように見えます。ただし、ポイントの範囲を増やす、つまりボリュームを小さくすると、関係がまったく線形にならないことがわかります。これを統計的に示す方法に関する統計的なアドバイスを探しています。これが理にかなっているといいのですが。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.