非線形方程式の95%信頼区間を計算する方法は?


10

私はマナティーの体重を日数(日、ポルトガル語)で予測する方程式を持っています。

R <- function(a, b, c, dias) c + a*(1 - exp(-b*dias))

nls()を使用してRでモデル化し、次のグラフィックを取得しました。

ここに画像の説明を入力してください

次に、95%の信頼区間を計算し、それをグラフィックにプロットします。次のように、各変数a、b、cの下限と上限を使用しました。

lower a = a - 1.96*(standard error of a)
higher a = a + 1.96*(standard error of a)
(the same for b and c)

次に、低いa、b、cを使用して低い線をプロットし、高いa、b、cを使用して高い線をプロットします。しかし、それが正しい方法であるかどうかはわかりません。それは私にこのグラフィックを与えています:

ここに画像の説明を入力してください

これはそれを行う方法ですか、それとも間違っていますか?

回答:


13
  1. このサイトのこのQAは、非線形回帰によって生成された曲線の周囲に信頼帯を作成するための計算を説明しています:非線形回帰 の信頼の形状と予測区間

  2. さらに読むと、パラメーターの信頼区間と曲線の信頼を区別するのに役立ちます。

  3. グラフを見ると、4匹の動物からのデータがあり、それぞれを何日も測定しているように見えます。その場合、すべてのデータを一度に当てはめると、回帰の仮定の1つに違反します。つまり、各データポイントは独立しています(または各残差には独立した「エラー」があります)。各動物のトレースを個別に当てはめるか、混合モデルを使用してすべてを一度に当てはめることを検討します。


5
+1 3番目のポイントは重要です。これらのデータが独立していると仮定してCIまたは信頼帯を計算しようとすると、途方もなく不十分な(つまり、短い)間隔が生成されます。これはOPが質問で提案された方法が明らかに間違っていることを強調するのを助けるかもしれません:それはパラメータ推定間の(強い)相関を無視し、信頼限界を誤って集計します。最終的な結果は、実際には(純粋に偶然と運により)ある程度合理的に見えますが、私の目にはまだ十分に保守的ではありません。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.