ロジスティック成長データの周りのエラーの分布はどうですか?


10

生態学では、ロジスティック成長方程式をよく使用します。

Nt=KN0ertK+N0ert1

または

Nt=KN0N0+(KN0)ert

ここで、は運搬能力(到達した最大密度)、は初期密度、は成長率、は初期からの時間です。KN0rt

の値には、ソフトな上限と下限、強い下限があり。Nt(K)(N0)0

さらに、私の特定のコンテキストでは、測定は、光学密度または蛍光を使用して行われます。どちらも理論上の最大値、つまり強い上限があります。Nt

したがって、周りのエラーは、おそらく有界分布によって最もよく説明されます。Nt

値が小さい場合、分布にはおそらく強い正のスキューがあり、値がKに近づくと、分布にはおそらく強い負のスキューがあります。したがって、分布にはおそらくにリンクできる形状パラメーターがあります。NtNtNt

分散もとともに増加する可能性があります。Nt

これはグラフィカルな例です

ここに画像の説明を入力してください

K<-0.8
r<-1
N0<-0.01
t<-1:10
max<-1

これはrで生成できます

library(devtools)
source_url("https://raw.github.com/edielivon/Useful-R-functions/master/Growth%20curves/example%20plot.R")
  • 周りの理論的な誤差分布はどうなりますか(モデルと提供された経験的情報の両方を考慮して)?Nt

  • この分布のパラメーターはまたは時間の値にどのように関連していますか(パラメーターを使用していた場合、モードを直接関連付けることができません(例:logis normal))。NtNt

  • この分布には、実装されている密度関数がありますか?R

これまでに探索された方向:

  • 周りの正規性を仮定します(推定の超過につながります)NtK
  • 付近のロジット正規分布、ただし形状パラメーターのアルファとベータのフィッティングは困難Nt/max
  • ロジック周辺の正規分布Nt/max

1
誤差の分布に焦点を当てることで、この質問には、機能的なフォームのエラー分布は必ずしも持っていないことをモデルに関する高度な思考、しかししてくださいノート反映して任意のフォーム自体に関係します。有効な回答の構成要素は、代わりに、成長がどのように発生するか、と自然変動(時間内に必ず吸収される)、モデルの誤指定の可能性、および(および)が測定されます。r N t tKrNtt
whuber

@whuber、私は最近の編集であなたのコメントのいくつかに対処しようとしました。
エティエンヌローデカリ

1
5ノイズ分布のプロパティを思い通りに特性化できれば、それらのプロパティを使用してパラメトリックフォームを選択できると考えます。ファミリーをまとめる必要があると思います。1。有限の間隔で定義されます。2。左スキュー、右スキュー、および対称性を許可します。3. Ntが増加するにつれて増加する分散があります。ベータ分布は1と2の請求書に適合します。固定間隔は[0、1]です。したがって、分散を増加させるために、intervsl [0、c]に分布を広げるパラメーターcを追加できます。
マイケルR.チェニック

回答:


3

Michael Chernickが指摘したように、スケーリングされたベータ分布はこれに最適です。ただし、すべての実用的な目的のために、あなたが決してモデルを完全に正しいものにするには、ロジスティック成長方程式に従って非線形回帰を介して平均をモデル化し、これを不均一分散に対してロバストな標準誤差でラップするほうがよいでしょう。これを最尤コンテキストに入れると、非常に正確な誤った感覚が生じます。生態学の理論が分布を生み出すなら、あなたはその分布に適合すべきです。理論が平均の予測のみを生成する場合は、この解釈に固執し、本格的な分布のようなそれ以上のものを考え出さないでください。(ピアソンの曲線体系は確かに100年前には空想的でしたが、ランダムプロセスは密度方程式を生成する微分方程式をたどらず、それがこれらの密度曲線に対する彼の動機でした-むしろ、Nt自体-私はポアソン分布を例として考えています-そして、この効果がスケーリングされたベータ分布によって捕捉されるかどうかは完全にはわかりません。逆に、平均値を理論上の上限に向けて圧縮すると、圧縮する必要があります。測定デバイスに測定の上限がある場合でも、実際のプロセスが上限が必要です。プロセスが適度に正確に測定される上限に達すると、デバイスによってもたらされる測定誤差が重大になると言いたいのです。測定を基礎となるプロセスと混同している場合は、それを明示的に認識する必要がありますが、デバイスがどのように機能するかを説明するよりもプロセスに大きな関心があると思います。(このプロセスは今から10年後に行われます。新しい測定デバイスが使用可能になる可能性があるため、作業が古くなります。)


本当にありがとう!プロセスと測定の分離が興味深いことに同意します。ただし、ほとんどの測定方法にはこの上限があることをお勧めしますが、これを分離することが重要な場合があります。MLEフィッティングの信頼度に関する警告にもかかわらず、スケーリングされたベータをどこで使用するかについて、形状パラメーターをこのシステムに関連付けてモデル変数に関連付け、MLEを可能にする方法に関する提案はありますか?
エティエンヌローデカリ

境界がアプリケーションで本当に重要であると確信している場合は、このスケーリングされたベータをそのまま使用できます。私が言っているすべては私が確信していないということです。切り捨てられたデータのモデルがあり、実際の値が測定可能な最大値を超えていることがわかります。それらは、収入のトップコーディングと一緒に使用されることがありますが、機密保持の理由から、年間10万米ドルを超える収入は、10万米ドルに切り捨てられます。
StasK、2012年

1

@whuberは、このモデルの構造部分とエラー項の分布との間に必要な関係がないことは正しいです。したがって、理論的な誤差分布についての質問に対する回答はありません。

これは、それが良い質問ではないという意味ではありません。答えは、大部分は経験的でなければなりません。

ランダムさが加法的であると想定しているようです。これが事実である理由は(計算上の都合以外に)わかりません。モデルのどこかにランダムな要素がある代替案はありますか?たとえば、以下を参照してください。ここで、ランダム性は、平均1の正規分布として導入され、分散のみが推定するものです。これが正しいことだと思う理由はありませんが、見たいものと一致しているように見えるもっともらしい結果が得られるということです。このようなものをモデルを推定するための基礎として使用することが実用的かどうかはわかりません。

loggrowth <- function(K, N, r, time, rand=1){
    K*N*exp(rand*r*time)/(K+N*exp(rand*r*time-1)))}

plot(1:100, loggrowth(100,20,.08,1:100, rnorm(100,1,0.1)), 
    type="p", ylab="", xlab="time")
lines(1:100, loggrowth(100,20,.08,1:100))

ここに画像の説明を入力してください


この場合、Nt値がゼロより低く、ハード上限よりも高くなる可能性があります。さらに、ノイズはすべてのパラメーター(必ずしもパラメーターと時間の積である必要はありません)で予想されるため、応答変数のノイズです。私はあなたのアプローチの最尤解釈にまだ興味があります。
エティエンヌローデカリー

これにより、Ntごとに分布を制限したり、ノイズ成分を歪めたりすることができなくなります。スケーリングされたベータ分布の私のアイデアが文献で使用されているかどうかはわかりませんが、制限を十分に満たしています。私はそれを試していませんが、おそらく最大の可能性を試すことができます。確かではありませんが、cが尤度推定に含まれていると問題が発生する可能性があります。多分cはNtのみに基づいて個別に推定でき、モデルの残りの部分は各固定Ntの最大尤度でフィットできます。
Michael R. Chernick

私は大声で考えています。この問題が優れた研究論文になる可能性があると誰かが思いますか?
Michael R. Chernick

1966年の論文ではこれについて少し検討しましたが、最近はもう1つ見ていません。たぶん事情は変わった?jstor.org/discover/10.2307/...
エティエンヌ低Décarie

このルートに行くことにした場合はお知らせください。
エティエンヌローデカール
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.