非線形回帰の予測バンドを計算する方法は?


15

Prism のヘルプページには、非線形回帰の予測バンドの計算方法に関する以下の説明があります。長い引用を許してください。しかし、私は2番目の段落(G|xがどのように定義され、dY/dPが計算されるかを説明しています)には従いません。どんな助けも大歓迎です。

信頼帯と予測帯の計算はかなり標準的です。Prismが非線形回帰の予測帯域と信頼帯域を計算する方法の詳細については、こちらをお読みください。

まず、G | xを定義します。これは、Xの特定の値でのパラメーターの勾配であり、パラメーターのすべての最適値を使用します。結果は、パラメーターごとに1つの要素を持つベクトルです。各パラメーターについて、dY / dPとして定義されます。Yは、Xの特定の値とすべての最適なパラメーター値が与えられた曲線のY値であり、Pはパラメーターの1つです。

G '| xは転置された勾配ベクトルであるため、値の行ではなく列です。

Covは共分散行列です(最後の反復からの逆ヘッセ行列)。これは、行と列の数がパラメーターの数と等しい正方行列です。行列の各項目は、2つのパラメーター間の共分散です。

c = G '| x * Cov * G | xを計算します。結果は、Xの任意の値に対して単一の数値です。

信頼帯域と予測帯域は、最適曲線に中心が置かれ、曲線の上下に等しい量だけ広がります。

信頼帯は、曲線の上下に次のように拡張されます。= sqrt(c)* sqrt(SS / DF)* CriticalT(Confidence%、DF)

予測バンドは、曲線の上下にさらに距離を延長します。= sqrt(c + 1)* sqrt(SS / DF)* CriticalT(Confidence%、DF)


ホープこのことができます:stats.stackexchange.com/questions/74334/...を
BIPI

ホープこのことができます: stats.stackexchange.com/questions/74334/...を
BIPI

これは確かにデルタ法として知られており、一次のテイラー近似を使用します。ただし、これには2次のテイラー近似を使用することをお勧めします。興味がある場合は、propagateパッケージのpredictNLS関数がそれを実行します。
トムウェンセリアーズ

回答:


18

これはデルタ方式と呼ばれます。

関数があると仮定します。G は、推定するパラメーターβと、予測変数の値xの関数であることに注意してください。まず、パラメータのあなたのベクトルに関して、この関数の導関数を見つけ、βG "β X y=G(β,x)+ϵG()βxβG(β,x)。これは、パラメーターを少し変更すると、関数はどれだけ変化するのかということです。この導関数は、予測変数と同様にパラメーター自体の関数である可能性があることに注意してください。例えば、、次いで誘導体であるX EXP β X の値に依存する、βの値は、X。これを評価するために、あなたはの推定値に差し込むβあなたの手順が与えるβ、との予測の値XG(β,x)=exp(βx)xexp(βx)βxββ^x 予測が必要な場所。

最尤手順に由来するデルタ法、の分散と述べになるだろう G ' βX Tヴァーβ G ' βX ヴァールβG(β^,x)

G(β^,x)TVar(β^)G(β^,x),
Var(β^)は、推定値の分散共分散行列です(これは、ヘッセ行列の逆数に相当します---推定値における尤度関数の2次導関数)。統計パッケージが使用する関数は、予測子異なる値ごとにこの値を計算します。これは、xの各値のベクトルではなく単なる数値です。xx

これは、各点での関数値の分散を与え、これはただの信頼区間を計算することで、他の分散と同じように使用されます。正常または適用のための臨界値で乗算、この値の平方根を取るのt Aに関連する分布特定の信頼レベル、およびこの値をポイントの推定値に加算および減算します。G()

予測区間については、我々は予測因子は、与えられた結果の分散を取る必要があるヴァールY | X σ 2、口座に。したがって、我々は分散の見積りにより、デルタメソッドから、私たちの分散を高めなければならεσ 2の分散取得するには、yとかなりの期待値の分散よりも、yの信頼区間のために使用されています。なお、σ 2は、(二乗誤差の合計である自由度で割ったヘルプファイルの表記では)( )。xVar(yx)σ2ϵσ^2yyσ^2SSDF

上記のヘルプファイルで使用される表記法では、それは彼らの価値のように見えるcかかりません考慮に入れ、つまり、それらのヘッセ行列の逆数は、σ - 2倍です。なぜそうするのか分かりません。それは、より馴染みのある方法(σ倍、数倍、臨界値)で信頼区間と予測区間を記述する方法かもしれません。私が与える分散は、実際にはその表記法にあります。σ2σ2σc*SS/DF

例えば、線形回帰のおなじみの場合に、それらは、cあろう、しばらくヴァーβ = σ 2 X ' X - 1(xx)1Var(β^)=σ2(xx)1


ciの計算を説明できますか?t * sqrt(var)
-B_Miner

私は彼らの計算を理解していると思います。応答を更新しました。
チャーリー

チャーリー、詳細な対応に感謝します。95%の予測帯域を計算できるようにコードを書くつもりです。その方法をお知らせします。
ジョーリスター

@チャーリー-とても素敵!
B_Miner

2
@チャーリー。ありがとう。GraphPad Prism FAQに、covを使用して正規化された共分散行列(各値の範囲は-1〜1)を意味することを説明する文を追加しました。また、このページへのリンクを追加しました。これは、数学的な詳細を探している人に最適です。
ハーベイモトゥルスキー
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.