一連のデータがあり、測定の不確かさ{(\ Delta x_i、\ Delta y_i)}(測定装置からの系統誤差の伝搬から生じる)がそれぞれ異なると仮定しますポイント。データセットに対して線形回帰を行う場合、勾配の不確実性を計算するにはどうすればよいですか?明示的な手順または式を教えてください。(Δは、xはI、Δ Y I)
一連のデータがあり、測定の不確かさ{(\ Delta x_i、\ Delta y_i)}(測定装置からの系統誤差の伝搬から生じる)がそれぞれ異なると仮定しますポイント。データセットに対して線形回帰を行う場合、勾配の不確実性を計算するにはどうすればよいですか?明示的な手順または式を教えてください。(Δは、xはI、Δ Y I)
回答:
whereとして実験をモデル化でき 真の値を示す、は測定エラー、は観測から独立した「固定」コンポーネント(センサーの誤ったキャリブレーションから発生する可能性があります)、は観測から観察し、私たちがランダムとして扱う多くの可能な要因に対応します。のy I = Y * I + 〜V I 〜U I = ˉ U + V 私は〜V iの = ˉ V + uと私はxは* I、Y * I 〜U I、〜V I ˉ U、ˉ V U 、V
単純な線形回帰は あり、勾配のOLS推定は ただし、得られるのはβ = C O V (X *、Y *)
ここで、がと相互に無相関であると仮定します(エラーの性質についてより多くの推論がある場合に改善できるかなり強い仮定)。次に、 をサンプル変動として 推定できます。も推定する必要があります。複数回観察できる実験がある場合、1つの簡単なアプローチは、 ] を推定することです。
これで、たとえばブートストラップメソッドで計算されたを使用して、を修正し、。
私は同様の問題を抱えています- ここに投稿されました -まだ特定の答えはありません。今のところ私がやったことは、非常によく似たXのセットを集めて、それらの行の中でYに大きな変化があるかどうかを確認することです。別の種類のアプローチは、シミュレーションです。データセットから単一のXを使用しますが、予測子の系統的エラー(rnorm(...、0,0.3)など)に従って行を複製します。勾配の信頼区間は、系統誤差範囲に似ている場合があります。
データにはパラメトリックブートストラップをお勧めします。これは、実際のデータセットに類似しているが、各観測の不確実性によって暗示される程度が異なる新しいデータセットを生成することを意味します。
そのための疑似コードを以下に示します。rnorm
R言語では通常のように、へのベクトル入力を使用していることに注意してください。また、あなたがと呼んでいるものは標準エラーであると想定しています。
For each b in 1...B:
x_PB = rnorm(x, x_se)
y_PB = rnorm(y, y_se)
r[b] = cor(x_PB, y_PB)
次に、rの値の分布を確認します。