答えは「いいえ」です。バイアスと分散はモデルパラメーターの属性であり、それらを推定するために使用されるデータではないためです。予測子空間全体で変化するバイアス(ha!)に関連するそのステートメントには、部分的な例外があります。詳しくは以下をご覧ください。これは、予測変数と応答変数に関連する「真の」関数を知ることとはまったく関係がないことに注意してください。
ββ^=(XTX)−1XTYXN×Pβ^P×1YN×1NPβ^NiterNNiterβ^NP
β^bestPβ^bestj−β^jj1Niter
バイアスと分散をデータ自体に関連付ける対応する方法がありますが、それらは少し複雑です。ご覧のとおり、線形モデルのバイアスと分散を推定できますが、かなりのホールドアウトデータが必要になります。さらに油断のならない問題は、固定データセットでの作業を開始すると、分析が個人的な差異によって汚染され、分岐路の庭をさまよい始めており、その方法を知る方法がないという事実です。サンプル外で複製します(単一のモデルを思いついてこの分析を実行し、その後それをそのままにすることを約束した場合を除きます)。
YY^、より複雑なモデルが必要です(関連するすべての予測子を正しく識別できたとしても、できません)。「エラー」の哲学的性質についての退屈な論文に触れずに、肝心なことは、モデルがそのマークを逃す原因となっていることが起こっていたということです。問題は、複雑さを追加すると分散が増加するため、他のデータポイントのマークを見逃す可能性が高いことです。したがって、個々のデータポイントレベルでのエラー属性について心配することは、実りある努力とはなりません。例外(最初の段落で説明)は、バイアスと分散が実際には予測子自体の関数であるため、予測子空間の一部に大きなバイアスがあり、別の部分に小さなバイアスがある(分散も同じ)場合があります。を計算してこれを評価できますY−Y^Y^=Xβ^β^ YX