類似性は表面的な以上のものです。
「バイアス分散のトレードオフ」は、2つの垂直ユークリッドベクトルに適用されるピタゴラスの定理として解釈できます。一方の長さが標準偏差で、もう一方の長さがバイアスです。斜辺の長さは二乗平均平方根誤差です。
基本的な関係
出発点として、任意のランダム変数の有効なこの暴露の計算、検討する有限の二次モーメントと任意の実数で。二次モーメントは有限であるため、には有限平均があり、そのは、A X μ = E(X )E(X - μ )= 0XaXμ=E(X)E(X−μ)=0
E((X− a )2)= E((X- μ+μ - )2)= E((X- μ )2)+ 2 E(X- μ )(μ - ) + (μ - )2= Var(X)+ (μ - )2。(1)
この様子を示し間の平均二乗偏差と任意の「ベースライン」の値によって変化する:それはの二次関数であるで最小と平均二乗偏差の分散である、。、A 、A 、A μ Xバツaaaμバツ
推定量とバイアスとの関係
推定量は確率変数です(定義により)。これは確率変数の(測定可能な)関数であるためです。上記での役割を果たし、推定値(が推定するもの)を、次のようになります。 X θ θθ^バツθ^θ
MSE(θ^)= E((θ^- θ )2)=Var(θ^)+(E(θ^)−θ)2.
推定器のバイアス+分散に関するステートメントが文字通り場合であることがわかったので、戻りましょう。質問は「数学的対象との数学的類似」を求めています。二乗可積分確率変数を自然にユークリッド空間にすることができることを示すことで、それ以上のことができます。(1 )(1)(1)
数学的背景
非常に一般的な意味で、確率変数は確率空間上の(測定可能な)実数値関数です。しばしば書かれている正方形積分であるような関数の集合(所与の確率構造を理解して)、ほとんどであるヒルベルト空間。 それを1つにするには、積分の点で実際に異ならない2つのランダム変数とを融合する必要があります。つまり、とは常に同等であると言います。L 2(Ω )X Y X Y(Ω,S,P)L2(Ω)XYXY
E(|X−Y|2)=∫Ω|X(ω)−Y(ω)|2dP(ω)=0.
ときに最も重要なのは、:これが本当の同値関係であることを確認するために簡単です同等です及びと等価であるは、必ずしも同じになります。したがって、すべての二乗可積分確率変数を等価クラスに分割できます。これらのクラスは、セットます。さらに、は、値の点ごとの加算と点ごとのスカラー乗算によって定義されるのベクトル空間構造を継承します。このベクトル空間では、関数Y Y Z X Z L 2(Ω )L 2 L 2XYYZXZL2(Ω)L2L2
X→(∫Ω|X(ω)|2dP(ω))1/2=E(|X|2)−−−−−−√
は規範であり、とよく記述されます。この基準により、はヒルベルト空間になります。 ヒルベルト空間を「無限次元ユークリッド空間」と考えてください。任意の有限次元部分空間から当たり前継承と、この規範で、ユークリッド空間であり、:私たちはそれにユークリッド幾何学を行うことができます。L 2(Ω )H V ⊂ H H V||X||2L2(Ω)HV⊂HHV
最後に、我々は、確率空間(というより一般的な尺度空間)に特別な1つのファクトが必要ですので、確率で、それが(によって囲まれている)、そこから一定の機能(いずれかの固定実数)は、有限のノルムを持つ平方可積分確率変数です。 1 ω → A AP1ω→aa
幾何学的解釈
同値類の代表として考えられている、任意の平方可積分確率変数を考えます。これには平均あり、これは(確認できるように)等価クラスにのみ依存します。ましょう定数確率変数のクラスです。L 2(Ω )μ = E(X )X 1:ω → 1XL2(Ω)μ=E(X)X1:ω→1
1 V ⊂ L 2(Ω )2 | | X | | 2 2 = E(X 2)X | | aXとは、次元が最大ユークリッド部分空間を生成します。この部分空間において、の二乗長さと IS定数確率変数の2乗の長さ。 その基本となるに対して垂直である。 ( 1つの定義は、これが当てはまる一意の番号であるということです。)関係は1V⊂L2(Ω)2||X||22=E(X2)X ω → A X - μ 1 1 μ (1 )||a1||22=a2ω→aX−μ11μ(1)
||X−a1||22=||X−μ1||22+||(a−μ)1||22.
それは確かに、2500年前に知られている本質的に同じ形式のピタゴラスの定理です。オブジェクトは、脚がの直角三角形の斜辺ですおよび。 X - μ 1(- μ )1
X−a1=(X−μ1)−(a−μ)1
X−μ1(a−μ)1
数学的なアナロジーが必要な場合は、ユークリッド空間の直角三角形の斜辺で表現できるものなら何でも使用できます。斜辺は「誤差」を表し、脚はバイアスと平均からの偏差を表します。