高校でのベイズモデルの比較


8

私は高校生に物理学を教えています。生徒たちに、実験のデータについて初歩的なベイズモデル比較を行ってもらいたいと思います。私は彼らがそうする方法を考え出しました(以下を参照)が、それが正しいかどうかはわかりません。私はそれについてのフィードバック(特に否定的なフィードバック!)、またはそれをより良くする方法についての提案をいただければ幸いです。

勾配aと切片パラメーターを持つ線形理論bを、定数の帰無仮説、つまり勾配a = 0 と比較します。どちらの場合も、ガウス対称ノイズを想定しています。

学生は、Excel、勾配と切片のための最尤推定値(使用して、導き出すことができ、およびBを)、およびそのエラーがdのD Bをa^b^dadb

  1. 斜面上の前のため、私は、広いガウス分布を考慮し、最大=尤推定(を中心)とその10倍の標準偏差。私の推論は、現実的には「正しい」ラインパラメータを少なくとも1マグニチュード内に見つけることを期待しており、実際にはより近いものを見つけるため、「正しい」スロープをMLEに置き換えても変更しません数が多すぎます。a^
  2. いずれかの特定の線形理論与えられた証拠の可能性のために、私は、標準偏差(と、標準の多変量ガウス分布を考慮しての二乗残差和に関連します)。σe
  3. したがって、一般的に線形理論の証拠の尤度、つまり上記の事前確率と尤度の積分は、MLEポイントでの事前尤度と尤度に勾配誤差を掛けたものと推定されます。da
  4. 帰無仮説所与の証拠の可能性について(全標準偏差を用いて、他の多変量ガウス分布であると仮定される平均-Yとの差に基づいて、)。σT
  5. これは、私が確信が持てない部分です。ベイズ係数を上記の2つの尤度(上記の3と4)の比率であると推定します。これにより、次の式を考え出すことができます。

    B10=da(10|a^|2π)(σT/σe)Ne

これにより、ベイズ因子の合理的な推定が得られますか?どんなフィードバックでも大歓迎です。


MathJaxを使用して数式を編集して、読みやすく、より合理化された外観にしました。間違って翻訳してしまった場合は、お気軽に編集してください
カラキス侯爵

ありがとうございました!ただし、最後の2つの項(s比とeの平方根)は、分数の外側、または分子内にある必要があります。
PhysicsTeacher

1
ああ!それはLaTexと同じです!数式を修正しました。再度、感謝します。
PhysicsTeacher

回答:


1

まず、a = 0などの鋭い仮説の賢明な検定では、ベイズ係数がこの事前分布に批判的に依存するため、aの事前の慎重な分布が必要であると言います。多くのベイジアンは鋭い仮説をテストしませんが、私はテストします。a=0a

先に進む前に、あなたが何をしていると言っているのか本当にわからないので、あなたが探していないというアドバイスをするかもしれません。5月表記をフォローして頂ければ幸いです。

データを観測値とする:y = x 1y 1x ny n、ここで(より一般的なモデルに従って、勾配を含む) p y i | a b σ 2= NY I | B + Any=((x1,y1),,(xn,yn)) (I独立変数を抑制してい xはIを表記の簡略化のためにコンディショニング引数のリストから。)尤度は次式で与えられ 、P Y |B σ 2= N Π iは= 1、P Y I |bはσ 2 用前所与のB σ 2

p(yi|a,b,σ2)=N(yi|b+axi,σ2).
xi
p(y|a,b,σ2)=i=1np(yi|a,b,σ2).
(a,b,σ2)、事後分布は より一般的なモデルによるデータの尤度は p y
p(a,b,σ2|y)=p(y|a,b,σ2)p(a,b,σ2)p(y),
ここで私は。そのノートための(限界)尤度であるとの条件の前です。aの事前がから独立して場合、です。それは本当だと思います。
p(y)=p(y|a,b,σ2)p(a,b,σ)dσ2dbda=(p(y|a,b,σ2)p(b,σ2)dσ2db)p(a|b,σ2)da=p(y|a)p(a|b,σ2)da,
p(a,b,σ2)=p(a|b,σ2)p(b,σ2)p(y|a)ap(a|b,σ2)aa(b,σ2)p(a|b,σ2)=p(a)

これらの式を使用して、の周辺事後を記述できます: 次に、この式を並べ替えます: この式はすべての値に当てはまるため、特に場合に当てはまります: 左側の分数の分子は、制限されたモデル(つまり、制限されによるデータの尤度であることに注意してくださいa

p(a|y)=p(y|a)p(a)p(y).
p(y|a)p(y)=p(a|y)p(a).
aa=0a=0
p(y|a=0)p(y)=p(a=0|y)p(a=0).
a=0)。そして、すでに述べたように、分母はより一般的なモデルによるデータの可能性です。したがって、左側は、より一般的なモデルに比べて制限付きモデルを支持するベイズ因子です。

a = 0a=0a=0aaa=0a=0

私が概説したステップに従わない場合、この問題の影響を受けないだろうと想像するかもしれませんが、あなたは間違っているでしょう。私が提示したロジックは、適用する「アルゴリズム」に関係なく適用されます。

p(b,σ2)1/σ2.
(b,σ2)ap(y|a)atyta

私が言ったことの中で役に立つものを見つけていただければ幸いです。


p(a)=110|a^|2πe(aa^)22(10|a^|2p(a|y)=1σa|2πe(aa^)22σa2

最尤推定によるデータが含まれているようですので、以前のことはわかりません。
-mef

a^hata

事前についてのあなたの仮定の根拠がわかりません。それでも、最初のコメントの質問に対する答えは「はい」です。ベイズ係数(BF)は、以前の分散の選択に非常に敏感であることがわかります。たとえば、10から20に変更すると、BFが大幅に変更されると思います。そして、それが私が作ろうとしていたポイントです。
MEF

a^
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.