時変バイアスでバイアスされたコインをモデル化する方法は?


10

バイアスコインのモデルには、通常、1つのパラメーターます。一連の描画からを推定する1つの方法は、ベータ事前分布を使用し、二項尤度で事後分布を計算することです。θθ=P(Head|θ)θ

私の設定では、奇妙な物理的プロセスのために、私のコインのプロパティはゆっくりと変化し、は時間関数になります。私のデータは、順序付けられた描画のセット、つまりです。私は、離散的で通常の時間グリッドでは、ごとに1つのドローしかないと考えることができます。T { H T H H H T } tθt{H,T,H,H,H,T,...}t

これをどのようにモデル化しますか?私は、隠れた変数があるという事実に適応し、二項尤度を維持するカルマンフィルターのようなものを考えています。推論を扱いやすくするために、をモデル化するために何を使用できますか?P θ T + 1 | θ T θP(θ(t+1)|θ(t))

次の回答を編集してください(ありがとう!):HMMまたはカルマンフィルターで行われるように、を次数1のマルコフ連鎖としてモデル化したいと思います。私ができる唯一の仮定は、が滑らかであることです。私はをで小さなガウスノイズ(カルマンフィルターのアイデア)と書くことができますが、これはままにする必要があります。@J Davのアイデアに従って、プロビット関数を使用して実際の線をにマッピングすることができますが、これは非分析的な解決策を与えるという直感があります。平均ベータ分布θ T P θ T + 1 | θ T = θ T + ε ε θ [ 0 1 ] [ 0 1 ] θ T θ(t)θ(t)P(θ(t+1)|θ(t))=θ(t)+ϵϵθ[0,1][0,1]θ(t) そして、より広い分散はトリックを行うことができます。

この問題は非常に単純で、以前に研究されたに違いないと感じているので、この質問をします。


成功の割合が時間とともに変化する方法のモデルがある場合は、見積もりを取得できます。多くの異なるモデルが機能し、推定値は想定されるモデルに基づいて大きく異なる可能性があります。扱いやすさはモデルを選択するための実用的な基準ではないと思います。私はプロセスを理解し、あなたが期待する振る舞いと一致する特性を示すモデルを探したいと思います。
Michael R. Chernick

@MichaelChernick:ありがとう。私ができる唯一の仮定は、がスムーズかつゆっくりと移動していることです。さらに、解決策は重要な基準です。なぜなら、私は、解決策を重要な相互依存関係がある多変量ケースに拡張したいからです。理想的なソリューションは、分析であり、新しいデータが到着したときにパラメーター推定の「オンライン」更新を提供します。θ
repied2 '25 / 07/25

1
「がスムーズかつゆっくりと移動している」という意味を数値化できますか?整数は離散的であり、整数の任意の値を取る滑らかな関数があります。つまり、滑らかさは制約を与えません。「ゆっくり」という概念の中には、まだ制約を与えないものもあれば、与えないものもあります。θ
ダグラスザレ

0.1 /単位時間または0.001の確率の変化のように、「ゆっくり」とはどのくらい速いのでしょうか。範囲は比較的狭いですか(例:0.2-0.4)またはそれは(0,1)に近くなりますか?
jbowman 2012

@DouglasZare「スムーズ」で、E [θ_t+ 1 |θ_t] =θ_t(または非常に近い)およびVAR(θ_t+ 1 |θ_t)が小さいことを述べたかった。θはジャンプしていません(そうしないと、実際には何もできません)。
repied2 12/07/26

回答:


2

分析ソリューションを備えたモデルを思い付くことができるとは思いませんが、モデルの依存関係構造は単純なので、適切なツールを使用して推論を扱いやすくすることができます。機械学習の研究者として、次のモデルを使用することをお勧めします。推論は期待値伝播の手法を使用してかなり効率的にできるためです。

ましょのことな結果番目のトライアルを。時変パラメーターを定義しましょうtX(t)t

T 0η(t+1)N(η(t),τ2) for。t0

をとリンクするには、潜在変数を導入しますX t η(t)X(t)

Y(t)N(η(t),β2)

そしてモデルはX(t)

X(t)=1であれば、及びそれ以外の場合。実際に無視して、これらを周辺化して、と言うことができます( cdf of標準法則)しかし、潜在変数の導入により推論が容易になります。また、元のパラメーター化ではことに注意してください。Y(t)0X(t)=0Y(t)P[X(t)=1]=Φ(η(t)/β)Φθ(t)=η(t)/β

推論アルゴリズムの実装に興味がある場合は、このペーパーを参照してください。非常によく似たモデルを使用しているため、アルゴリズムを簡単に適合させることができます。EPを理解するには、次のページが役立つ場合があります。このアプローチに興味がある場合は、お知らせください。推論アルゴリズムの実装方法について、より詳細なアドバイスを提供できます。


0

コメントについて詳しく説明すると、p(t)= p exp(-t)などのモデルは単純なモデルであり、最尤推定を使用してpを推定することにより、p(t)を推定できます。しかし、確率は本当に指数関数的に減衰します。このモデルは、成功の頻度が高い時間帯と早い時間帯と遅い時間帯で観察した場合、明らかに間違っています。振動動作は、p(t)= p | sint | としてモデル化できます。どちらのモデルも扱いやすく、最尤で解くことができますが、非常に異なるソリューションを提供します。000


1
OPの時間で成功確率をモデル化するために探しているように見える、のためのいくつかの関数形式を指定していない、マルコフ過程として、。tθ(t)θ(t)
マクロ

1
@マクロは正しいです。thetaパラメトリックフォームを提供することはできません。これは、この関数がスムーズになる可能性があるため、望ましくありません。隠れマルコフモデルまたはカルマンフィルターに似た次数1のマルコフモデルが必要ですが、0と1の間の実際の値をとる隠れ変数と、ベルヌーイ尤度があります。theta(t)
repied2 2012

@pierreさて、編集の前に、時変pを推定しようとしていて、可能なアプローチとしてHMMを提案しているように見えました。tによって変化する方法については、関数形式を推奨していませんでした。私は、さらなる情報なしではさまざまなタイプの多くのモデルを構築できることを指摘しました。私の2つの例は、さらなる情報なしではモデルの選択が非常に異なる答えを与える可能性があることを示すことでした。なぜHMMを主張するのですか?データが機能してデータに適合した場合、「非分析的」であるために拒否する理由
Michael R.

便利なソリューションを見つけることは、実際的な統計上の問題を解決する方法ではないことをお勧めします!
Michael R.

1
@MichaelChernick最後に:私はこれがよく知られた問題であり、人々が十分に柔軟な分析ソリューションを提案したので、分析ソリューションを見つけたいと思います。しかし、「実際のダイナミクス」をモデル化することは、一般に計算コストよりも重要であるという私たちの提案に同意します。悲しいことに、これはビッグデータ用であり、遅いアルゴは役に立たないでしょう:-(
repied2

0

確率はによって変化しますが、マイケルが言ったように、方法はわかりません。線形かどうか?確率モデル選択問題のように見えます:tp

p=Φ(g(t,θ))は、非常に非線形な関数に依存する場合があります。は、0〜1の確率を保証する境界関数です。g(t,θ)Φ

単純な探索的アプローチは、異なる非線形を使用していくつかのプロビットを試行し、標準の情報基準に基づいてモデル選択を実行することです。Φg()g()

あなたに答えるために再eddited質問:

あなたがプロビットを使うことは数値解だけを意味するがあなたの代わりにロジスティック関数を使うかもしれないと言ったように:

ロジスティック関数:P[θ(t+1)]=11+exp(θ(t)+ϵ)

線形化:logP1P=θ(t)+ϵ

これがカルマンフィルターアプローチの下でどのように機能するかはわかりませんが、またはランダム項のない他の多くのような非線形仕様が仕事をします。ご覧のとおり、この関数は連続的で微分可能であるという意味で「smoth」です。残念ながら、を追加すると、結果として生じる可能性のあるジャンプが生成されます。これは、望ましくないことなので、削除することをお勧めします。ϵ ϵθ(t+1)=at3+bt2+ct+dϵϵ

ロジットの確率:P[Coint+1=H|t]=11+exp(θ(t))

ベルヌーイイベント(マルコフチェーン)にすでにランダムがあり、ためにそのソースを追加しています。したがって、問題は、を説明変数とする最尤法によって推定されたプロビットまたはロジットとして解決できます。その節約は非常に重要であることにあなたは同意するでしょう。主な目的が特定の方法(HMMおよびカルマンフィルター)を適用することであり、問​​題に対する最も簡単な有効な解決策を提供することでない限り。tϵt


プロビットを使用する場合、多変量プロビットを推定できるため、多変量拡張は簡単です。依存関係は、暗黙の多変量正規分布の共分散行列によって暗示されます。
JDav 2012
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.