確率的動的計画法：宝くじの定常状態の導出

McCandless著（2008年）の本の確率的RBCモデルの基本的な例に取り組んでいます：The ABCs of RBCs、pp。71-75

標準的な確率的動的計画問題

基本的な確率的動的プログラミングモデルの定式化はとおりです。

y_{t} = A^{t} f (k_{t})

$\begin{equation} y_t = A^t f(k_t) \end{equation}$

A^{t} = {\begin{cases} A_{1} with probability p \\ A_{2} with probability (1 - p) \end{cases}

$\begin{equation} A^t = \cases{A_1 \text{ with probability } p \\ A_2 \text{ with probability } (1 - p) } \end{equation}$

k_{t + 1} = A^{t} f (k_{t}) + (1 - δ) k_{t} - c_{t}

$\begin{equation} k_{t+1} = A^tf(k_t) + (1 - \delta)k_t - c_t \end{equation}$

予想されるユーティリティ関数を最大化するエージェントの場合：

E_{t} \sum_{t}^{\infty} β^{t} u (c_{t})

$\begin{equation} E_t \sum_{t}^\infty \beta^t u(c_t) \end{equation}$

前の方程式から消費を代入し、問題の再帰定式化を使用すると、次の問題が発生します。

V (k_{t}, A^{t}) = max_{k_{t + 1}} [u (A^{t} f (k_{t}) + (1 - δ) k_{t} - k_{t + 1}) + β E_{t} V (k_{t + 1}, A^{t + 1})]

$\begin{equation} V(k_t, A^t) = \max_{k_{t+1}} \left[u(A^tf(k_t) + (1 - \delta)k_t - k_{t+1}) + \beta E_t V(k_{t+1},A^{t+1})\right] \end{equation}$

その後、McCandlessは、問題を解決するアルゴリズムは決定論的な場合とほぼ同じであると言います。制御変数の次条件（に関する値関数の導関数）を、に対して同じことを、エンベロープ定理を適用して分析解を取得します。定常状態が見つかり、モデルが作成され、論文が提出されました。利益。 $k_{t+1}$ $k_t$

宝くじ拡張版

今、私は少し異なるケースを調査したいと思います。まったく同じモデルを使用しますが、別の制御変数を導入します。セキュリティのためにとます： $s_t$

l_{t + 1} = l_{t} + s_{t}

$\begin{equation} l_{t+1} = l_t + s_t \end{equation}$

そして、は変数を通じて問題に入ります： $l_t$ $A^t$

A^{t} = {\begin{cases} A_{1} with probability p \\ A_{2} l_{t} with probability (1 - p) \end{cases}

$\begin{equation} A^t = \cases{A_1 \text{ with probability p} \\ A_2l_{t} \text{ with probability (1 - p)}} \end{equation}$

主な違いは、期間収入の式を明示的に期待記号を開くと簡単にわかります。 $t$

y_{t} = p A_{1} f (k_{t}) + (1 - p) A_{2} l_{t} f (k_{t})

$\begin{equation} y_t = pA_1f(k_t) + (1-p)A_2l_tf(k_t) \end{equation}$

この場合、特定のイベントが発生すると決定論的な制御変数「オン」になります（宝くじに当たったかのように、投資した分だけ収入が増えます-はい、この例はほとんど意味がありません）しかし、私は原則自体に興味があります）。 質問：次の宝くじの増強により、モデルの解決方法のプロセスが変わりますか？「はい」の場合、背後にあるアイデアは何で、何が変わるのですか？いいえの場合、それはなぜですか？ $l$

PS誰かが私が説明したモデルに非常に近いモデルの例を使った論文を私に指摘できたら、それは素晴らしいでしょう。

dynamic-programming dynamic-optimization stochastic-processes

— アルテム・コフネフ
ソース