CDFからの確率変数の関数の期待
rvのCDFだけで確率変数の関数の期待値を計算することは可能ですか?Iは、関数ているとしg(x)g(x)g(x)性質を有する∫∞−∞g(x)dx≤∞∫−∞∞g(x)dx≤∞\int_{-\infty}^{\infty}g(x)dx \leq \infty 及びIは、確率変数について持っている唯一の情報は、CDFです。 例えば、私は指数確率変数としてモデル化することができる3つのタイマであるシナリオ有するX1,X2,X3X1,X2,X3X_1,X_2,X_3レートパラメータでは、λ1,λ2,λ3λ1,λ2,λ3\lambda_1,\lambda_2,\lambda_3それぞれ。各瞬間に、いくつかの報酬関数に従って報酬を獲得しg(x)g(x)g(x)ます。これは、時間まで待機する私の報酬であるtttのように書くことができ∫t0g(x)dx∫0tg(x)dx\int_0^tg(x)dx。ただし、g(x)g(x)g(x)リターンが減少するため、で1秒待機することで得られる限界報酬は、t = 27t=0t=0t=0で1秒よりも大きくなります。この「ゲーム」は、次の2つのいずれかが発生すると終了します。両方のタイマーX 1またはX 2が鳴るか、タイマーX 1またはX 3が鳴る必要があります。私はこのゲームをプレイすることで期待される報酬を見つけようとしています。t=27t=27t=27X1X1X_1X2X2X_2X1X1X_1X3X3X_3 現在、ゲームが終了するまでの時間をモデル化する確率変数のCDFを計算できますが、この情報を使用して、本当に必要なものがこの時間に関連付けられた報酬になるまで、この情報を使用する方法がわかりません。 F I(X )、I ∈ { 1 、2 、3 } X I Z F Z(T )= F 1(T )F 2(T )+ F 1(T )F 3(t )− F 1(t )W12= 最大(X1、X2)W13= 最大(X1、X3)Z= 分(W12、W13)W12=max(X1,X2)W13=max(X1,X3)Z=min(W12,W13) W_{12}=\max(X_1,X_2) \quad W_{13}=\max(X_1,X_3) \quad Z=\min(W_{12},W_{13})F私(X )、I ∈ …