ランダムサンプリングによる単純な積分方程式の解法

してみましょう非負関数です。ようなを見つけることに興味があります。警告：私ができることはポイントでをサンプリングすることだけです。ただし、必要に応じて、ランダムにサンプリングする場所を選択できます。 $f$ $z \in [0,1]$

\int_{0}^{z} f (x) d x = \frac{1}{2} \int_{0}^{1} f (x) d x

$\int_0^{z} f(x)\,dx = \frac{1}{2}\int_0^1 f(x)\,dx$

f

$f$

[0, 1]

$[0,1]$

f

$f$

質問：

有限個のサンプルの後に不偏推定を取得することは可能 $z$ ですか？もしそうなら、 $k$ サンプル後のそのような推定値の可能な最小の分散は何ですか？
そうでない場合、を推定するために利用できる手順 $z$ と、それに関連する収束時間は何ですか。

コメントでDouglas Zareが指摘したように、関数がゼロに近いか非常に大きい場合、これを行うのは非常に困難です。幸いなことに、これを使用する必要がある関数は上と下からバインドされているため、と仮定しう $1 \leq f(x) \leq 2$ 。さらに、 $f$ がリプシッツであるか、それが役立つ場合は微分可能であると仮定することもできます。

— ロビンソン
ソース

これ以上の情報がないと、非常に悪い動作をする可能性があります。

f

$f$ が

と

間で

であり、

で

と想像してください

を少し変更すると、中央値が

から

ジャンプします。

0

$0$

1 / 3

$1/3$

2 / 3

$2/3$

\int_{0}^{1 / 3} f (x) d x \approx 1 / 2.

$\int_0^{1/3} f(x)~dx \approx 1/2.$

f

$f$

1 / 3

$1/3$

2 / 3

$2/3$

— Douglas Zare 2012

@robinsonに関する詳細情報を提供できますか？または、密度問題を解くことに興味がありますか？

f

$f$

f

$f$

@DouglasZare-コメントありがとうございます。私の編集を参照してください。

— ロビンソン2012

@Procrastinator-もう少し情報を追加して質問を編集しました。

— ロビンソン2012

（+1）アップデート用。左側を右側で除算すると、これはサポートされている未知の確率分布の中央値を見つけることに帰着することがわかります。

[0, 1]

$[0,1]$

— 枢機卿

回答:

枢機卿が彼のコメントで指摘したように、あなたの質問は次のように言い換えることができます。

単純な代数によって、積分方程式は次のように書き換えることができるここでとして定義された確率密度関数である

\int_{0}^{z} g (x) d x = \frac{1}{2},

$\int_0^z g(x)\,dx = \frac{1}{2} \, ,$

g

$g$

g (x) = \frac{f (x)}{\int_{0}^{1} f (t) d t} .

$g(x)=\frac{f(x)}{\int_0^1 f(t)\,dt} \, .$

ましょ密度とランダム変数である。定義により、なので、積分方程式はあなたの問題は次のように述べることができることをその意味： $X$ $g$ $P\{X\leq z\}=\int_0^z g(x)\,dx$

P {X \leq z} = \frac{1}{2},

$P\{X\leq z\}=\frac{1}{2} \, ,$

「を密度確率変数にしましょうの中央値をます。」 $X$ $g$ $X$

中央値を推定するには、値のサンプル描画する任意のシミュレーション法を使っし、あなたの推定値としてサンプル中央値を取ります。 $X$ $X$

1つの可能性は、Metropolis-Hastingsアルゴリズムを使用して、目的の分布を持つポイントのサンプルを取得することです。Metropolis-Hastingsアルゴリズムでの受け入れ確率の表現のため、密度の正規化定数の値を知る必要はありません。したがって、この統合を行う必要はありません。 $\int_0^1 f(t)\,dt$ $g$

以下のコードは、Indepence Samplerと呼ばれるMetropolis-Hastingsアルゴリズムの特に単純な形式を使用しています。これは、分布がチェーンの現在の値に依存しない提案を使用しています。私は独立した統一提案を使用しました。比較のために、スクリプトはモンテカルロの最小値と標準的な最適化で見つかった結果を出力します。サンプルポイントはベクトルchainに格納されますが、シミュレーションのいわゆる「バーンイン」期間を形成する最初のポイントを破棄します。 $10000$

BURN_IN = 10000
DRAWS   = 100000

f = function(x) exp(sin(x))

chain = numeric(BURN_IN + DRAWS)

x = 1/2

for (i in 1:(BURN_IN + DRAWS)) {
    y = runif(1) # proposal
    if (runif(1) < min(1, f(y)/f(x))) x = y
    chain[i] = x
}

x_min = median(chain[BURN_IN : (BURN_IN + DRAWS)])

cat("Metropolis minimum found at", x_min, "\n\n")

# MONTE CARLO ENDS HERE. The integrations bellow are just to check the results.

A = integrate(f, 0, 1)$value

F = function(x) (abs(integrate(f, 0, x)$value - A/2))

cat("Optimize minimum found at", optimize(F, c(0, 1))$minimum, "\n")

結果は次のとおりです。

Metropolis minimum found at 0.6005409 
Optimize minimum found at 0.601365

このコードは、本当に必要なものの開始点としてのみ使用されます。したがって、注意して使用してください。

— 禅
ソース

f

$f$

f

$f$

f / \int f

$f/\int f$

離散時間マルコフ連鎖をカバーする、確率過程の入門コースを受講しましたか？

— Zen

ところで：世界の先延ばし屋、団結！しかし、今日ではありません...

— Zen

| \frac{1}{N} \sum_{n = 1}^{N} f (x_{n}) - \int_{0}^{1} f (u) d u | \leq ω (f; D_{N}^{*} (x_{1}, \dots, x_{N}))

$\Bigl|\frac 1N \sum_{n=1}^N f(x_n) - \int_0^1 f(u) \, {\rm d}u \Bigr| \le \omega (f; D_N^*(x_1, \ldots, x_N) )$

ω (f; t) = sup {| f (u) - f (v) | : u, v \in [0, 1], | u - v | \leq t, t > 0}

$\omega(f;t) = \sup \{ |f(u)-f(v)| : u, v \in [0,1], |u-v|\le t , t>0\}$

D_{N}^{*} (x_{1}, \dots, x_{N}) = sup_{u} | \frac{1}{N} \sum_{n} 1 {x_{n} \in [0, u)} - u | = \frac{1}{2 N} + max_{n} | x_{n} - \frac{2 n - 1}{2 N} |

$D_N^*(x_1,\ldots,x_N) = \sup_u \Bigl| \frac1N \sum_n 1\bigl\{ x_n \in [0,u) \bigr\} - u \Bigr| = \frac1{2N} + \max_n \Bigl|x_n - \frac{2n-1}{2N}\Bigr|$

x_{1}, \dots, x_{N}

$x_1, \ldots, x_N$ セミオープン間隔、そのルベーグ測度。最初の式は定義で、2番目の式は 1Dシーケンスのプロパティです（同じ本の定理2.6）。

[0, u)

$[0,u)$

u

$u$

[0, 1]

$[0,1]$

したがって、明らかに積分近似の誤差を最小限に抑えるには、少なくとも方程式のRHSでは、をとる必要があります。ランダム評価をねじ込むと、関数の重要な機能にランダムなギャップが生じるリスクがあります。 $x_n = (2n-1)/2N$

このアプローチの大きな欠点は、この均一に分散されたシーケンスを生成するために値にコミットする必要があることです。それが提供する近似の品質に満足できない場合は、の値を2倍にして、以前に作成された間隔のすべての中点をヒットするだけです。 $N$ $N$

ポイントの数を徐々に増やすことができるソリューションが必要な場合は、その本を読み続け、ファンデルコープトシーケンスと根本的な逆行列について学ぶことができます。ウィキペディアの低不一致シーケンスを参照してください。詳細はすべて提供されています。

更新：を解くには、部分和定義します検索ようおよび補間を見つけるのはこの補間は、が連続であることを前提としています。さらにが2階微分可能である場合、2次展開を積分してとを組み込み、 3次方程式を解くことにより、この近似 $z$

S_{k} = \frac{1}{N} \sum_{n = 1}^{k} f (\frac{2 n - 1}{2 N}) .

$S_k = \frac1N \sum_{n=1}^k f\Bigl( \frac{2n-1}{2N} \Bigr).$

k

$k$

S_{k} \leq \frac{1}{2} S_{N} < S_{k + 1},

$S_k \le \frac12 S_N < S_{k+1},$

z_{N} = \frac{2 k - 1}{2 N} + \frac{S_{N} / 2 - S_{k}}{N (S_{k + 1} - S_{k})} .

$z_N = \frac{2k-1}{2N} + \frac{S_N/2 - S_k}{N(S_{k+1}-S_k)}.$

f (\cdot)

$f(\cdot)$

f (\cdot)

$f(\cdot)$

S_{k - 1}

$S_{k-1}$

S_{k + 2}

$S_{k+2}$

z

$z$

— StasK
ソース

これの要点が好きです。OPの質問を解決するために提案する戦略をより明確にすることは有益だと思います。現在のところ、答えは（私には）質問の方程式のRHSを計算する方法を扱っているかのように読み取られます。

— 枢機卿

S_{N}

$S_N$

f

$f$

はい; このリーマン和にこの最適性の正当化があることは興味深いですが。

— StasK 2012