タグ付けされた質問 「quasi-monte-carlo」

5
偽の一様乱数:真の一様データよりも均等に分布
私は、均一に分布しているように見える乱数を生成する方法を探しています-そして、すべてのテストはそれらが均一であることを示します- 真の均一データよりも均等に分布していることを除いて。 「真の」均一なランダムの問題は、それらが時々クラスター化することです。この効果は、サンプルサイズが小さいほど強くなります。大まかに言って、U [0; 1]で2つのUniformランダムを描画すると、確率が0.1の範囲内にある可能性は約10%、0.01の範囲内にある可能性は1%です。 だから私は均一な乱数よりも均等に分布している乱数を生成する良い方法を探しています。 ユースケースの例:私はコンピューターゲームをやっていて、地図にランダムに宝物を置きたい(他のことは気にしない)とします。宝物をすべて1か所に集めたくはありません。地図全体に宝物を置くべきです。一様なランダムでは、たとえば10個のオブジェクトを配置した場合、5個ほどが互いに非常に近いという可能性は低くありません。これにより、あるプレイヤーが別のプレイヤーよりも有利になる場合があります。掃海艇について考えてみてください(十分な機雷がある場合は低いとはいえ)、あなたは本当に幸運で、ワンクリックで勝つことができます。 私の問題に対する非常に素朴なアプローチは、データをグリッドに分割することです。数が十分に大きい(そして要因がある)限り、この方法で余分な均一性を強制できます。したがって、U [0; 1]から12個のランダム変数を描画する代わりに、U [0; .5]から6個、U [0.5; 1]から6個、またはU [0; 1/3] + 4から4個描画できます。 U [1/3; 2/3]から+ U [2/3;から4; 1]。 この余分な均一性をユニフォームに取り入れるより良い方法はありますか?おそらく、バッチランダムに対してのみ機能します(単一のランダムを描画するときは、明らかに範囲全体を考慮する必要があります)。特に、後でレコードをシャッフルすることができます(したがって、最初の3番目から4番目のレコードではありません)。 少しずつやってみてはいかがですか?それで、最初はU [0; 1]にあり、次に各半分から2つ、各3つから1つ、各4つから1つですか?これは調査されましたか?xとyに異なるジェネレーターを使用して、それらを相関させないように注意する必要があります(最初のxyは常に下半分、2番目は左半分と下3番目、3番目は中央3番目と上3番目です)。 ..だから、少なくともいくつかのランダムなビンの並べ替えも必要です。そして、長期的には、それはあまりにも均一になると思います。 サイドノードとして、分布が均一になりすぎて真に均一にならないかどうかをテストすることはよく知られていますか?そのため、「真の統一」と「誰かがデータをいじり、アイテムをより均等に分散させる」ことをテストします。正しく思い出せば、Hopkins Statisticはこれを測定できますが、テストにも使用できますか?またやや逆KS-テスト:最大偏差が特定の予想しきい値を下回っている場合、データは均等に分散されていますか?

1
ハルトン系列対ソボル系列?
前の質問の回答から、均一なサンプル空間をほぼ均等にカバーする一連のベクトルを作成するために、ハルトンシーケンスに向けられました。しかし、ウィキペディアのページでは、特に上位の素数はシリーズの早い段階で非常に相関していることが多いと述べています。これは、サンプルサイズが比較的短い高素数のペアの場合に当てはまるようです。変数が相関していない場合でも、サンプル空間は均等にサンプリングされず、空間全体に高いサンプル密度の対角バンドがあります。 。 私は長さ6以上のベクトルを使用しているため、これが問題であるいくつかの素数を使用する必要があります(上記の例ほど悪くはありませんが)、変数のいくつかのペアは不均一にサンプリングされますサンプル平面。Sobolのシーケンスを使用して同様のセットを生成することは、グラフを見るだけで、比較的少数のサンプルでも、より均等に分布する変数のペア間でサンプルを生成するように思えます。これははるかに便利に思えるので、Haltonシーケンスがより有益になるのはいつかと思いますか?それとも、Haltonシーケンスを計算する方が簡単ですか? 注:他の多次元低不一致シーケンスの議論も歓迎します。

2
積分の精度を推定する方法は?
コンピュータグラフィックスで非常に一般的な状況は、一部のピクセルの色が一部の実数値関数の積分に等しいことです。多くの場合、関数は複雑すぎて分析的に解くことができないため、数値近似を行います。しかし、この関数は計算に非常にコストがかかることも多いため、計算できるサンプルの数には大きな制約があります。(たとえば、100万サンプルを取得して、そのままにしておくことはできません。) 次に、一般的に、推定積分が「十分に正確」になるまで、ランダムに選択されたポイントで関数を評価します。これは私の実際の質問に私をもたらします:積分の「精度」をどのように推定しますか? 具体的には、があります。これは、いくつかの複雑で低速なコンピューターアルゴリズムによって実装されます。見積もりたいf:R→Rf:R→Rf : \mathbb{R} \rightarrow \mathbb{R} k=∫baf(x) dxk=∫abf(x) dxk = \int_a^b f(x) \ dx 任意のxに対してを計算できますが、コストがかかります。したがって、ランダムにいくつかのx値を選択し、kの推定が許容できるほど正確になったときに停止します。もちろん、これを行うには、現在の見積もりが実際にどれほど正確であるかを知る必要があります。f(x)f(x)f(x)xxxxxxkkk この種の問題にどの統計ツールが適切であるかさえわかりません。しかし、私がfについてまったく何も知らなければ、問題は解決できないようです。たとえば、f (x )を1000回計算し、それが常にゼロの場合、推定積分はゼロになります。しかし、については何も知りませんfは、それがあることはまだ可能だF (xは)= 1 、000 、000をお使いの推定値は恐ろしく間違っているので、あなたは、サンプルに起こった点を除いてどこでも!ffff(x)f(x)f(x)ffff(x)=1,000,000f(x)=1,000,000f(x) = 1,000,000 ffffff 編集: OK、これは多くの応答を生成したようで、これは良いことです。それぞれに個別に返信するのではなく、ここで追加の背景を記入してみます。 ffffffffffff fffffffff fff また、「モンテカルロ」が出現した回数を考えると、それがこの種の統合の専門用語だと思いますか?

1
データから再サンプリングしてp値をシミュレートする方法
しばらく前に、タイムスタンプ間の時間の相関について質問し、コード間の平均距離を計算できるとピーターエリスから返信を受けました ... これにより、どのビヘイビアーがクラスター化されているかがある程度わかりますが、これが偶然によるものではないことも確認する必要があります。 これを確認するために、関係がないという帰無仮説の下でモデルによって生成されたシミュレーションデータを作成します。これを行うには、おそらく各イベント間の時間(たとえば、各あくびの間)の時間のリサンプリングに基づいて、可能性のあるnullモデルから各動作の時間のデータを生成し、架空のnullモデルイベントの新しいタイムスタンプのセットを作成する必要があります。次に、このnullモデルの同じインジケーター統計を計算し、本物のデータのインジケーターと比較します。このシミュレーションを何度も繰り返すことにより、データのインジケーターがnullモデルのシミュレーションデータと十分に異なるかどうか(各あくびから最も近いストレッチまでの平均時間が短いなど)を統計的に有意な証拠としてカウントできます。あなたの帰無仮説。 私はようやくこれを行うためのスキルセットを所有し、Rでこれを行いましたが、(a)詳細について学ぶ(b)私の背後にある理論についてインテリジェントに話すことができるように、このメソッドまたはテクニックが何と呼ばれるかわかりませんやってる これは順列検定と呼ばれることを示唆している人もいれば、ブートストラップと似ているが同じではないと言う人もいれば、モンテカルロ再サンプリングに関連していると私が言った人もいます。 NULLがTRUEの場合、このリサンプリング方法は何と呼ばれますか?回答をバックアップするためのリファレンスが1つまたは2つある場合は、役立つかもしれませんが必要ではありません。

2
ランダムサンプリングによる単純な積分方程式の解法
してみましょう非負関数です。ような を見つけることに興味があります。警告:私ができることは[0,1]のポイントでをサンプリングすることだけです。ただし、必要に応じて、fをランダムにサンプリングする場所を選択できます。 fffz∈[0,1]z∈[0,1]z \in [0,1]F [ 0 、1 ] F∫z0f(x)dx=12∫10f(x)dx∫0zf(x)dx=12∫01f(x)dx \int_0^{z} f(x)\,dx = \frac{1}{2}\int_0^1 f(x)\,dxfff[0,1][0,1][0,1]fff 質問: 有限個のサンプルの後にzの不偏推定を取得することは可能zzzですか?もしそうなら、kkkサンプル後のそのような推定値の可能な最小の分散は何ですか? そうでない場合、zを推定するために利用できる手順zzzと、それに関連する収束時間は何ですか。 コメントでDouglas Zareが指摘したように、関数がゼロに近いか非常に大きい場合、これを行うのは非常に困難です。幸いなことに、これを使用する必要がある関数は上と下からバインドされているため、1 \ leq f(x)\ leq 2と仮定しましょう1≤f(x)≤21≤f(x)≤21 \leq f(x) \leq 2。さらに、fffがリプシッツであるか、それが役立つ場合は微分可能であると仮定することもできます。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.