因果関係に依存する確率変数の生成


8

私は因果的に接続されたランダム変数のセットを生成しようとしています、そしてモンテカルロアプローチでこれを始めることから始めました。

ベースラインは2次元の測定されたヒストグラムで、そこからランダムな値を引き出します。

私の具体的な例では、これらの変数は加速度と速度そのため、明らかに を保持する必要があります。v v i + 1 = v i + a id tavv+1=v+adt

私の現在の素朴なアプローチは:

私はいくつかのます。次に、の値に対して測定された確率に従ってランダムなを生成します。このを使用してを計算でき、手順全体がからやり直します。a 0 a v 0 a 0 v 1v0a0av0a0v1

したがって、生成された加速度をビンで確認すると、すべて問題ありません。しかし、私は明らかにこれが周辺分布をまったく尊重していません。v vavv

私は基本的なモンテカルロ法にある程度精通していますが、ご想像のとおり、理論的な背景はありません。2つの変数が何らかの相関行列で接続されているだけで問題はありませんが、2つの変数間の因果関係は頭痛の種になります。

私はどこかでこの種の問題の例を見つけることができませんでした-私は間違った用語をググっているかもしれません。これを手に入れるために誰かが私にいくつかの文献/例または有望な方法を教えてもらえれば私は満足しています。

(または、私の入力では実際には不可能であることを教えてください-それは私が時々推測していることです...)

編集:

この手順全体の実際の目的:2次元のヒストグラムで表される一連の測定とあります。この入力を、測定された分布を再現するランダムなとセットを生成します。v N a v a r v ravNavarvr


1
興味深い質問です。しかし、2番目の「明らかに」(限界分布を尊重しないことについて)は、私にはまったく明確ではありません。なぜそれが明白なのですか? 2次元ヒストグラムに反映されるv a の分布はこれらの変数をどのようにサンプリングしたかによって異なります。これが考えられる違いを説明できるのかどうか疑問に思います。このヒストグラムではどのような種類のデータが表現され、どのようにして正確に「値を描く」のでしょうか。va
whuber

まあ、私にとってはその種の明白な理由です。なぜなら、分布はゼロを中心にほぼ対称だからです。したがって、a iを生成するとき、vへの依存関係はありません。現在のvがマージナルv分布の上端にある場合、負のa iへのバイアスが存在すると想定します。「値を描く」とは、1次元の確率分布を取り、累積分布を構築し、0と1の間の乱数rをスローすることで、xが累積される場所を見つけます。分布の値はrです。このxは私の「引き寄せられた価値」aavvvarバツrバツ
セバスチャン

完全を期すために、データはgps-loggingからのものです。私は車のログに記録された旅行のセットを持っています。これは1Hzで速度を記録します。だから、一組の彼らだおよびすべてのデータポイントのため。これらはヒストグラムに入力されます。va
セバスチャン2013年

2
コメントは、vが独立していると想定していることを示しています。速度には物理的な制限があるため、これはおそらく不可能です。つまり、極端な速度では多くの加速が発生しないことになります。ただし、達成しようとしていることを明確に示していないため、より詳細なアドバイスを提供することは容易ではありません。代わりに、あなたは述べられていない問題を解決するためのアプローチを説明しました。この質問を変更して、無効に見えるソリューションを実装する方法ではなく、解決する必要がある問題について尋ねてみませんか?av
whuber

回答:


1

共同配送再現するためにと思われる、新しい選択してくださいAに基づいていないだけに、V古いに基づいていますが、Aも:ρavava

a+1ρa+1|av

質問(私はまだ答えを知りません)は、を生成するρ を見つける方法です。ρρ

UPD:次の積分方程式を解く必要があります。

ρav=daρa|ava+a2Δtρava+a2Δt

関数をヒストグラムで近似し、これを線形方程式のシステムに変換します。ρ

{ρav=Σaρa|ava+a2Δtρava+a2ΔtΣaρa|av=1

このシステムは未定です。ソリューションを得るために、滑らかさのペナルティを適用することができます。


0

gpsデータに位置が含まれていませんか?私は、v i + 1v ia iに依存しているだけでなく、a i + 1p iに依存していると考えていまし。検討してください:道路網には、地理上の位置にあるボトルネック、速度制限、信号、交差点、急勾配などがあります。つまり、次のように定義されるアンサンブル(分布)のようなものです。pv+1vaa+1p

、V I + 1 = V iは + I DのTをFa=Pr+1a+1 | avp
v+1=v+adt

このようなアンサンブルの場合、データの性質に問題が生じます。真の母集団は非対称、非線形(区分的)であり、モーメントが定義されていない可能性があります。これらの特性は、手元にあるサンプルでは明らかでない場合があります。

@whuberが述べたように、問題、つまり正確に生成しようとしているものは、まだ完全かつ明確に定義されているようには見えません。アンサンブルに興味があるのか​​、それとも個人に興味があるのか​​は明確ではありません。


vavrad

少なくとも、上記の式で示されているように、これは定常効果ではありません。最初のステップは、時間間隔に従って測定値をビニングし、それらを比較することだと思います。読み値の数はわかりませんが、この比較は、ピアソン分布のようなものを出発点として実行することができます-分布の性質を分類することを試みます。
AsymLabs 2013年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.