モンテカルロシミュレーション推定の精度を見つける


12

バックグラウンド

私は一連のモデルの出力を組み合わせたモンテカルロシミュレーションを設計しています。シミュレーションにより、シミュレーション結果の確率とその確率推定の精度について合理的な主張ができることを確認したいと思います。

シミュレーションは、特定のコミュニティから選ばれたju審員が特定の被告に有罪判決を下す可能性を見つけます。シミュレーションの手順は次のとおりです。

  1. 既存のデータを使用して、人口統計的予測因子で「審査員第一投票」を回帰することにより、ロジスティック確率モデル(M)を生成します。

  2. モンテカルロ法を使用して、Mの 1,000バージョン(つまり、モデルパラメーターの係数の1000バージョン)をシミュレートします。

  3. モデルの1,000バージョン(M i)のいずれかを選択します。

  4. 特定の人口統計学的特性分布を持つ個人の「コミュニティ」(C)から12の「ju審員」の1,000セットをランダムに選択することにより、1,000人の審査員を審査します。

  5. M iを使用して、各審査員の最初の投票有罪投票の確率を決定論的に計算します。

  6. 各「ju審員」の可能性のある票を、(0-1の間でランダムに選択された値よりも大きいか小さいかに基づいて)確定票にレンダリングします。

  7. 最初の投票で有罪判決を下すju審員の割合を条件に、ju審が有罪となる確率のモデル(経験的データから導出)を使用して、各「 "審員」「最終投票」を決定します。

  8. 1000人のju審員に対する有罪判決の割合(PG i)を保存します。

  9. Mの 1,000のシミュレートされたバージョンのそれぞれについて、手順3〜8を繰り返します。

  10. PGの平均値を計算し、それをCでの確信の確率のポイント推定値として報告し  ます。

  11. PGの2.5および97.5パーセンタイル値を特定し、0.95信頼区間として報告します。

現在、確率分布(Cの人口統計学的特性またはMのバージョン)から1,000のランダム抽選がその分布を埋めるという理論で、1,000人のju審員と1,000人のju審員を使用しています。

ご質問

これにより、見積もりの​​精度を正確に判断できますか?もしそうなら、Cの確率分布をカバーするために、各PG i計算に何人の審査員を入れる必要があります(したがって、選択バイアスを回避します)。1,000未満しか使用できませんか?

助けてくれてありがとう!


好奇心から:このモデルには、被告人が実際に有罪かどうかの条件がありますか?
whuber

このモデルは、単一の事実パターンに対する調査回答に基づいているため、実際の罪悪感は変わりません。私は、単一の争われた事件で異なる審査員がどのように出てくるかを予測しています。
マギー

冗談はさておき、PGの平均値と2.5および97.5パーセンタイルの3つの推定値を報告します。「正確な」判断が必要なのはどれで、どれほど正確である必要がありますか?
whuber

また、手順(6)は不思議です。それが何をするつもりなのか説明してもらえますか?各ju審員(5)、各ju審員(4)、各モデル(3)、またはそれらの組み合わせに対して異なる「ランダムに選択された値」はありますか?
whuber

1
(上記のコメントを参照)審査員の数(a)を減らすことができると思います。サンプリングエラーは、サンプル数の関数です。モデルごとに1,000人の審査員がいるため、合計100万のサンプルがあります。10 ^ 6サンプルに関連するサンプリングエラーは、約0.1%です。モデルごとに35の審査員のみを使用する場合、3.5 * 10 ^ 4のサンプルと、〜0.5%のサンプリングエラーがあります。このサンプリング誤差は、私の測定誤差〜5.0%よりもはるかに小さいです。したがって、モデルごとに35の審査員を使用し、測定誤差を使用して信頼区間を推定できる必要があります。
マギー

回答:


4

モンテカルロの良さには、収束という一般的な「宇宙内」の基準が1つあります。

1つのMに固執し、PGがju審の数でどのように動作するかを確認してください-それは収束するはずですので、合理的な(あなたのアプリケーションのための)有効数字の数になる繰り返しを表示します。他の少数のMに対してこのベンチマークを繰り返して、Mの選択がうまくいかなかったことを確認してから、シミュレーション全体に進みます。


1
誰かが質問に完全に反応したかどうかはわかりません。(1)説明したモデリング戦略は、解決したい問題に対する防御可能なソリューションを提供しますか?つまり、特定の人口統計特性を持つコミュニティCから無作為に選ばれたju審員が、被告は有罪?(2)モデリング戦略が合理的である場合、信念の確率と0.95 CIの防御可能な推定値を報告するために、彼女が選択しなければならない「ju審」の数と、それぞれについてシミュレーションする必要のある「評決」の数は?彼女はコンピューティングを節約したいと考えています。彼女の最後のコメントを参照してください
-dmk38

0

ここでの問題は、モデルが複雑すぎて、モンテカルロシミュレーションを使用せずに見ることができないかどうかであるように思えます。

モデルがすべて比較的単純な場合は、モデルを複数回再実行することなく、従来の統計を介してモデルを調べ、質問に対する解決策を導き出すことができるはずです。これはやや複雑すぎますが、モデルがすべて正規分布に基づいてポイントを生成することであれば、探している答えの種類を簡単に導き出すことができます。もちろん、モデルがこれほど単純な場合は、モンテカルロシミュレーションを実行して答えを見つける必要はほとんどありません。

問題が複雑で、より基本的なものに分解できない場合、モンテカルロは使用するのに適したタイプのモデルですが、モデルを実行せずに信頼限界を定義する方法はないと思います。最終的に、記述されたタイプの信頼限界を取得するには、モデルを何度も実行する必要があり、確率分布を出力に適合させる必要があり、そこから信頼限界を定義できます。モンテカルロシミュレーションの課題の1つは、モデルが中程度の分布に対して適切で規則的な答えを与えるが、多くの場合、テールはより可変的な結果を与えることであり、最終的には、出力の形状を2.5% 97.5%パーセンタイル。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.