計算統計において乱数ジェネレーター(RNG)はどのようにそしてなぜ重要ですか?
多くの統計的検定のサンプルを選択する際にどちらかの仮説への偏りを避けるためにランダム性が重要であることを理解していますが、乱数ジェネレーターが重要な計算統計の他の領域はありますか?
計算統計において乱数ジェネレーター(RNG)はどのようにそしてなぜ重要ですか?
多くの統計的検定のサンプルを選択する際にどちらかの仮説への偏りを避けるためにランダム性が重要であることを理解していますが、乱数ジェネレーターが重要な計算統計の他の領域はありますか?
回答:
たくさんの例があります。あまりにも多すぎて、おそらく誰もが完全に知るには多すぎます(おそらく過小評価されるべきではない@whuberを除く)。
言及したように、制御された実験では、被験者を治療グループと制御グループにランダムに分割することにより、サンプリングの偏りを回避します。
ではブートストラップ我々は、ランダムに固定し、試料からの交換にサンプリングすることによって、母集団から繰り返しサンプリングを近似します。これにより、とりわけ推定値の分散を推定できます。
で、クロスバリデーション我々はランダムスライスに私たちのデータを分割し、ランダムなトレーニングとテストセットを組み立てることによって見積もりのサンプル誤差のうちを見積もります。
で順列テスト我々は、さまざまな状況でノンパラメトリック仮説検定を実行できるように、帰無仮説の下でサンプルにランダムな順列を使用します。
に 袋詰め我々は、繰り返し学習データのブートストラップサンプルについて推定を行い、その結果を平均することによって推定値の分散を制御します。
に 、ランダムな森林我々は、さらにまた、ランダムにすべての意思決定ポイントで入手可能な予測因子からサンプリングすることにより、推定の分散を制御します。
に シミュレーション我々はモデルで検証フィット感と仮定を支援し、トレーニングやテストデータと比較することができ、ランダムに新しいデータセットを生成するためのフィットモデルをお願いします。
に マルコフ連鎖モンテカルロ法(この例では@Ben Bolkerおかげ)マルコフ連鎖を使用して可能な結果の空間を探索することによって分布からサンプルを我々 。
これらは、すぐに思い浮かぶ一般的な日常のアプリケーションです。深く掘り下げると、おそらくそのリストの長さを2倍にすることができます。ランダム性は、研究の重要な目的であると同時に、振る舞うための重要なツールでもあります。
これはすべて真実ですが、主な問題には対処していません。 結果の構造またはシーケンス内の予測可能性のある種類の PRNGは、シミュレーションを失敗させます。 カール・ウィットフト 1月31日15時51分
これが懸念事項である場合、質問のタイトルを「モンテカルロの結果に対するRNG選択の影響」またはそのようなものに変更する必要があります。この場合、すでにSEのクロス検証で考慮されています、ここにいくつかの指示があります