計算統計における乱数生成の重要な用途は何ですか?


15

計算統計において乱数ジェネレーター(RNG)はどのようにそしてなぜ重要ですか?

多くの統計的検定のサンプルを選択する際にどちらかの仮説への偏りを避けるためにランダム性が重要であることを理解していますが、乱数ジェネレーターが重要な計算統計の他の領域はありますか?



1
何を聞いているんですか?あなたの質問はあまり意味がありません。
カールウィットソフト

2
重要ではない領域を尋ねる方が良いかもしれません。それはおそらくより短いリストでしょう。
ジョンコールマン

2
質問は広範ですが、タイトルは魅力的で、Matthewの答えは素晴らしい概要です。再開することに投票しました!
ブノワサンチェス

3
これは、従来のSE規格では明らかに広すぎます。また、既に提供された回答を複製することが多く、ほとんどかろうじて作成された多くの小さな回答が生じる可能性が高い「大きなリスト」の質問になります。ただし、ここには実際の価値があるようです。妥協点は、これをCWおよび保護することです。将来的には、詳細なしで何かに言及する回答や既に言及した重複使用は、コメントなしで即座に削除されます。
GUNG -復活モニカ

回答:


17

たくさんの例があります。あまりにも多すぎて、おそらく誰もが完全に知るには多すぎます(おそらく過小評価されるべきではない@whuberを除く)。

言及したように、制御された実験では、被験者を治療グループと制御グループにランダムに分割することにより、サンプリングの偏りを回避します。

ではブートストラップ我々は、ランダムに固定し、試料からの交換にサンプリングすることによって、母集団から繰り返しサンプリングを近似します。これにより、とりわけ推定値の分散を推定できます。

、クロスバリデーション我々はランダムスライスに私たちのデータを分割し、ランダムなトレーニングとテストセットを組み立てることによって見積もりのサンプル誤差のうちを見積もります。

順列テスト我々は、さまざまな状況でノンパラメトリック仮説検定を実行できるように、帰無仮説の下でサンプルにランダムな順列を使用します。

袋詰め我々は、繰り返し学習データのブートストラップサンプルについて推定を行い、その結果を平均することによって推定値の分散を制御します。

、ランダムな森林我々は、さらにまた、ランダムにすべての意思決定ポイントで入手可能な予測因子からサンプリングすることにより、推定の分散を制御します。

シミュレーション我々はモデルで検証フィット感と仮定を支援し、トレーニングやテストデータと比較することができ、ランダムに新しいデータセットを生成するためのフィットモデルをお願いします。

マルコフ連鎖モンテカルロ法(この例では@Ben Bolkerおかげ)マルコフ連鎖を使用して可能な結果の空間を探索することによって分布からサンプルを我々 。

これらは、すぐに思い浮かぶ一般的な日常のアプリケーションです。深く掘り下げると、おそらくそのリストの長さを2倍にすることができます。ランダム性は、研究の重要な目的であると同時に、振る舞うための重要なツールでもあります。


これはすべて真実ですが、主な問題には対処していません。結果の構造またはシーケンス内の予測可能性のある種類のPRNGは、シミュレーションを失敗させます。
カールウィットソフト

3
言及に値するものの1つは、大量の乱数または擬似乱数を生成する計算およびメモリコストです。統計におけるRNGのアプリケーションの中には、数百から数百万の乱数を必要とするものもありますが、これらの両方のコストに関係する桁違いの数桁を必要とするものもあります。
アレクシス

5

これはすべて真実ですが、主な問題には対処していません。 結果の構造またはシーケンス内の予測可能性のある種類の PRNGは、シミュレーションを失敗させます。 カール・ウィットフト 1月31日15時51分

これが懸念事項である場合、質問のタイトルを「モンテカルロの結果に対するRNG選択の影響」またはそのようなものに変更する必要があります。この場合、すでにSEのクロス検証考慮されています、ここにいくつかの指示があります

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.