タグ付けされた質問 「random-generation」

一連の数字または記号をランダムに、または(ほとんどの場合)疑似ランダムに生成する行為。つまり、予測可能性やパターンがない。


1
乱数ジェネレーターからの切り捨てられた数値はまだ「ランダム」ですか?
ここで、「切り捨て」とは、乱数の精度を下げ、一連の乱数を切り捨てないことを意味します。たとえば、任意の精度で乱数(正規分布、均一分布などの任意の分布から描画)があり、すべての数字を切り捨てて、最終的にそれぞれが正確にn個の数字のセットになる場合小数点以下2桁。この新しい数字のセットを「ランダム」と呼ぶことはできますか?nnnnnn ハードウェア生成乱数について読んでいたとき、私はこの質問を思いつきました。ウィキペディアの記事では、物理的なプロセスを測定することで乱数を生成すると述べています。しかし、この測定には限界(測定誤差、有限精度など)があるため、これらのハードウェアで生成された数値をランダムに呼び出すことができますか?

4
公正なd6を使用して、1からまでのランダムに整数を独立して均一に描画しますか?
いくつかの公平な6面ダイス(d6)を振って、1から特定のまでの整数を描きたい。良い答えは、そのメソッドが均一で独立した整数を生成する理由を説明します。NNN 説明のための例として、N=150N=150N=150場合にソリューションがどのように機能するかを説明すると役立ちます。 さらに、この手順が可能な限り効率的であることを望みます。つまり、生成される各数値に対して、平均でd6の最小数をロールします。 老人から小数への変換は許可されています。 この質問は、このMetaスレッドに触発されました。

3
意図した分布に対してランダムに生成されたデータをテストする
ランダムデータを生成するプログラムを作成しました。プログラムが正常に動作している場合、そのデータは特定の既知の確率分布に従う必要があります。プログラムを実行し、結果に対していくつかの計算を行い、p値を見つけたいと思います。 他の誰かがそれを言う前に:私は、仮説テストではプログラムが正しく動作していることを検出できないことを理解しています。特定の方法で正しく動作していない場合にのみ検出できます。(それでも、選択した有意水準に応じて、テストは時間のX%で「失敗」するはずです...) だから、私はどのツールが適切かを理解しようとしています。特に: 必要なだけランダムデータを生成できます。私がしなければならないことは、プログラムを十分に長く実行することです。したがって、特定のサンプルサイズに限定されません。 p値を生成する手法に興味があります。したがって、グラフをじっと見て、「はい、それは線形に見えます」と言うことは、興味深い選択肢ではありません。グラフの「不安定」にハードナンバーを付ける何らかの方法がない限り。;-) 私がこれまでに知っていること: 適用できると思われる3つの主要なテストの種類を見ました。[Pearson]カイ2乗検定、Kolmogorov-Smirnov検定、およびAnderson-Darling検定。 カイ二乗検定は離散分布に適しているように見えますが、他の2つは連続分布に適しています。(?) さまざまな情報源は、ADテストはKSテストよりも「優れている」と示唆していますが、それ以上の詳細は説明していません。 最終的に、これらのテストはすべて、指定されたヌル分布から逸脱する「異なる方法」を検出すると考えられます。しかし、私はまだ違いが何であるかを本当に知りません...要約すると、私は各タイプのテストが最も適切である場所と、それが最もよく検出する種類の問題のある種の一般的な説明を探しています。



3
多変量正規分布からサンプルを描画するためのコレスキー対固有分解
サンプルを描きたいです。ウィキペディアは、コレスキーまたは固有分解を使用することを推奨しています。つまり、 または Σ = D 1 D T 1x∼N(0,Σ)x∼N(0,Σ)\mathbf{x} \sim N\left(\mathbf{0}, \mathbf{\Sigma} \right)Σ=D1DT1Σ=D1D1T \mathbf{\Sigma} = \mathbf{D}_1\mathbf{D}_1^T Σ=QΛQTΣ=QΛQT \mathbf{\Sigma} = \mathbf{Q}\mathbf{\Lambda}\mathbf{Q}^T したがって、サンプルは次の方法で描画できます。 または ここで、 x=D1vx=D1v \mathbf{x} = \mathbf{D}_1 \mathbf{v} x=QΛ−−√vx=QΛv \mathbf{x} = \mathbf{Q}\sqrt{\mathbf{\Lambda}} \mathbf{v} v∼N(0、I)v∼N(0,I) \mathbf{v} \sim N\left(\mathbf{0}, \mathbf{I} \right) ウィキペディアでは、どちらもサンプルの生成に同等に適していると示唆していますが、コレスキー法の方が計算時間が高速です。これは本当ですか?特に数値的に、モンテカルロ法を使用する場合、対角線に沿った分散が数桁異なる場合がありますか?この問題に関する正式な分析はありますか?

2
計算統計における乱数生成の重要な用途は何ですか?
計算統計において乱数ジェネレーター(RNG)はどのようにそしてなぜ重要ですか? 多くの統計的検定のサンプルを選択する際にどちらかの仮説への偏りを避けるためにランダム性が重要であることを理解していますが、乱数ジェネレーターが重要な計算統計の他の領域はありますか?


3
統計的ランダム性に関するいくつかの質問
ウィキペディアの統計randoness: グローバルなランダム性とローカルなランダム性は異なります。特定のサブシーケンスがランダムに見えなくても、「長期的には」シーケンスは本当にランダムに見えるという考えに基づいているため、ランダム性の哲学的概念の大部分はグローバルです。たとえば、十分な長さの「真の」ランダムシーケンスでは、ゼロ以外の長いシーケンスが存在する可能性がありますが、シーケンス全体はランダムである可能性があります。局所的ランダム性とは、ランダムな分布が近似される最小のシーケンス長が存在する可能性があるという考え方を指します。同じ数字の長いストレッチは、「真の」ランダムプロセスによって生成されたものであっても、サンプルの「ローカルランダム性」を低下させます(10,000桁のシーケンスではローカルランダムである可能性があります。たとえば、すべて)。 パターンを示すシーケンスは、統計的にランダムではないことが証明されています。ラムジー理論の原理によれば、十分に大きいオブジェクトには、必ず特定のサブ構造が含まれている必要があります(「完全な無秩序は不可能」)。 太字の2つの文の意味がよくわかりません。 最初の文は、何かがより短い長さでローカルランダムではなく、より長い長さでシーケンスをローカルランダムにすることを意味しますか? 括弧内の例はどのように機能しますか? 2番目の文は、パターンを示すシーケンスが統計的にランダムでないことを証明できないことを意味しますか?どうして? ありがとう

2
3つの相関した一様分布のランダム変数を生成する
私たちが持っていると仮定します X 2〜UNIF(nは、0 、1 )、X1∼unif(n,0,1),X1∼unif(n,0,1),X_1 \sim \textrm{unif}(n,0,1), X2∼unif(n,0,1),X2∼unif(n,0,1),X_2 \sim \textrm{unif}(n,0,1), ここで、unif(n,0,1)unif(n,0,1)\textrm{unif}(n,0,1)はサイズnの一様ランダムサンプルであり、 Y=X1,Y=X1,Y=X_1, Z=0.4X1+1−0.4−−−−−−√X2.Z=0.4X1+1−0.4X2.Z = 0.4 X_1 + \sqrt{1 - 0.4}X_2. この場合、と相関はです。Z 0.4YYYZZZ0.40.40.4 これを3つの変数、、に拡張するにはどうすればよいですか?X 2 X 3X1X1X_1X2X2X_2X3X3X_3


2
乱数とマルチコアパッケージ
Rでプログラミングするとき、マルチコアパッケージを数回使用しました。しかし、私はそれが乱数をどのように処理するかについてのステートメントを見たことはありません。CでopenMPを使用するときは、適切な並列RNGを使用するように注意しますが、Rでは、理にかなったことが起こると想定しています。誰でも賢明なことが起こることを確認できますか? 例 ドキュメントから、私たちは持っています x <- foreach(icount(1000), .combine = "+") %do% rnorm(4) rnorm`s はどのように生成されますか?


3
一様に分布し相関した乱数のペアを生成します
特定の相関関係を持つ乱数のペアを生成したいと思います。ただし、2つの正規変数の線形結合を使用する通常のアプローチは、ここでは有効ではありません。これは、均一変数の線形結合はもはや均一分布変数ではないためです。2つの変数が均一である必要があります。 特定の相関関係を持つ均一変数のペアを生成する方法に関するアイデアはありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.