タグ付けされた質問 「sampling」

3
メルセンヌツイスターはなぜ良いと見なされているのですか?
メルセンヌツイスターは広く良いとみなされています。ちなみに、CPythonのソースによると、「現存する最も広範囲にテストされたジェネレーターの1つです」しかし、これはどういう意味ですか?このジェネレーターのプロパティをリストするように求められたとき、私が提供できるもののほとんどは悪いです: それは大規模で柔軟性がありません(例:シークなしまたは複数のストリーム)。 巨大な状態サイズにもかかわらず、標準的な統計テストに失敗し、 0付近に重大な問題があり、ランダム化がかなり不十分であることを示唆しています。 速くない 等々。XorShift *のような単純なRNGと比較すると、それは絶望的にも複雑です。 それで、なぜこれが良いと考えられたのかについての情報を探しました。オリジナルの論文は、「超天文学」期間と623次元の均等分布について多くのコメントを述べています。 多くの既知の尺度の中で、スペクトルテスト(Knuth [1981]を参照)や以下に説明するk分布テストなど、より高い次元の均一性に基づくテストが最も強いと考えられています。 ただし、このプロパティの場合、ジェネレーターは十分な長さのカウンターで叩かれます!これは、ジェネレーターで実際に気にしているローカル分布の解説を行いません(ただし、「ローカル」はさまざまなことを意味します)。そして、CSPRNGでさえ、それほど重要ではないので、このような長い期間は気にしません。 論文には多くの数学がありますが、私が知る限り、実際にはランダム性の品質に関するものはほとんどありません。そのほとんどすべての言及は、これらの元々の、ほとんど役に立たない主張にすぐに戻ります。 古い、より信頼性の高い技術を犠牲にして、人々はこの時流に飛び乗ったようです。たとえば、LCGの単語数を3(Mersenne Twisterの「たった624」よりもはるかに少ない)に増やし、各パスで上位の単語を出力すると、BigCrush(TestU01テストスイートのより難しい部分)を通過します)、ツイスターが失敗したにもかかわらず(PCG論文、図2)。これと、メルセンヌツイスターを支持して見つけることができた弱い証拠を考えると、他の選択肢よりも注目を集めたのは何ですか? これも純粋に歴史的なものではありません。メルセンヌツイスターは、実際には、少なくともPCGランダムよりも実際に証明されていると言われています。しかし、ユースケースは私たちの一連のテストよりも優れているほど識別力がありますか?一部のグーグルは、おそらくそうではないと示唆しています。 要するに、メルセンヌツイスターは、その歴史的背景とその他の両方において、どのようにして広く肯定的な評判を得たのだろうかと思っています。一方で私は明らかにその性質に懐疑的ですが、他方では、それが完全にランダムに発生したことを想像するのは困難です。

4
シンプレックスからの均一なサンプリング
私は、N個の乱数の配列を生成するアルゴリズムを探しています。N個の数字の合計は1で、すべての数字は0と1の範囲内にあります。たとえば、N = 3、ランダムポイント(x、y、 z)三角形内にある必要があります: x + y + z = 1 0 < x < 1 0 < y < 1 0 < z < 1 理想的には、エリア内の各ポイントに等しい確率が必要です。難しすぎる場合は、要件を削除できます。ありがとう。

9
公正なコインを与えられたダイをシミュレートする方法
公正なコインが与えられ、公正な(6面の)ダイスを繰り返し反転する確率分布をシミュレートしたいとします。私の最初のアイデアは、2 k = 6 mのような適切な整数を選択する必要があるということです。そうコイン投げた後のk回、我々は範囲を分割することにより、ダイの出力にK個の長さのビット列によりコード番号をマッピングする[ 0 、2 のk - 1 ] 6にインターバル長の各M。ただし、2 kには2つの唯一の素因数がありますが、k,mk,mk,m2k=6m2k=6m2^k = 6mkkk[0,2k−1][0,2k−1][0,2^k-1]mmm2k2k2^kは3が含まれます。これを行う他の簡単な方法があるはずですよね?6m6m6m

3
乱数の真に均一な分布を得る唯一の方法は、拒否サンプリングですか?
一様分布の範囲数値を出力するランダムジェネレーターがあり、一様分布の範囲乱数を生成する必要があるとし ます。[ 0 .. N − 1 ][0..R−1][0..R−1][0..R-1][0..N−1][0..N−1][0..N-1] 仮定と割り切れない、取得するために、真に均一な分布、我々が使用することができます 棄却サンプリング方法を:N RN&lt;RN&lt;RN < RNNNRRR がような最大の整数である場合k N &lt; RkkkkN&lt;RkN&lt;Rk N < R で乱数を選択し[ 0 .. R − 1 ]rrr[0..R−1][0..R−1][0..R-1] 場合、出力R \ MOD Nが、そうでない場合は、他の乱数R」、R」にしようと、...を維持する条件が満たされるまでr&lt;kNr&lt;kNr < k NrmodNrmodNr \mod N 真に均一な離散分布を得るには、拒絶サンプリングが唯一の方法ですか? 答えが「はい」の場合、なぜですか? 注意:もしN&gt;RN&gt;RN > R考え同じである:乱数発生r′r′r'で[0..Rm−1],Rm&gt;=N[0..Rm−1],Rm&gt;=N[0..R^m-1], R^m >= N、例えばr′=R(...R(Rr1+r2)...)+rmr′=R(...R(Rr1+r2)...)+rmr' = R(...R(R r_1 + r_2)...)+r_mここで、ririr_iは[0..R-1]の範囲の乱数[0..R−1][0..R−1][0..R-1]

2
最短
ましょうGはGGグラフであり、およびlet Sss及びTはttの2つの頂点であるGGG。sとtの間のすべての最短パスのセットからランダムに均一かつ独立して最短sss - tttパスを効率的にサンプリングできますか?簡単にするために、Gは単純で、方向付けられておらず、重み付けされていないと仮定できます。ssttGG 多くの制限されたグラフでさえ、sssとtの間の最短経路の数ttはGのサイズで指数関数的GGです。したがって、実際にはすべての最短sss - tttパスを実際に計算することは避けたいと思います。一般的なケースについては知りませんが、いくつかの特別なグラフクラスでこれを達成できるようです。 これは、誰かが以前に考慮したに違いないように感じます。これに関する既存の研究はありますか、または実際にこれは一般的なグラフに対しても簡単ですか?

2
ランダムにマルチセットの2つの拡散した混乱した順列を生成する効率的なアルゴリズム
バックグラウンド \newcommand\ms[1]{\mathsf #1}\def\msD{\ms D}\def\msS{\ms S}\def\mfS{\mathfrak S}\newcommand\mfm[1]{#1}\def\po{\color{#f63}{\mfm{1}}}\def\pc{\color{#6c0}{\mfm{c}}}\def\pt{\color{#08d}{\mfm{2}}}\def\pth{\color{#6c0}{\mfm{3}}}\def\pf{4}\def\pv{\color{#999}5}\def\gr{\color{#ccc}}\let\ss\grnnnビー玉の同一のバッチが2つあるとします。各大理石はccc色のいずれかです(c≤nc≤nc≤n。してみましょうninin_i色のビー玉の数表すiii各バッチでを。 ましょうSS\msSマルチセットである{1,…,1n1,2,…,2n2,…,1c,…,cnc}{1,…,1⏞n1,2,…,2⏞n2,…,1c,…,c⏞nc}\small\{\overbrace{\po,…,\po}^{n_1},\;\overbrace{\pt,…,\pt}^{n_2},\;…,\;\overbrace{\vphantom 1\pc,…,\pc}^{n_c}\}は1つのバッチを表します。で周波数表現、SS\msSまた、のように書くことができる(1n12n2…cnc)(1n12n2…cnc)(\po^{n_1} \;\pt^{n_2}\; … \;\pc^{n_c})。 \ msSの異なる順列の数はSS\msS、多項式によって与えられます: |SS|=(nn1,n2,…,nc)=n!n1!n2!⋯nc!=n!∏i=1c1ni!.|SS|=(nn1,n2,…,nc)=n!n1!n2!⋯nc!=n!∏i=1c1ni!.\left|\mfS_{\msS}\right|=\binom{n}{n_1,n_2,\dots,n_c}=\frac{n!}{n_1!\,n_2!\cdots n_c!}=n! \prod_{i=1}^c \frac1{n_i!}. 質問 ランダムに\ msSの 2つの拡散した混乱した順列PPPおよびQを生成する効率的なアルゴリズムはありますか?(分布は均一でなければなりません。)QQQSS\msS 順列PPPある拡散すべての異なる要素の場合iiiのPPPのインスタンスiiiで略均等に離間されているPPP。 たとえば、\ msS =(\ po ^ 4 \; \ pt ^ 4)= \ {\ po、\ po、\ po、\ po、\ pt、\ pt、\ pt、\ pt \}と仮定しますS=(1424)={1,1,1,1,2,2,2,2}S=(1424)={1,1,1,1,2,2,2,2}\msS=(\po^4\;\pt^4)=\{\po,\po,\po,\po,\pt,\pt,\pt,\pt\}。 {1,1,1,2,2,2,2,1}{1,1,1,2,2,2,2,1}\{\po, \po, \po, \pt, \pt, \pt, …

2
ランダムに均一に完全一致をサンプリングする
私はグラフがあるととの完璧なマッチングの(不明)セット。このセットが空でないと仮定すると、からランダムに均一にサンプリングするのはどれほど難しいでしょうか?均一に近いが完全に均一ではない分布で問題ない場合、効率的なアルゴリズムはありますか?GGGM(G )M(G)M(G)GGGM(G )M(G)M(G)

1
Barabasi-Albertを使用してべき乗次数分布を持つスケールフリーネットワークを生成する
一部の論文に記載されている合成ネットワーク(グラフ)を再現しようとしています。 Barabasi-Albertモデルが「べき乗則の次数分布を持つスケールフリーネットワーク」を作成するために使用されたと述べられています。PA(k)∝k−λPA(k)∝k−λP_A(k) ∝ k^{-λ} PAPAP_Aは、次数ノードの確率を返す確率分布です。たとえば、は、ネットワークからノードをランダムに選択し、2次のノードを取得する確率を示します。P A(2 )kkkPA(2)PA(2)P_A(2) 1つの論文での平均次数ストロークは4であるように見え、最小は2 です。最大についての言葉はありません。他の論文では指定されていません。ネットワークを定義することはそれほど重要ではないようです。k kkkkkkkkkk ノードの数と同様に、ラムダλ値が与えられます。組み合わせはnnn n = 50000、λ= 3、2.7、2.3、論文あり 他の論文では、n = 4000およびλ= 2.5、またはn = 6000およびλ= 3 Barabasi-Albertアルゴリズムを実装するライブラリを探しましたが、それらにはラムダや平均次数とは異なるパラメーターが必要なようです。1つはNetworkXで、もう1つはGraphStreamです(ここでの実装)。彼らは同様の方法で働き、次のことを求めます: n:int-ノードの数 m:int-新しいノードから既存のノードに接続するエッジの数。各ステップで追加されるエッジの数 設定mを計算して比較可能なグラフを生成するにはどうすればよいですか? ここにいくつかの参照があります: 相互に依存するネットワークにおける故障の破滅的なカスケード、Buldyrev等。2010、別途提供される補足情報 サイバーフィジカルシステムの小さなクラスター、Huang et al。2014 相互依存ネットワークにおける破局的な障害のカスケード、ハブリン等。2010年、これはArxivに関するものであり、最初の これらの論文は、これらのグラフのいくつかの特性を分析的に研究するために「生成関数」を使用したことに注意してください。ただし、これらのモデルでシミュレーションを実行するため、何らかの方法でこれらのネットワークを生成している必要があります。 ありがとう。

3
ポリゴンのランダムサンプリング
ポリゴン内の一様にランダムなポイントをサンプリングしたい... 多数をサンプリングする場合、同じ面積の場合、2つの地域に分類される可能性が等しくなります。 [0,1]の2つの乱数を座標として取るので、正方形の場合、これは非常に簡単です。 私が持っている形状は正多角形ですが、どの多角形でも機能したいのですが。 /programming/3058150/how-to-find-a-random-point-in-a-quadrangle

1
特定のプロパティを使用したグラフ生成のアルゴリズム
いくつかの一般的なプロパティ(たとえば、クラスタリング係数、平均最短経路長、次数分布など)を満たすグラフを生成するために提案された多数のアルゴリズムが存在する場合があります。 私の質問は特定のケースに関するものです。異なるクラスタリング係数と平均最短パス長を使用して、いくつかの無向の通常のグラフ(つまり、これらのグラフのすべてのノードが同じ数の隣接ノードを持っている)を生成したいと思います。より一般的には、次数の分布を修正することで、異なるクラスタリング係数と平均最短経路長を持つグラフを生成したいと思います。 これを行うためのよく知られたアルゴリズムは何ですか(または実際に何かありますか?)、同じ目的で推奨されるソフトウェアは何ですか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.