タグ付けされた質問 「random-generation」

一連の数字または記号をランダムに、または(ほとんどの場合)疑似ランダムに生成する行為。つまり、予測可能性やパターンがない。

4
Rの離散時間イベント履歴(生存)モデル
Rに離散時間モデルを適合させようとしていますが、その方法がわかりません。 従属変数を時間監視ごとに1つずつ異なる行に編成し、glm関数をlogitまたはcloglogリンクで使用できることを読みました。この意味で、私は3つの列があります:ID、Event(各time-obsで1または0)およびTime Elapsed(観測の開始以降)、および他の共変量。 モデルに合うようにコードを書くにはどうすればよいですか?従属変数はどれですか?Event従属変数として使用できTime Elapsed、共変量に含めることができると思います。しかし、どうなりIDますか?必要ですか? ありがとう。
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

2
制約を満たす確率変数を生成する
私は、確率変数のリストを生成する必要がの形で表現することができる制約を受けるをある場合行列はエントリがあります。私が扱っているすべてのケースで、です。たとえば、は約14,000で、は50になります。ランダムサンプリングにどの方法を使用するか、よく分からないのでわかりません。私が解決しようとしている問題に最適なのは明らかですが、同じ平均と範囲/分散を持つ分布からすべての変数をサンプリングする必要があります。バツx\bf{x}E x=bEx=b\bf{E}x=bEE\bf{E}m × nm×nm \times n バツx\bf{x}んnnN > > Mn>>mn >> mんnnメートルmm これを解決するために私が行っているのは、を行エシェロン形式に減らし、最後のピボットの右側の列に対応するすべての変数をランダムな値に設定してから、残りの正方行列の等式を解決します。EE\bf{E} 問題がありますが、正方行列の等式を解くために、右側から既に設定されている値を差し引きます。残念ながら、分散も追加されるため、最後の50の値は大きく変動する傾向がありますが、この問題では残念ながら許容できません。 これを行うより良い方法はありますか?現在使用している方法を修正する方法を思いつきません。私はRを使用します。

1
とサンプリングコスト
次のシミュレーション問題に遭遇しました:既知の実数のセットが与えられた場合、分布は ここで、は正の部分を示します。この分布をターゲットとするMetropolis-Hastingsサンプラーを考えることもできますが、アルゴリズムの次数をから。{ω1,…,ωd}{ω1,…,ωd}\{\omega_1,\ldots,\omega_d\}{−1,1}d{−1,1}d\{-1,1\}^dP(X=(x1,…,xd))∝(x1ω1+…+xdωd)+P(X=(x1,…,xd))∝(x1ω1+…+xdωd)+\mathbb{P}(X=(x_1,\ldots,x_d))\propto (x_1\omega_1+\ldots+x_d\omega_d)_+(z)+(z)+(z)_+zzzO(2d)O(2d)O(2^d)O(d)O(d)O(d)

1
数学理論の「傾斜均一分布」から乱数を生成する
ある目的のために、「傾斜均一」分布から乱数(データ)を生成する必要があります。この分布の「勾配」は、ある程度の間隔で変化する可能性があり、その場合、私の分布は勾配に基づいて均一から三角形に変化するはずです。これが私の派生です: それを簡単にして、からまでのデータを生成しましょう(青、赤は均一な分布です)。青い線の確率密度関数を取得するには、その線の方程式が必要です。したがって:000BBB f(x)=tg(φ)x+Y(0)f(x)=tg(φ)x+Y(0)f(x) = tg(\varphi)x + Y(0) 以降(写真): tg(φ)Y(0)=1/B−Y(0)B/2=1B−tg(φ)B2tg(φ)=1/B−Y(0)B/2Y(0)=1B−tg(φ)B2\begin{align} tg(\varphi) &= \frac{1/B - Y(0)}{B/2} \\[5pt] Y(0) &= \frac{1}{B} - tg(\varphi)\frac{B}{2} \end{align} 私たちはそれを持っています: f(x)=tg(φ)x+(1B−tg(φ)B2)f(x)=tg(φ)x+(1B−tg(φ)B2)f(x) = tg(\varphi)x + \left(\frac{1}{B} - tg(\varphi)\frac{B}{2} \right) 以来、 PDFであり、CDFに等しいです。f(x)f(x)f(x) F(x)=tg(φ)x22+x(1B−tg(φ)B2)F(x)=tg(φ)x22+x(1B−tg(φ)B2)F(x) = \frac{tg(\varphi)x^2}{2} + x\left(\frac{1}{B} - tg(\varphi)\frac{B}{2} \right) 次に、データジェネレータを作成します。アイデアは私が修正しますならばということ、である、乱数 Iから番号を取得します場合に計算することができます説明するように一様分布からここに。私は固定と私の分布から100個の乱数が必要な場合はこのように、、その後、いずれかの一様分布からがあり「傾斜配分」からは、およびのように計算することができます。φ,Bφ,B\varphi, Bxxx(0,1)(0,1)(0,1)φ,Bφ,B\varphi, Btitit_i(0,1)(0,1)(0,1)xixix_ixxx tg(φ)x2i2+xi(1B−tg(φ)B2)−ti=0tg(φ)xi22+xi(1B−tg(φ)B2)−ti=0\frac{tg(\varphi)x_i^2}{2} + x_i\left(\frac{1}{B} - tg(\varphi)\frac{B}{2} \right) …

2
「ラプラスノイズ」とはどういう意味ですか?
私は現在、Laplaceメカニズムを使用した差分プライバシーのアルゴリズムを書いています。 残念ながら、私は統計の背景がないので、多くの用語は私には知られていない。だから今、私はラプラスノイズという言葉につまずきました。データセットの差分を非公開にするには、すべての論文で、ラプラス分布に従ってラプラスノイズを関数値に追加する方法について説明します。 k(X)=f(X)+Y(X)k(X)=f(X)+Y(X)k(X) = f(X) + Y(X) (kは微分プライベート値、fは評価関数による戻り値、Yはラプラスノイズ) これは、ウィキペディアhttps://en.wikipedia.org/wiki/Laplace_distributionから持っているこの関数に従って、ラプラス分布からランダム変数を作成することを意味しますか? Y=μ−b sgn(U)ln(1−2|U|)Y=μ−b sgn(U)ln⁡⁡(1−2|U|) Y = μ − b\ \text{sgn}(U) \ln ⁡ ( 1 − 2 | U | ) 更新:上記の関数から最大100個のランダム変数をプロットしましたが、これではラプラス分布が得られません(近いものではありません)。しかし、私はそれがラプラス分布をモデル化すべきだと思います。 UPDATE2: それらは私が持っている定義です: (ラプラスのメカニズム)。関数与えられると、ラプラスメカニズムは次のように定義されます:ここで、YはLap(∆f / \ epsilon)から抽出されたiid確率変数ですf:N|X|→Rkf:N|X|→Rkf:N^{|X|}→R^kML(x,f(⋅),ϵ)=f(x)+(Y1,...,Yk)ML(x,f(·),ϵ)=f(x)+(Y1,...,Yk)M_L(x, f(·),\epsilon)=f(x)+(Y_1,...,Y_k)Lap(Δf/ϵ)Lap(∆f/ϵ)Lap(∆f/\epsilon) と同様: Y(X)を生成するための一般的な選択は、平均がゼロでΔ(f)/εスケールパラメーターを持つラプラス分布を使用することです。

2
切り捨てられた多項分布をサンプリングする方法は?
切り捨てられた多項分布をサンプリングするアルゴリズムが必要です。あれは、 x⃗ ∼1Zpx11…pxkkx1!…xk!x→∼1Zp1x1…pkxkx1!…xk!\vec x \sim \frac{1}{Z} \frac{p_1^{x_1} \dots p_k^{x_k}}{x_1!\dots x_k!} ここで、は正規化定数、→ xはk個の正の成分を持ち、∑ x i = nです。私は唯一の値を検討→ Xの範囲内→ ≤ → X ≤ → Bを。ZZZx⃗ x→\vec xkkk∑xi=n∑xi=n\sum x_i = nx⃗ x→\vec{x}a⃗ ≤x⃗ ≤b⃗ a→≤x→≤b→\vec a \le \vec x \le \vec b この切り捨てられた多項分布をどのようにサンプリングできますか? 注:切り捨てられていない多項分布をサンプリングするアルゴリズムについては、Wikipediaを参照してください。このアルゴリズムを切り捨てられた分布に適応させる方法はありますか? 均一バージョン:問題のより単純なバージョンは、すべての等しくする、p i = 1 / kです。この場合、少なくとも切り捨てられた分布をサンプリングするアルゴリズムを設計できる場合は、それを投稿してください。一般的な答えではありませんが、それは現時点で他の実際的な問題を解決するのに役立ちます。pipip_ipi=1/kpi=1/kp_i = 1/k

1
非効率な乱数ジェネレーターの実例
コンピュータの乱数ジェネレータは真の乱数を生成せず、代わりに疑似乱数を生成することは誰もが知っています。また、一部のRNGは他のRNGよりも優れており、一部は他より優れて実装されています。 貧弱なRNGが使用された、またはRNGの実装が不十分で、悪用された例は何ですか? 私が見つけた例は ケノで不正行為をしているロン・ハリス - マイケルラーセンが「運を押して」勝つ 予測可能なRNGを使用した初期のオンラインポーカーゲームwww.cigital.com/papers/download/developer_gambling.php

1
正の行列式の一様にランダムな直交行列を生成する方法は?
たぶん私は自白しなければならない、私は混乱しているという愚かな質問を持っています。いくつかのサイズpの均一に分布したランダム直交(正規直交)行列を繰り返し生成することを想像してください。生成された行列には行列式1が含まれる場合と、行列式− 1が含まれる場合があります。(可能な値は2つだけです。直交回転の観点から、det = − 1は、回転の他に1つの追加の反射もあることを意味します。)ppp111−1−1-1det=−1det=−1\det=-1 直交行列のの符号をマイナスからプラスに変更するには、そのいずれか(またはより一般的には奇数)の列の符号を変更します。detdet\det 私の質問は、そのようなランダム行列を繰り返し生成することを考えると、特定の列のみ(たとえば、常に最初または常に最後)の符号を元に戻すことを選択するたびに、一様なランダムな性質にバイアスを導入しますか?または、行列がランダムに均一に分散したコレクションを表すようにするには、列をランダムに選択する必要がありますか?

1
モンテカルロ==ランダムなプロセスを適用しますか?
私は正式な統計学のコースを受講したことはありませんが、私の研究分野のため、いくつかの統計的概念を適用する記事に常に出くわしています。 多くの場合、特定の状況に適用されるモンテカルロプロセスの説明が表示されます。10回のうち9回収集できるのは、単純なランダムな母集団の生成とその後の研究です。 私の質問:統計の世界では、モンテカルロは、ポイント/母集団などのランダムな生成を含むアルゴリズムの一種のコードワードですか、それとも何か他にありますか?

2
メディエーションモデルに適合するようにデータをシミュレーションする
特定のメディエーションモデルと一致するデータをシミュレートする手順を見つけることに興味があります。Barron and Kenny(1986)によって最初に概説され、Judd、Yzerbyt、&Muller(2013)などの他の場所で説明されたメディエーションモデルをテストするための一般的な線形構造方程式モデルフレームワークによると、結果メディエーションモデル、メディエーター、および予測子あり、次の3つの回帰方程式によって管理されます: YYYmedmed\newcommand{\med}{\rm med} \medXXXYmedY=b11+b12X+e1=b21+b22X+e2=b31+b32X+b32med+e3(1)(2)(3)(1)Y=b11+b12X+e1(2)med=b21+b22X+e2(3)Y=b31+b32X+b32med+e3\begin{align} Y &= b_{11} + b_{12}X + e_1 \tag{1} \\ \med &= b_{21} + b_{22}X + e_2 \tag{2} \\ Y &= b_{31} + b_{32}X + b_{32} \med + e_3 \tag{3} \end{align}を介した に対するの間接効果または仲介効果は、として、または同等にとして定義できます。メディエーションのテストの古いフレームワークでは、メディエーションは、式1の、式2の、および式3のをテストすることで確立されました。XXXYYYmedmed\medb22b32b22b32b_{22}b_{32}b12−b32b12−b32b_{12}-b_{32}b12b12b_{12}b22b22b_{22}b32b32b_{32} これまで、以下のコードのように、in を使用してさまざまな回帰係数の値と一致するおよび値をシミュレートすることを試みました:medmed\medYYYrnormR x <- rep(c(-.5, .5), 50) med <- 4 + .7 * …

1
打ち切られた混合正規分布からシミュレーション
次のような混合正規分布からサンプルをシミュレートしたい p × N(μ1、σ21)+ (1 − p )× N(μ2、σ22)p×N(μ1,σ12)+(1−p)×N(μ2,σ22)p\times\mathcal{N}(\mu_1,\sigma_1^2) + (1-p)\times\mathcal{N}(\mu_2,\sigma_2^2) 間隔に制限されているの代わりに、R。これは、正規分布の切り捨てられた混合をシミュレートしたいということです。[ 0 、1 ][0,1][0,1]RR\mathbb{R} これを行うために、切り捨てられた法線をシミュレートするアルゴリズム(つまり、この質問から)と対応するパッケージがRにあることを知っています。しかし、切り捨てられた混合法線をどうやってシミュレートできますか?それは私が2が通常の切り捨てシミュレート場合と同じであるとN(μ 2、σ 2 2切り捨てられた混合物を通常にしますか)?N(μ1、σ21)N(μ1,σ12)\mathcal{N}(\mu_1,\sigma_1^2)N(μ2、σ22N(μ2,σ22\mathcal{N}(\mu_2,\sigma_2^2

1
コイン投げから離散ユニフォームを生成する
あなたが好きなだけ何度でもフリップできる公正なコインを持っているとしましょう(おそらく無限に無限です)。で離散均一分布を生成することは可能ですか?ここで、は2の累乗ではありませんか?どうしますか?、K(1,2,...,k)(1,2,...,k)(1,2,...,k)kkk これが一般的すぎる場合、と答えるのはおそらく十分興味深いでしょう。k=3k=3k=3

4
低差異シーケンスを正規分布に変換するための最良の方法?
私はそれらのプロパティが有用であることを発見したので、しばらくの間、不一致の少ないシーケンスを均一分布に使用してきました(主にコンピュータグラフィックスでランダムな外観とインクリメンタルな方法で[0,1]を密にカバーする能力)。 たとえば、上記のランダム値、以下のHaltonシーケンス値: いくつかの財務分析計画にそれらを使用することを検討していましたが、均一な分布とは異なる分布が必要です。Marsaglia極アルゴリズムを介して均一分布から正規分布を生成することから始めましたが、結果は均一分布の場合ほど良くありません。 別の例、上でランダム、下のハルトン: 私の質問は次のとおりです。カバレッジ、インクリメンタルフィルイン、複数の次元にわたる非相関など、均一な低い不一致シーケンスから取得するプロパティを使用して正規分布を取得するための最良の方法は何ですか?私は正しい軌道に乗っていますか、それともまったく異なるアプローチをとるべきですか? (上記で使用している均一および正規分布のPythonコード:Gist 2566569)

3
一連の独立した乱数の差分のL番目の階数をとるときの高い自己相関
この質問をより詳細に説明するために、まず私のアプローチを詳しく説明します。 一連の独立した乱数をシミュレートしました。X={x1,...,xN}X={x1,...,xN}X = \{x_1,...,x_N\} 次に、倍の差を取ります。つまり、変数を作成します。LLL dX1={X(2)−X(1),...,X(N)−X(N−1)}dX1={X(2)−X(1),...,X(N)−X(N−1)}dX_{1} = \{X(2)-X(1),...,X(N)-X(N-1)\} dX2={dX1(2)−dX1(1),...,dX1(N−1)−dX1(N−1−1)}dX2={dX1(2)−dX1(1),...,dX1(N−1)−dX1(N−1−1)}dX_{2} = \{dX_{1}(2)-dX_{1}(1),...,dX_{1}(N-1)-dX_{1}(N-1-1)\} ......... dバツL= { dバツL − 1(2 )− dバツL − 1(1 )、。。。、dバツL − 1(N− L )− dバツL − 1(N− L − 1 )}dXL={dXL−1(2)−dXL−1(1),...,dXL−1(N−L)−dXL−1(N−L−1)}dX_{L} = \{dX_{L-1}(2)-dX_{L-1}(1),...,dX_{L-1}(N-L)-dX_{L-1}(N-L-1)\} が大きくなると、の(絶対)自己相関が増加することがます。ACは場合でも0.99に近づきます。つまり、L次の差をとるとき、最初は独立したシーケンスから、一連の非常に依存する数(シーケンス)を作成します。dバツLdXLdX_{L}LLLL > 100L>100L >100 これが私の観察を説明するグラフです。 私の質問: このアプローチの背後にある理論、およびその含意またはそのアプリケーションへの応用はありますか? これは、このアプローチが(コンピューターの)疑似乱数ジェネレーターの弱点を悪用していることを示していますか?つまり、生成された「ランダム」シーケンスは完全にランダムではなく、これは私のアプローチから示されている/証明されていますか? シーケンスの次の数(つまり)を予測するために、L次の差異の高い自己相関を利用できますか?つまり、次の数を予測できる場合(たとえば、線形回帰によって)、累積合計の倍をとることによって、推定シーケンスを推定できます。これは実行可能なアプローチですか?バツ(N+ 1 )X(N+1)X(N+1)dバツLdXLdX_{L}バツ(私)X(i)X(i)LLL 客観的 注意は、私が予測しようとしていることをが、番号がindependentalyとランダムに生成されているので、これは(の低交流は非常に困難である)。バツ(N+ 1 )X(N+1)X(N+1)NNN

1
sqrt(6)を使用してニューラルネットワークのランダムな初期化のイプシロンを計算するのはなぜですか?
で週5講義ノートのためのアンドリュー・ウのコーセラ機械学習クラス、以下の式が値算出に与えられた初期化するために使用さΘをランダムな値で:εε\epsilonΘΘ\Theta では、運動、さらに明確化が与えられます。 を選択するための1つの効果的な戦略 は、ネットワーク内のユニット数に基づいて決定することです。ϵ i n i tの適切な選択 はϵ i n i t = √εI N I Tε私ん私t\epsilon_{init}εI N I Tε私ん私t\epsilon_{init}、ここでLin=slおよびLout=sl+1は、Θ(l)に隣接する層のユニット数です。εI N I T= 6√LI N− LO U T√ε私ん私t=6L私ん−Loあなたt\epsilon_{init} = \frac{\sqrt{6}}{\sqrt{L_{in} - L_{out}}}LI N= slL私ん=slL_{in} = s_lLO U T=sl + 1Loあなたt=sl+1L_{out} = s_{l+1}Θ( l )Θ(l)\Theta^{(l)} なぜ定数ですかここで 6個使用?なんで √6–√6\sqrt 6、 √5–√5\sqrt …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.