タグ付けされた質問 「uniform」

一様分布は、サンプル空間で任意の値をとる可能性が高い確率変数を表します。

4
Rの離散時間イベント履歴(生存)モデル
Rに離散時間モデルを適合させようとしていますが、その方法がわかりません。 従属変数を時間監視ごとに1つずつ異なる行に編成し、glm関数をlogitまたはcloglogリンクで使用できることを読みました。この意味で、私は3つの列があります:ID、Event(各time-obsで1または0)およびTime Elapsed(観測の開始以降)、および他の共変量。 モデルに合うようにコードを書くにはどうすればよいですか?従属変数はどれですか?Event従属変数として使用できTime Elapsed、共変量に含めることができると思います。しかし、どうなりIDますか?必要ですか? ありがとう。
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

5
連続一様分布の確率の合計が無限ではないのはなぜですか?
一様分布(連続)の確率密度関数を上に示します。曲線の下の領域は1です。これは、確率分布のすべての確率の合計が1であるため意味があります。 正式には、上記の確率関数(f(x))は次のように定義できます。 1 /(ba)in x in [a、b] それ以外の場合は0 a(たとえば2)とb(たとえば6)の間の実数を選択する必要があることを考慮してください。これにより、均一確率= 0.25になります。ただし、その間隔には無数の数があるため、すべての確率の合計を無限大にしてはいけませんか?私は何を見落としているのですか? f(x)は、数xが発生する確率ではありませんか?

2
独立した二乗均一確率変数の合計の平方根の期待
ましょX1,…,Xn∼U(0,1)X1,…,Xn∼U(0,1)X_1,\dots,X_n \sim U(0,1)独立したidenticallly標準一様確率変数を分散させること。 Let Yn=∑inX2iI seek: E[Yn−−√]Let Yn=∑inXi2I seek: E[Yn]\text{Let }\quad Y_n=\sum_i^nX_i^2 \quad \quad \text{I seek: } \quad \mathbb{E}\big[\sqrt{Y_n } \big] YnYnY_nの予想は簡単です。 E[X2]E[Yn]=∫10y2y√=13=E[∑inX2i]=∑inE[X2i]=n3E[X2]=∫01y2y=13E[Yn]=E[∑inXi2]=∑inE[Xi2]=n3\begin{align} \mathbb{E}\left[X^2\right] &=\int_0^1\frac{y}{2\sqrt{y}}=\frac{1}{3}\\ \mathbb{E}\left[Y_n\right] &=\mathbb{E}\left[\sum_i^nX_i^2\right] = \sum_i^n\mathbb{E}\left[X_i^2\right]=\frac{n}{3} \end{align} 退屈な部分です。LOTUSを適用するには、YnYnY_n pdfが必要です。もちろん、2つの独立確率変数の和の確率密度関数は、それらの確率密度関数のたたみ込みです。しかし、ここにはnnn確率変数があり、たたみ込みは...複雑な式(恐ろしいしゃれが意図されたもの)につながると思います。もっと賢い方法はありますか? 私は正しい解決策を見たいと思いますが、それが不可能であるか複雑すぎる場合は、大きなnnn漸近近似は許容できる可能性があります。ジェンセンの不平等によって、私はそれを知っています E[Yn]−−−−−√=n3−−√≥E[Yn−−√]E[Yn]=n3≥E[Yn]\sqrt{\mathbb{E}[Y_n]}=\sqrt{\frac{n}{3}}\geq\mathbb{E}\left[\sqrt{Y_n}\right] しかし、自明ではない下限も見つけられない限り、これはあまり役に立ちません。独立したRVの合計だけでなく、独立したRVの合計の平方根があるため、CLTはここでは直接適用されないことに注意してください。たぶん、ここで役立つかもしれない他の限界定理(私は無視します)があるかもしれません。

1
数学理論の「傾斜均一分布」から乱数を生成する
ある目的のために、「傾斜均一」分布から乱数(データ)を生成する必要があります。この分布の「勾配」は、ある程度の間隔で変化する可能性があり、その場合、私の分布は勾配に基づいて均一から三角形に変化するはずです。これが私の派生です: それを簡単にして、からまでのデータを生成しましょう(青、赤は均一な分布です)。青い線の確率密度関数を取得するには、その線の方程式が必要です。したがって:000BBB f(x)=tg(φ)x+Y(0)f(x)=tg(φ)x+Y(0)f(x) = tg(\varphi)x + Y(0) 以降(写真): tg(φ)Y(0)=1/B−Y(0)B/2=1B−tg(φ)B2tg(φ)=1/B−Y(0)B/2Y(0)=1B−tg(φ)B2\begin{align} tg(\varphi) &= \frac{1/B - Y(0)}{B/2} \\[5pt] Y(0) &= \frac{1}{B} - tg(\varphi)\frac{B}{2} \end{align} 私たちはそれを持っています: f(x)=tg(φ)x+(1B−tg(φ)B2)f(x)=tg(φ)x+(1B−tg(φ)B2)f(x) = tg(\varphi)x + \left(\frac{1}{B} - tg(\varphi)\frac{B}{2} \right) 以来、 PDFであり、CDFに等しいです。f(x)f(x)f(x) F(x)=tg(φ)x22+x(1B−tg(φ)B2)F(x)=tg(φ)x22+x(1B−tg(φ)B2)F(x) = \frac{tg(\varphi)x^2}{2} + x\left(\frac{1}{B} - tg(\varphi)\frac{B}{2} \right) 次に、データジェネレータを作成します。アイデアは私が修正しますならばということ、である、乱数 Iから番号を取得します場合に計算することができます説明するように一様分布からここに。私は固定と私の分布から100個の乱数が必要な場合はこのように、、その後、いずれかの一様分布からがあり「傾斜配分」からは、およびのように計算することができます。φ,Bφ,B\varphi, Bxxx(0,1)(0,1)(0,1)φ,Bφ,B\varphi, Btitit_i(0,1)(0,1)(0,1)xixix_ixxx tg(φ)x2i2+xi(1B−tg(φ)B2)−ti=0tg(φ)xi22+xi(1B−tg(φ)B2)−ti=0\frac{tg(\varphi)x_i^2}{2} + x_i\left(\frac{1}{B} - tg(\varphi)\frac{B}{2} \right) …

1
を見つけるためのより簡単な方法
一様分布から引き出さ3つのIIDサンプル検討 、θはパラメータです。E [ X (2 )を見つけたい | X (1 )、X (3 ) ] ここで、X (i )は順序統計量iです。u(θ,2θ)u(θ,2θ)u(\theta, 2\theta)θθ\thetaE[X(2)|X(1),X(3)]E[X(2)|X(1),X(3)] \mathbb{E}\left[X_{(2)}| X_{(1)}, X_{(3)}\right] X(i)X(i)X_{(i)}iii 結果は しかし、この結果を示すことができる唯一の方法は長すぎるようです。簡単な解決策を思い付くことができません。何か不足していますか、ショートカットはありますか?E[X(2)|X(1),X(3)]=X(1)+X(3)2E[X(2)|X(1),X(3)]=X(1)+X(3)2 \mathbb{E}\left[X_{(2)}| X_{(1)}, X_{(3)}\right] = \frac{X_{(1)}+ X_{(3)}}{2} 私がすることは次のとおりです: 条件付き密度を見つける f(x(2)|x(1),x(3))=f(x(1),x(2),x(3))f(x(1),x(3))f(x(2)|x(1),x(3))=f(x(1),x(2),x(3))f(x(1),x(3)) f(x_{(2)}| x_{(1)}, x_{(3)}) = \frac{ f(x_{(1)}, x_{(2)}, x_{(3)})}{f(x_{(1)}, x_{(3)})} 私は統合します E[X(2)|X(1),X(3)]=∫xf(x|x(1),x(3))dxE[X(2)|X(1),X(3)]=∫xf(x|x(1),x(3))dx \mathbb{E}\left[X_{(2)}| X_{(1)}, X_{(3)}\right] = \int x f(x| …

2
2つの均一に分散されたポイント間の予想距離を見つける方法は?
Iは、座標を定義した場合および(X 2、Y 2)(X1,Y1)(X1,Y1)(X_{1},Y_{1})(X2,Y2)(X2,Y2)(X_{2},Y_{2}) X1,X2∼Unif(0,30) and Y1,Y2∼Unif(0,40).X1,X2∼Unif(0,30) and Y1,Y2∼Unif(0,40).X_{1},X_{2} \sim \text{Unif}(0,30)\text{ and }Y_{1},Y_{2} \sim \text{Unif}(0,40). それらの間の距離の期待値をどのように見つけますか? 距離は、によって算出されるので、私は、考えていたと期待される値ちょうど?(1/30+1/30)2+(1/40+1/40)2(X1−X2)2+(Y1−Y2)2−−−−−−−−−−−−−−−−−−−√)(X1−X2)2+(Y1−Y2)2)\sqrt{(X_{1}-X_{2})^{2} + (Y_{1}-Y_{2})^{2}})(1/30+1/30)2+(1/40+1/40)2(1/30+1/30)2+(1/40+1/40)2(1/30 + 1/30)^2 + (1/40+1/40)^2

1
iid(均一または正規)データの固有値の推定分布
各次元がiid(または、各次元)であり、独立しているように、次元(たとえば、)のデータセットがあると仮定しお互い。dddd=20d=20d=20Xi∼U[0;1]Xi∼U[0;1]X_i \sim U[0;1]Xi∼N[0;1]Xi∼N[0;1]X_i \sim \mathcal N[0;1] 次に、このデータセットからランダムオブジェクトを描画し、最近傍点を取り、このセットでPCAを計算します。予想されるのとは対照的に、固有値はすべて同じではありません。20次元のユニフォームでは、一般的な結果は次のようになります。k=3⋅dk=3⋅dk=3\cdot d 0.11952316626613427, 0.1151758808663646, 0.11170020254046743, 0.1019390988585198, 0.0924502502204256, 0.08716272453538032, 0.0782945015348525, 0.06965903935713605, 0.06346159593226684, 0.054527131148532824, 0.05346303562884964, 0.04348400728546128, 0.042304834600062985, 0.03229641081461124, 0.031532033468325706, 0.0266801529298156, 0.020332085835946957, 0.01825531821510237, 0.01483790669963606, 0.0068195084468626625 正規分散データの場合、結果を少なくとも合計に再スケーリングすると、結果は非常に似ているように見えます(分布は、そもそも明らかに分散が大きくなります)。111N[0;1]dN[0;1]d\mathcal N[0;1]^d この動作を予測する結果はあるのでしょうか?一連の固有値がいくらか規則的であるかどうか、および期待どおりの固有値がいくつあるか、および期待値と大幅に異なるものがあるかどうかのテストを探しています。 与えられた(小さい)サンプルサイズ、2つの変数の相関係数が有意である場合、結果はありますか?iid変数でさえ、が低い場合に0以外の結果になることがあります。kkkkkk

1
どのように計算する
私は論文の問題を解決しようとしていますが、どうすればよいかわかりません。一様な分布からランダムに取得した4つの観測があります。ある確率を計算したい。 はi番目の次数統計です(観測値が最小から最大にランク付けされるように次数統計を取ります)。より簡単なケースで解決しましたが、ここではその方法に迷っています。(0,1)(0,1)(0,1)3X(1)≥X(2)+X(3)3X(1)≥X(2)+X(3)3 X_{(1)}\ge X_{(2)}+X_{(3)}X(i)X(i)X_{(i)} すべての助けを歓迎します。


1
Irwin-Hall分布をより一般的にすることはできますか?
均一な、尖った、正規のガウス分布を含む、対称性の低い尖度分布クラスを見つける必要があります。Irwin-Hall分布(標準のユニフォームの合計)はこの特性を提供しますが、非整数次数扱いません。ただし、たとえば2つの標準的なユニフォームと1つの3rdをような小さい範囲で単純に独立して合計すると、実際には任意の任意の次数(この場合はように)。しかし、CDFの実用的な閉じた式を見つけることは可能ですか?[ 0 、1 ] [ 0 、0.25 ] N = 2.25NNN[0,1][0,1][0,1][0,0.25][0,0.25][0,0.25]N=2.25N=2.25N=2.25

1
コイン投げから離散ユニフォームを生成する
あなたが好きなだけ何度でもフリップできる公正なコインを持っているとしましょう(おそらく無限に無限です)。で離散均一分布を生成することは可能ですか?ここで、は2の累乗ではありませんか?どうしますか?、K(1,2,...,k)(1,2,...,k)(1,2,...,k)kkk これが一般的すぎる場合、と答えるのはおそらく十分興味深いでしょう。k=3k=3k=3

1
一様確率変数の独立性と相関の関係
私の質問はかなり単純です:とを上の2つの無相関の一様確率変数としましょう。彼らは独立していますか?バツバツXYYY[ - 1 、1 ][−1、1][-1,1] 2つのランダムな無相関変数は、それらの共同分布が正規である場合にのみ、必ずしも独立しているという印象を受けました。しかし、私が求めている主張を否定するための反例を思いつくことはできません。反例または証拠を提供してください。

2
順序統計を与えられた一様確率変数の条件付き期待
仮定X = (X1、。。。、Xん)(X1,...,Xn)(X_1, ..., X_n)〜U(θ 、2 θ )U(θ,2θ)U(\theta, 2\theta)、θ ∈ R+θ∈R+\theta \in \Bbb{R}^+。 どのようにしてE[ X1| バツ(1 )、X(n )]E[X1|X(1),X(n)]E[X_1|X_{(1)},X_{(n)}]、ここでバツ(1 )X(1)X_{(1)}とバツ(n )X(n)X_{(n)}は、それぞれ最小と最大の次数統計ですか? 私の最初の考えは、注文統計が範囲を制限するため、それは単に(X(1 )+ X(n ))/ 2(X(1)+X(n))/2(X_{(1)}+X_{(n)})/2であると考えられますが、これが正しいかどうかはわかりません!

1
密度が変化するポイントから予想される最小距離
原点の周りのランダムな点の密度(単位平方あたりの点)の密度を増加させると、ランダムに均一な点と原点の間の予想される最小ユークリッド距離がどのように変化するかを調べています。そのように説明された2つの間の関係を思いつくことができました。 Expected Min Distance=12Density−−−−−−√Expected Min Distance=12Density\text{Expected Min Distance} =\frac{1}{2\sqrt{\text{Density}}} 私は、Rでいくつかのモンテカルロシミュレーションを実行し、手動で曲線をフィッティングすることでこれを思いつきました(以下のコード)。 私の質問は次のとおりです。実験ではなく理論的にこの結果を導き出すことができましたか? #Stack Overflow example library(magrittr) library(ggplot2) #--------- #FUNCTIONS #--------- #gen random points within a given radius and given density gen_circle_points <- function(radius, density) { #round radius up then generate points in square with side length = 2*radius c_radius <- ceiling(radius) …

2
制約の影響を受ける複数の離散変数からランダムに均一にサンプルを生成する方法は?
壷をI色のN個のボールC [i]で満たすモンテカルロプロセスを生成したいと思います。各色C [i]には、骨壷に配置する必要のあるボールの最小数と最大数があります。 たとえば、私はつぼに100個のボールを入れようとしていて、4つの色で満たすことができます。 赤-最小0、最大100#NB、実際の最大は実現できません。 青-最小50、最大100 黄色-最小0、最大50 緑-最小25、最大75 可能な結果全体に均一に分散されることが保証されているNサンプルをどのように生成できますか? ボールに最小値も最大値もない、または同じ暗黙の最小値と最大値があるというこの問題の解決策を見てきました。たとえば、少し異なる主題に関するこの議論を参照してください。 合計が1になる均一に分散された重みを生成しますか? しかし、私はこの解決策を一般化することに問題を抱えています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.