タグ付けされた質問 「uniform」

一様分布は、サンプル空間で任意の値をとる可能性が高い確率変数を表します。


1
超楕円体の表面から均一にサンプリングする方法(一定のマハラノビス距離)
実数値の多変量の場合、平均からのマハラノビス距離が定数である表面からポイントを均一にサンプリングする方法はありますか? 編集:これは、方程式を満たすハイパー楕円体の表面から均一にサンプリングポイントに要約されます。 (X - μ )TΣ− 1(X - μ )= D2。(バツ−μ)TΣ−1(バツ−μ)=d2。(x-\mu)^T \Sigma^{-1}(x-\mu) = d^2. より正確には、「均一に」とは、超曲面の各面積要素dAdAdAが同じ確率質量を含むようなサンプルを意味します。

1
共同完全な十分な統計:Uniform(a、b)
ましょう上の一様分布からのランダムサンプルである、。ましょうと最大と最小の順序統計こと。統計量がパラメーターに対して十分な統計量であることを示します。 X=(x1,x2,…xn)X=(x1,x2,…xn)\mathbf{X}= (x_1, x_2, \dots x_n)(a,b)(a,b)(a,b)a&lt;ba&lt;ba < bY1Y1Y_1YnYnY_n(Y1,Yn)(Y1,Yn)(Y_1, Y_n)θ=(a,b)θ=(a,b)\theta = (a, b) 因数分解を使用して十分であることを示すのは問題ありません。 質問:完全性を表示するにはどうすればよいですか?できればヒントをお願いします。 試み:私は見ることができます暗示一つのパラメータの均一な分布のために、私は2つのパラメータ均一な分布に立ち往生しています。E[g(T(x))]=0E[g(T(x))]=0\mathbb E[g(T(x))] = 0g(T(x))=0g(T(x))=0g(T(x)) = 0 をいじってみて、と共同分布を使用しましたが、計算がつまずくので、正しい方向に進んでいるかどうかはわかりません。E[g(Y1,Yn)]E[g(Y1,Yn)]\mathbb E[g(Y_1, Y_n)]Y1Y1Y_1YnYnY_n

3
連続変数の条件付き確率
その確率変数を仮定うんうんUパラメータ0と10と連続し均一な分布に従う(すなわち、うん〜U(0 、10 )うん〜うん(0、10)U \sim \rm{U}(0,10)) ここで、AをうんうんU = 5のイベント、BをうんうんUが555または6のいずれかであるイベントとすることにします。私の理解によると、両方のイベントの発生確率はゼロです。 我々は計算に考慮すれば、今、P(A | B )P(A|B)P(A|B)、我々は条件付きの法則を使用することはできません P(A | B) = P(A∩B)P(B)P(A|B)=P(A∩B)P(B)P\left( {A|B} \right) = \frac{{P\left( {A \cap B} \right)}}{{P\left( B \right)}}は、P(B)P(B)P(B)がゼロに等しいためです。しかし、私の直感ではと言われますP(A|B)=1/2P(A|B)=1/2P(A|B) = 1/2。

1
対数均一分布とはどういう意味ですか?
128と4000の間の対数均一分布からデータがサンプリングされると誰かが言ったとき、それはどういう意味ですか?均一分布からのサンプリングとどう違うのですか? このペーパーを参照してください:http : //www.jmlr.org/papers/volume13/bergstra12a/bergstra12a.pdf ありがとう!



2
一様分布のユークリッドノルムの裾境界
一様に選択された要素のユークリッドノルムの頻度に関する既知の上限所定のしきい値よりも大きくなりますか?{−n, −(n−1), ..., n−1, n}d{−n, −(n−1), ..., n−1, n}d\:\{-n,~-(n-1),~...,~n-1,~n\}^d\: 私は主に、がよりはるかに小さい場合に指数関数的にゼロに収束する範囲に関心があります。nnnddd

2
ハッシュを一定数のバケットに均一に投影する方法
こんにちは仲間の統計学者、 ハッシュを生成するソース(たとえば、タイムスタンプとその他の情報を含む文字列を計算し、md5を使用してハッシュ化)があり、それを固定数のバケット(たとえば100)に投影したいと考えています。 サンプルハッシュ:0fb916f0b174c66fd35ef078d861a367 最初はハッシュの最初の文字のみを使用してバケットを選択することだと思っていましたが、これは非常に不均一な投影になります(つまり、一部の文字が非常にまれに表示され、他の文字が非常に頻繁に表示される)。 次に、このヘキサ文字列をchar値の合計を使用して整数に変換し、モジュロを使ってバケットを選択しようとしました。 import sys for line in sys.stdin: i = 0 for c in line: i += ord(c) print i%100 それは実際に機能しているようですが、これがなぜ、どの程度本当であるかを説明できる常識や理論上の結果があるかどうかはわかりません。 [編集]少し考えてから、次の結論に達しました。理論的には、ハッシュを数値として解釈することにより、(非常に大きな)整数に変換できます:i = h [0] + 16 * h [1] + 16 * 16 * h [2] ... + 16 ^ 31 * h [31](各文字は16進数を表します)。次に、この大きな数をモジュロしてバケットスペースに投影します。[/編集] よろしくお願いします!
11 uniform 

2
上限が別の連続均一RVである連続均一RVの分布
場合と、そして、私が言うことができるY 〜U (、X )Y 〜U (、B )?X∼U(a,b)X∼U(a,b)X \sim U(a, b)Y〜U(a 、X)Y∼U(a,X)Y \sim U(a, X)Y〜U(a 、b )?Y∼U(a,b)?Y \sim U(a, b)? 制限のある連続的な均一分布について話している。証明(または反証!)をいただければ幸いです。[ a 、b ][a,b][a, b]

4
n個の均一に分布したr.vが与えられた場合、1つのrvのPDFをすべてのn個のr.vの合計で割ったものは何ですか?
私は次のタイプのケースに興味があります。合計が1でなければならない「n」個の連続確率変数があります。そのような個々のそのような変数のPDFは何でしょうか。したがって、場合、の分布に興味があり。ここで、、およびはすべて均一に分布しています。もちろん、この例では、平均は、平均は、Rでの分布をシミュレートするのは簡単ですが、PDFまたはCDFの実際の方程式はわかりません。X 1n=3n=3n=3 X1、X2X31/31/NX1X1+X2+X3X1X1+X2+X3\frac{X_1}{X_1+X_2+X_3}X1,X2X1,X2X_1, X_2X3X3 X_3 1/31/31/31/n1/n1/n この状況は、Irwin-Hallディストリビューション(https://en.wikipedia.org/wiki/Irwin%E2%80%93Hall_distribution)に関連しています。Irwin-Hallだけがn個の一様確率変数の合計の分布ですが、私はn個の一様rvのいずれかの分布をすべてのn変数の合計で除算したいと考えています。ありがとう。
10 uniform 

1
平日の分布の均一性を測定する
私はここで尋ねられた質問と同様の問題を抱えています: 分布の不均一性をどのように測定しますか? 曜日全体にわたる一連の確率分布があります。各分布が(1 / 7,1 / 7、...、1/7)にどれだけ近いかを測定したいと思います。 現時点では、上記の質問の回答を使用しています。L2ノルムは、分布の1日の質量が1の場合に値1を持ち、(1 / 7,1 / 7、...、1/7)に対して最小化されます。私はこれを線形にスケーリングして、0と1の間にあるようにします。それを反転させると、0は完全に不均一になり、1は完全に均一になります。 これはかなりうまく機能しますが、私には1つの問題があります。平日は7次元空間の次元として等しく扱われるため、日数の近さは考慮されません。つまり、(1 / 2,1 / 2,0,0,0,0,0)と(1 / 2,0,0,1 / 2,0,0,0)にも同じスコアを与えますある意味では、後者はより「広がり」、均一であり、理想的にはより高いスコアを取得する必要があります。日付の順序が循環的であるという追加の複雑さが明らかにあります。 日の近さを説明するために、このヒューリスティックをどのように変更できますか?

3
分布
日常的な練習として、私は√の分布を見つけようとしていますX2+Y2−−−−−−−√X2+Y2\sqrt{X^2+Y^2}XXX及びYYY独立しているU(0,1)U(0,1) U(0,1)ランダム変数。 (X,Y)(X,Y)(X,Y)の結合密度は fX,Y(x,y)=10&lt;x,y&lt;1fX,Y(x,y)=10&lt;x,y&lt;1f_{X,Y}(x,y)=\mathbf 1_{0\cos^{-1}\left(\frac{1}{z}\right)、のようにcosθcos⁡θ\cos\thetaに減少しているθ∈[0,π2]θ∈[0,π2]\theta\in\left[0,\frac{\pi}{2}\right]; そしてzsinθ&lt;1⟹θ&lt;sin−1(1z)zsin⁡θ&lt;1⟹θ&lt;sin−1⁡(1z)z\sin\theta<1\implies\theta<\sin^{-1}\left(\frac{1}{z}\right)、のようにsinθsin⁡θ\sin\theta上に増加しているθ∈[0,π2]θ∈[0,π2]\theta\in\left[0,\frac{\pi}{2}\right]。 したがって、1&lt;z&lt;2–√1&lt;z&lt;21< z<\sqrt 2、cos−1(1z)&lt;θ&lt;sin−1(1z)cos−1⁡(1z)&lt;θ&lt;sin−1⁡(1z)\cos^{-1}\left(\frac{1}{z}\right)<\theta<\sin^{-1}\left(\frac{1}{z}\right)。 変換のヤコビアンの絶対値です|J|=z|J|=z|J|=z こうしての関節密度(Z,Θ)(Z,Θ)(Z,\Theta)によって与えられます。 fZ,Θ(z,θ)=z1{z∈(0,1),θ∈(0,π/2)}⋃{z∈(1,2√),θ∈(cos−1(1/z),sin−1(1/z))}fZ,Θ(z,θ)=z1{z∈(0,1),θ∈(0,π/2)}⋃{z∈(1,2),θ∈(cos−1⁡(1/z),sin−1⁡(1/z))}f_{Z,\Theta}(z,\theta)=z\mathbf 1_{\{z\in(0,1),\,\theta\in\left(0,\pi/2\right)\}\bigcup\{z\in(1,\sqrt2),\,\theta\in\left(\cos^{-1}\left(1/z\right),\sin^{-1}\left(1/z\right)\right)\}} θθ\theta積分すると、次のようにZZZのpdfが得られます。 fZ(z)=πz210&lt;z&lt;1+(πz2−2zcos−1(1z))11&lt;z&lt;2√fZ(z)=πz210&lt;z&lt;1+(πz2−2zcos−1⁡(1z))11&lt;z&lt;2f_Z(z)=\frac{\pi z}{2}\mathbf 1_{0\sqrt 2 \end{cases} 正しい表現のように見えます。1 &lt; z &lt; √の場合のFZFZF_Z微分1&lt;z&lt;2–√1&lt;z&lt;21< z<\sqrt 2、すでに取得したpdfに簡単に単純化できない式を表示します。 最後に、私はCDFの正しい写真があると思います。 用0&lt;z&lt;10&lt;z&lt;10<z<1: そして1&lt;z&lt;2–√1&lt;z&lt;21<z<\sqrt 2: 網掛け部分は、領域の面積を示します{(x,y):0&lt;x,y&lt;1,x2+y2≤z2}{(x,y):0&lt;x,y&lt;1,x2+y2≤z2}\left\{(x,y):0<x,y< 1\,,\,x^2+y^2\le z^2\right\} 写真はすぐに得られます FZ(z)=Pr(−z2−X2−−−−−−−√≤Y≤z2−X2−−−−−−−√)=⎧⎩⎨⎪⎪⎪⎪πz24z2−1−−−−−√+∫1z2−1√z2−x2−−−−−−√dx, if 0&lt;z&lt;1, if 1&lt;z&lt;2–√FZ(z)=Pr(−z2−X2≤Y≤z2−X2)={πz24, if 0&lt;z&lt;1z2−1+∫z2−11z2−x2dx, if 1&lt;z&lt;2\begin{align} F_Z(z)&=\Pr\left(-\sqrt{z^2-X^2}\le Y\le\sqrt{z^2-X^2}\right) \\&=\begin{cases}\frac{\pi z^2}{4} &,\text{ if } …

3
一様分布のパラメータの推定:不適切な事前?
我々は、N個のサンプルを有する、一様分布からここで不明です。データからを推定します。XiXiX_i[0,θ][0,θ][0,\theta]θθ\thetaθθ\theta ベイズの法則... f(θ|Xi)=f(Xi|θ)f(θ)f(Xi)f(θ|Xi)=f(Xi|θ)f(θ)f(Xi)f(\theta | {X_i}) = \frac{f({X_i}|\theta)f(\theta)}{f({X_i})} そして可能性は: 0≤XI≤θIf(Xi|θ)=∏Ni=11θf(Xi|θ)=∏i=1N1θf({X_i}|\theta) = \prod_{i=1}^N \frac{1}{\theta} (edit:when for all、0 for -thanks whuber)0≤Xi≤θ0≤Xi≤θ0 \le X_i \le \thetaiii に関する他の情報がないため、事前分布は(つまり均一)または(Jeffreys事前?)に比例しているように見えが、私の積分は収束せず、どうすればよいかわかりません。何か案は?θθ\theta1111L1L\frac{1}{L}[0,∞][0,∞][0,\infty]

1
順列テストを使用する利点は何ですか?
検定統計量によって代替仮説に対するいくつかのヌルをテストする場合U(X)U(X)U(X)、ここで、X={xi,...,xn}X={xi,...,xn}X = \{ x_i, ..., x_n\}、の順列の集合を使用して順列検定を適用すると、新しい統計 X T (X ):= #{ π ∈ G :U (π X )≥ U (X )}GGGXXXT(X):=#{π∈G:U(πX)≥U(X)}|G|.T(X):=#{π∈G:U(πX)≥U(X)}|G|. T(X) := \frac{\# \{\pi \in G: U(\pi X) \geq U(X)\}}{|G|}. 順列検定を使用しない場合と比べて、順列検定を使用する利点は何ですか?つまり、順列テストが機能するときはどのようなものですか? それを実現するための条件は何ですか?検定統計量および/または帰無仮説に関するいくつかの条件など?UUU 例えば、 サンプル場合、 は基づくp値と等しい必要がありますか?はいの場合、なぜですか?(参照も高く評価されています)U (X )XT(X)T(X)T(X)U(X)U(X)U(X)XXX のp値は、。順列検定がU(X)の順列分布を推定する場合| X = x、T(X)はX = xでのU(X)の p値とどのように等しいですか?特に、ヌルHには複数の分布が存在する可能性があり、T(X)はヌル分布を1つずつ考慮せず、\ sup_ {F \ in H}と\ …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.