タグ付けされた質問 「order-statistics」

サンプルの順序統計は、昇順で配置された値です。統計サンプルのi次の統計は、i番目の最小値に等しくなります。したがって、サンプルの最小値は1次の統計であり、サンプルの最大値は最後です。時々「注文統計」は、注文統計のセット全体を意味するために使用されます、すなわち、それらが発生したシーケンスを無視するデータ値。間隔などの関連数量にも使用します。

2
注文統計の変換
確率変数およびは独立しており、分散されていると仮定します。ことを示し有する\ text {Exp}(1)分布。X1,...,XnX1,...,XnX_1, ... , X_nY1,...,YnY1,...,YnY_1, ..., Y_nU(0,a)U(0,a)U(0,a)Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))Zn=nlog⁡max(Y(n),X(n))min(Y(n),X(n))Z_n= n\log\frac{\max(Y_{(n)},X_{(n)})}{\min(Y_{(n)},X_{(n)})}Exp(1)Exp(1)\text{Exp}(1) 私は設定して、この問題を始めました{X1,...,Xn,Y1,...Yn}={Z1,...,Zn}{X1,...,Xn,Y1,...Yn}={Z1,...,Zn}\{X_1,...,X_n,Y_1,...Y_n\} = \{Z_1,...,Z_n\}次にmax(Yn,Xn)=Z(2n)max(Yn,Xn)=Z(2n)\max(Y_n,X_n)= Z_{(2n)}は(\ frac {z} {a})^ {2n}として配布され(za)2n(za)2n(\frac{z}{a})^{2n}、min(Yn,Xn)=Z(1)min(Yn,Xn)=Z(1)\min(Y_n,X_n)= Z_{(1)}は1−(1−za)2n1−(1−za)2n1 - (1 - \frac{z}{a})^{2n} 密度は、f_ {Z_ {1}}(z)=(2n)(1- \ frac {z} {a})^ {2n-1} \ fracとして簡単に見つけることができます{1} {a}fZ1(z)=(2n)(1−za)2n−11afZ1(z)=(2n)(1−za)2n−11af_{Z_{1}}(z) = (2n)(1-\frac{z}{a})^{2n-1}\frac{1}{a}およびfZ(2n)(z)=(2n)(za)2n−11afZ(2n)(z)=(2n)(za)2n−11af_{Z_{(2n)}}(z) = (2n)(\frac{z}{a})^{2n-1} \frac{1}{a} これは、これらが計算されたため、次にどこに行くべきかを知るのに苦労しているところです。変革で何かをしなければならないと思っていますが、よくわかりません...

1
重い裾の分布の順序統計量の漸近正規性
背景: 重い裾の分布でモデル化したいサンプルがあります。観測値の広がりが比較的大きいなど、いくつかの極端な値があります。私の考えはこれを一般化されたパレート分布でモデル化することでしたので、私はそれを行いました。ここで、私の経験的データ(約100データポイント)の0.975分位点は、データに当てはめた一般化パレート分布の0.975分位点よりも低くなっています。さて、この違いが気になるものかどうかを確認する方法はあるのでしょうか。 分位数の漸近分布は次のように与えられることがわかります。 だから私は、データのフィッティングから得たのと同じパラメーターで一般化されたパレート分布の0.975分位の周りに95%の信頼帯をプロットしようとすることで私の好奇心を楽しませるのは良い考えだと思いました。 ご覧のとおり、ここでは極端な値を処理しています。また、分散が非常に大きいため、密度関数の値は非常に小さく、信頼帯は上記の漸近正規性公式の分散を使用してのオーダーになります。±1012±1012\pm 10^{12} ±1.960.975∗0.025n(fGPD(q0.975))2±1.960.975∗0.025n(fGPD(q0.975))2\pm 1.96\frac{0.975*0.025}{n({f_{GPD}(q_{0.975})})^2} したがって、これは意味がありません。正の結果のみの分布があり、信頼区間には負の値が含まれています。ここで何かが起こっています。私は0.5分位の周りのバンドを計算すると、バンドがでないことを、巨大な、まだ巨大な。 これが別の分布、つまり分布とどのように関係するかを見ていきます。分布から観測をシミュレートし、変位値が信頼帯内にあるかどうかを確認します。これを10000回実行して、信頼帯内にあるシミュレーションされた観測値の0.975 / 0.5変位値の比率を確認します。N(1,1)N(1,1)\mathcal{N}(1,1)n=100n=100n=100N(1,1)N(1,1)\mathcal{N}(1,1) ################################################ # Test at the 0.975 quantile ################################################ #normal(1,1) #find 0.975 quantile q_norm<-qnorm(0.975, mean=1, sd=1) #find density value at 97.5 quantile: f_norm<-dnorm(q_norm, mean=1, sd=1) #confidence bands absolute value: band=1.96*sqrt((0.975*0.025)/(100*(f_norm)^2)) u=q_norm+band l=q_norm-band hit<-1:10000 for(i in 1:10000){ d<-rnorm(n=100, mean=1, sd=1) …

1
通常のサンプルからの最小次数統計の期待値
2014年1月25日更新: 間違いは修正されました。アップロードされた画像の期待値の計算値は無視してください-これらは間違っています-この質問に対する回答が生成されたため、画像は削除しません。 2014年1月10日更新: 間違いが見つかりました-使用されたソースの1つにある数学のタイプミス。修正を準備しています... コレクションから最小の順序統計の密度 CDFと連続確率変数をIID F X(X )とPDF F X(X )であり、 F X (1 )(X (1 ))= N F X(X (1 ))[ 1 − F X(x (1 ))] n − 1nnnFX(x)FX(x)F_X(x)fX(x)fX(x)f_X(x)fX(1)(x(1))=nfX(x(1))[1−FX(x(1))]n−1[1]fX(1)(x(1))=nfX(x(1))[1−FX(x(1))]n−1[1]f_{X_{(1)}}(x_{(1)}) = nf_X(x_{(1)})\left[1-F_X(x_{(1)})\right]^{n-1} \qquad [1] これらの確率変数が標準正規である場合、 とその期待値であるので、 E (X (1 )) = N ∫ ∞ - ∞ X (1 …

1
どのように計算する
私は論文の問題を解決しようとしていますが、どうすればよいかわかりません。一様な分布からランダムに取得した4つの観測があります。ある確率を計算したい。 はi番目の次数統計です(観測値が最小から最大にランク付けされるように次数統計を取ります)。より簡単なケースで解決しましたが、ここではその方法に迷っています。(0,1)(0,1)(0,1)3X(1)≥X(2)+X(3)3X(1)≥X(2)+X(3)3 X_{(1)}\ge X_{(2)}+X_{(3)}X(i)X(i)X_{(i)} すべての助けを歓迎します。

2
ミックスの順序に基づく「混合されていない」パーツの分布
としてペアで作成された観測値iidがあるとします以下のために。LETによると表すの番目の最大観測値。の(条件付き)分布とは何ですか?(または同等に、)私は= 1 、2 、... 、N Z iが = X I + Y I、Z I J J Z X I jはXi∼N(0,σ2x),Yi∼N(0,σ2y),Xi∼N(0,σx2),Yi∼N(0,σy2),X_i \sim \mathcal{N}\left(0,\sigma_x^2\right), Y_i \sim \mathcal{N}\left(0,\sigma_y^2\right),i=1,2,…,ni=1,2,…,ni=1,2,\ldots,nZi=Xi+Yi,Zi=Xi+Yi,Z_i = X_i + Y_i,ZijZijZ_{i_j}jjjZZZXijXijX_{i_j}YijYijY_{i_j} つまり、が観測値の番目に大きいことを条件として、の分布は何ですか?Z i j n ZXiXiX_iZiZiZ_ijjjnnnZZZ 私はそれを推測してい、の分布のちょうど無条件分布に収束としてながら、の、分布は、次の統計量の無条件分布に収束します。でも、真ん中ははっきりしません。XIjのXρ→∞XIJJXρ=σxσy→0ρ=σxσy→0\rho = \frac{\sigma_x}{\sigma_y} \to 0XijXijX_{i_j}XXXρ→∞ρ→∞\rho \to \inftyXijXijX_{i_j}jjjXXX

4
2 X 3テーブルで複数の事後カイ2乗検定を実行する方法
私のデータセットは、沿岸、ミッドチャネル、オフショアの3つのサイトタイプでの生物の全死亡率または生存率で構成されています。下の表の数字は、サイトの数を表しています。 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 100%の死亡率が発生したサイトの数がサイトのタイプに基づいて重要かどうかを知りたいです。2 x 3カイ2乗を実行すると、重要な結果が得られます。実行できる事後的なペアワイズ比較はありますか、または実際にロジスティックANOVAまたは二項分布の回帰を使用する必要がありますか?ありがとう!

1
ベータ分布の注文統計
ましょう IIDから引くこと。最小および最大次数統計はそれぞれどのように分散されますか? B e t a (kバツ1、… 、 xんx1,…,xnx_1,\dots,x_nB e t a ( K2、k − p − 12)Beta(k2,k−p−12)Beta\left(\frac{k}2,\frac{k-p-1}{2}\right) できれば参考にしていただければ幸いです。一般的に、私は次数統計の導出に慣れていません。 編集:ベータ分布が均一分布の統計として解釈できることを考えると、ベータ分布の最小値または最大値は別のベータ分布に従って分布していると思います。kkk Edit_2:たまたま気になっている、もう少し正確な設定を追加しました。結局、私は最小値と最大値のテールバウンドを探しているので、どんな形でもこれらにつながるので満足です。私は最終的に漸近的なケースにも興味がありますが、いわば私の次の関心事です。

1
離散一様確率変数間の間隔
LETこと(0,1)上の離散一様確率変数のIIDとその順序統計量があること。 n U (1 )、… 、U (n )U1、… 、UんU1,…,UnU_1, \ldots, U_nんnnU(1 )、… 、U(n )U(1),…,U(n)U_{(1)}, \ldots, U_{(n)} 定義のためにと。 i = 1 、… 、n U 0 = 0D私= U(私)− U(i − 1 )D私=U(私)−U(私−1)D_i=U_{(i)}-U_{(i-1)}i = 1 、… 、n私=1、…、んi=1, \ldots, nU0= 0U0=0U_0=0 私はの共同分布とそれらの限界分布、そしておそらくそれらの最初の数瞬間を理解しようとしています。誰かがこれについていくつかのヒントを与えることができますか?また、注文統計に関する本をお勧めしてもらえますか?U私U私U_i

2
順序統計を与えられた一様確率変数の条件付き期待
仮定X = (X1、。。。、Xん)(X1,...,Xn)(X_1, ..., X_n)〜U(θ 、2 θ )U(θ,2θ)U(\theta, 2\theta)、θ ∈ R+θ∈R+\theta \in \Bbb{R}^+。 どのようにしてE[ X1| バツ(1 )、X(n )]E[X1|X(1),X(n)]E[X_1|X_{(1)},X_{(n)}]、ここでバツ(1 )X(1)X_{(1)}とバツ(n )X(n)X_{(n)}は、それぞれ最小と最大の次数統計ですか? 私の最初の考えは、注文統計が範囲を制限するため、それは単に(X(1 )+ X(n ))/ 2(X(1)+X(n))/2(X_{(1)}+X_{(n)})/2であると考えられますが、これが正しいかどうかはわかりません!

1
からの打ち切られたサンプルの漸近分布
ましょサイズのIIDサンプルの順序統計量であるから。データが打ち切られ、データの上位パーセントのみが表示されると仮定します。つまり、入れます。の漸近分布は何 X(1),…,X(n)X(1),…,X(n)X_{(1)}, \ldots, X_{(n)}nnnexp(λ)exp⁡(λ)\exp(\lambda)(1−p)×100(1−p)×100(1-p) \times 100%X(⌊pn⌋),X(⌊pn⌋+1),…,X(n).X(⌊pn⌋),X(⌊pn⌋+1),…,X(n).X_{(\lfloor p n \rfloor )}, X_{(\lfloor p n\rfloor + 1)}, \ldots, X_{(n)}\,.m=⌊pn⌋m=⌊pn⌋m = \lfloor p n \rfloor (X(m),∑ni=m+1X(i)(n−m))?(X(m),∑i=m+1nX(i)(n−m))? \left(X_{(m)}, \frac{\sum_{i= m+1}^n X_{(i)}}{(n-m)} \right)? これは、この質問とこれに多少関係しており、この質問にもわずかに関係しています。 任意の助けいただければ幸いです。私は別のアプローチを試みましたが、あまり進歩することができませんでした。

3
SVDを実行して欠損値を代入する方法、具体例
SVDを適用する前に欠損値を処理する方法に関する素晴らしいコメントを読みましたが、簡単な例でどのように機能するか知りたいです。 Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 上記のマトリックスを考えると、NAの値を削除すると、User2とUser5しかなくなります。これは、私のUが2×kになることを意味します。しかし、欠損値を予測する場合、Uは5×kである必要があります。これは、特異値とVで乗算できます。 上記のマトリックスで、最初に欠損値のあるユーザーを削除してからSVDを適用して、欠損値を記入する人はいますか?数学記号を使いすぎずに、適用した手順の非常に簡単な説明を提供し、答えを実用的なものにしてください(つまり、数値に別の数値を掛けると答えが得られます)。 次のリンクを読みました。 stats.stackexchange.com/q/33142 stats.stackexchange.com/q/31096 stats.stackexchange.com/q/33103
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 

2
独立性と順序の統計
手元に問題があり、続行できません。誰かが私を始めるのを手伝ってくれる? f (x )= 2 x 0 &lt; x &lt; 1 U 1 = Y 1Y1&lt;Y2&lt;Y3Y1&lt;Y2&lt;Y3Y_1<Y_2<Y_3:pdfをもつ分布からのサイズ3の順序統計量 また、定義します タスクは、を計算することです。f(x)=2x 0&lt;x&lt;1f(x)=2x 0&lt;x&lt;1 f(x)=2x\ \ \ 0<x<1U1=Y1Y2 and U2=Y2Y3U1=Y1Y2 and U2=Y2Y3U_1={Y_1\over Y_2} \ \ \text{and }\ \ \ U_2={Y_2\over Y_3}U1 &amp; U2U1 &amp; U2U_1\ \&\ U_2 私の作品:限界を発見しました。U1 &amp; U2U1 &amp; U2U_1\ \&\ U_2 …

2
iidの描画のペアの最大値の分布とは何ですか?最小値は他の最小値の次数統計です?
検討する n⋅mn⋅mn\cdot m cdfからの独立した描画 F(x)F(x)F(x)、これは0-1で定義され、 nnn そして mmm整数です。ドローを任意にグループ化nnn各グループにm値を持つグループ。各グループの最小値を見てください。これらの最小値が最も大きいグループを取り上げます。さて、そのグループの最大値を定義する分布は何ですか?より一般的には、jjj-次の統計 mmm のドロー F(x)F(x)F(x)、それらのmドローのk次は、そのk次統計のnドローのp次でもありますか? これらはすべて抽象的なものなので、より具体的な例を次に示します。8回の抽選を検討してくださいF(x)F(x)F(x)。それらを2の4つのペアにグループ化します。各ペアの最小値を比較します。これらの4つの最小値の最も高いペアを選択します。「a」を描くラベル。同じペアのもう一方の値に「b」というラベルを付けます。分布とはFb(b)Fb(b)F_b(b)?知ってるb&gt;ab&gt;ab>a。aは4の最小値の最大値です。F(x)F(x)F(x)、の Fa(a)=(1−(1−F(x))2)4Fa(a)=(1−(1−F(x))2)4F_a(a) = (1-(1-F(x))^2)^4。とはFb(b)Fb(b)F_b(b)?

2
LET次統計量です。評価、
LETサイズのランダムなサンプルのための順序統計量である平均の正規分布からと分散。X(1)≤X(2)X(1)≤X(2)X_{(1)}\leq X_{(2)}222μμ\muσ2σ2\sigma ^{2} 評価、、、および。E(X(1))E⁡(X(1))\operatorname{E}(X_{(1)})E(X(2))E⁡(X(2))\operatorname{E}(X_{(2)})Var(X(1))Var⁡(X(1))\operatorname{Var}(X_{(1)})Var(X(2))Var⁡(X(2))\operatorname{Var}(X_{(2)})Cov(X(1),X(2))Cov⁡(X(1),X(2))\operatorname{Cov}(X_{(1)},X_{(2)}) 私の試み:一般に、分布関数と密度関数を持つサイズランダムサンプルの場合、の結合密度関数はによって与えられる ことがわかります 特に、いくつかの計算の後、私たちの場合、222FFFfffX(j)X(j)X_{(j)}fX(j)(t)=n!(j−1)!(n−j)![F(t)]j−1[1−F(t)]n−jf(t)−∞&lt;t&lt;∞.fX(j)(t)=n!(j−1)!(n−j)![F(t)]j−1[1−F(t)]n−jf(t)−∞&lt;t&lt;∞.f_{X_{(j)}}(t)=\frac{n!}{(j-1)!(n-j)!}\left[F(t)\right]^{j-1}\left[1-F(t)\right]^{n-j}f(t) \qquad -\infty<t<\infty . fX(j)(t)=⎧⎩⎨⎪⎪⎪⎪⎪⎪1σ2π√[1−erf(t−μσ2√)]e−(t−μσ2√)21σ2π√[1+erf(t−μσ2√)]e−(t−μσ2√)2If j=1If j=2.fX(j)(t)={1σ2π[1−erf(t−μσ2)]e−(t−μσ2)2If j=11σ2π[1+erf(t−μσ2)]e−(t−μσ2)2If j=2.f_{X_{(j)}}(t)=\left\{\begin{array}{ll}\frac{1}{\sigma \sqrt{2\pi}}\left[1-\mathrm{erf}\left(\frac{t-\mu}{\sigma \sqrt{2}}\right)\right]e^{-\left(\frac{t-\mu}{\sigma \sqrt{2}}\right)^{2}} & \mbox{If }j=1 \\ \frac{1}{\sigma \sqrt{2\pi}}\left[1+\mathrm{erf}\left(\frac{t-\mu}{\sigma \sqrt{2}}\right)\right]e^{-\left(\frac{t-\mu}{\sigma \sqrt{2}}\right)^{2}} & \mbox{If }j=2 \end{array}\right. . 以下のため。−∞&lt;t&lt;∞−∞&lt;t&lt;∞-\infty<t<\infty したがって、期待は E(X(j))=⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪1σ2π√∫∞−∞t[1−erf(t−μσ2–√)]e−(t−μσ2√)2dt1σ2π√∫∞−∞t[1+erf(t−μσ2–√)]e−(t−μσ2√)2dtIf j=1If j=2.E(X(j))={1σ2π∫−∞∞t[1−erf(t−μσ2)]e−(t−μσ2)2dtIf j=11σ2π∫−∞∞t[1+erf(t−μσ2)]e−(t−μσ2)2dtIf j=2.E(X_{(j)})=\left\{\begin{array}{ll}\frac{1}{\sigma \sqrt{2\pi}}{\displaystyle \int_{-\infty}^{\infty} t\left[1-\mathrm{erf}\left(\frac{t-\mu}{\sigma \sqrt{2}}\right)\right]e^{-\left(\frac{t-\mu}{\sigma \sqrt{2}}\right)^{2}}dt} & \mbox{If }j=1 \\ \frac{1}{\sigma \sqrt{2\pi}}{\displaystyle \int_{-\infty}^{\infty} …

1
iidサンプルの2つの最小実現の比率が1になるような正のサポートを持つ確率変数はありますか?
固定変数に対して、suppおよび確率変数を指定したと想像してくださいXXX(X)=(0,∞)(X)=(0,∞)(X)=(0,\infty)P(X∈(0,a))&gt;0P(X∈(0,a))&gt;0\mathbb P(X \in (0,a))>0a&gt;0a&gt;0a>0 iidのサンプル与えられた場合-X1,...,XnX1,...,XnX_1,...,X_n X(2)/X(1)→P1X(2)/X(1)→P1X^{(2)}/X^{(1)}\xrightarrow{\mathbb P}1 for、ここでは番目の最小要素を表しますか?n→∞n→∞n \to \inftyX(i)X(i)X^{(i)}iii

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.