タグ付けされた質問 「order-statistics」

サンプルの順序統計は、昇順で配置された値です。統計サンプルのi次の統計は、i番目の最小値に等しくなります。したがって、サンプルの最小値は1次の統計であり、サンプルの最大値は最後です。時々「注文統計」は、注文統計のセット全体を意味するために使用されます、すなわち、それらが発生したシーケンスを無視するデータ値。間隔などの関連数量にも使用します。

4
通常のランダム変数の近似次数統計
特定のランダム分布の次数統計のためのよく知られた公式はありますか?特に、通常のランダム変数の最初と最後の統計値ですが、より一般的な回答も歓迎します。 編集:明確にするために、厳密な積分式ではなく、多少なりとも明示的に評価できる近似式を探しています。 たとえば、通常のrvの1次統計量(つまり最小値)について、次の2つの近似を見ました。 e1:n≥μ−n−12n−1√σe1:n≥μ−n−12n−1σe_{1:n} \geq \mu - \frac{n-1}{\sqrt{2n-1}}\sigma そして e1:n≈μ+Φ−1(1n+1)σe1:n≈μ+Φ−1(1n+1)σe_{1:n} \approx \mu + \Phi^{-1} \left( \frac{1}{n+1} \right)\sigma これらの最初のについては、およそを与えます。n=200n=200n=200e1:200≥μ−10σe1:200≥μ−10σe_{1:200} \geq \mu - 10\sigma 2番目はを与えますが、素早いモンテカルロはを与えます。さらに重要なことに、私はそれがどこから来たのかについて直感を持っていません。e1:200≈μ−2.58σe1:200≈μ−2.58σe_{1:200} \approx \mu - 2.58\sigmae1:200≈μ−2.75σe1:200≈μ−2.75σe_{1:200} \approx \mu - 2.75\sigma 助けがありますか?

3
壊れたスティックの最大の断片の分布(間隔)
長さ1のスティックを、ランダムに一様に断片に分割します。最も長いフラグメントの長さの分布は何ですか?k + 1k+1k+1 より正式には、をIIDとし、関連する順序統計、つまり単純に順序付けします。そのような方法で試料。ましょう。(U1、… Uk)(うん1、…うんk)(U_1, \ldots U_k)うん(0 、1 )うん(0、1)U(0,1)(U(1 )、… 、U(k ))(うん(1)、…、うん(k))(U_{(1)}, \ldots, U_{(k)})うん(1 )≤ U(2 )≤,…,≤U(k)U(1)≤U(2)≤,…,≤U(k)U_{(1)} \leq U_{(2)} \leq, \ldots , \leq U_{(k)}Zk= 最大(U(1 )、U(2 )− U(1 )、… 、U(k )− U(k − 1 )、1 − U(k ))Zk=最大(うん(1)、うん(2)−うん(1)、…、うん(k)−うん(k−1)、1−うん(k))Z_k = \max \left(U_{(1)}, U_{(2)}-U_{(1)}, \ldots, U_{(k)} - U_{(k-1)}, 1-U_{(k)}\right) Z_kの分布に興味がありますZkZkZ_k。モーメント、漸近結果、またはk \ uparrow …

2
と仮定し。表示
次の文が正しいことを確認する最も簡単な方法は何ですか? と仮定し。表示。Y1,…,Yn∼iidExp(1)Y1,…,Yn∼iidExp(1)Y_1, \dots, Y_n \overset{\text{iid}}{\sim} \text{Exp}(1)∑ni=1(Yi−Y(1))∼Gamma(n−1,1)∑i=1n(Yi−Y(1))∼Gamma(n−1,1)\sum_{i=1}^{n}(Y_i - Y_{(1)}) \sim \text{Gamma}(n-1, 1) ことに注意してください。Y(1)=min1≤i≤nYiY(1)=min1≤i≤nYiY_{(1)} = \min\limits_{1 \leq i \leq n}Y_i X∼Exp(β)X∼Exp(β)X \sim \text{Exp}(\beta)、この手段そのfX(x)=1βe−x/β⋅1{x>0}fX(x)=1βe−x/β⋅1{x>0}f_{X}(x) = \dfrac{1}{\beta}e^{-x/\beta} \cdot \mathbf{1}_{\{x > 0\}}。 Y _ {(1)} \ sim \ text {Exponential}(1 / n)であることが簡単にわかりますY(1)∼Exponential(1/n)Y(1)∼Exponential(1/n)Y_{(1)} \sim \text{Exponential}(1/n)。さらに、パラメータ化f_ {Y}(y)= \ dfrac {の下に \ sum_ {i = 1} ^ {n} …

1
離散均一分布から置換せずに描画されたサンプル間の最大ギャップ
この問題は、ロボットカバレッジに関する私の研究室の研究に関連しています。 セットから数字を置換せずにランダムに描画し、数字を昇順で並べ替えます。 。nnn{1,2,…,m}{1,2,…,m}\{1,2,\ldots,m\}1≤n≤m1≤n≤m1\le n\le m この並べ替えられた数字のリスト、連続する数字と境界の差を生成します。これにより、ギャップが与えられます。{a(1),a(2),…,a(n)}{a(1),a(2),…,a(n)}\{a_{(1)},a_{(2)},…,a_{(n)}\}g={a(1),a(2)−a(1),…,a(n)−a(n−1),m+1−a(n)}g={a(1),a(2)−a(1),…,a(n)−a(n−1),m+1−a(n)}g = \{a_{(1)},a_{(2)}−a_{(1)},\ldots,a_{(n)}−a_{(n-1)},m+1-a_{(n)}\}n+1n+1n+1 最大ギャップの分布は何ですか? P(max(g)=k)=P(k;m,n)=?P(max(g)=k)=P(k;m,n)=?P(\max(g) = k) = P(k;m,n) = ? これは、使用することができるフレーム順序統計量を: P(g(n+1)=k)=P(k;m,n)=?P(g(n+1)=k)=P(k;m,n)=?P(g_{(n+1)} = k) = P(k;m,n) = ? ギャップの分布についてはリンクを参照してくださいが、この質問は最大ギャップの分布を求めています。 平均値\ mathbb {E} [g _ {(n + 1)}]に満足しE[g(n+1)]E[g(n+1)]\mathbb{E}[g_{(n+1)}]ます。 n = mの場合n=mn=mn=m、すべてのギャップはサイズ1ですn+1=mn+1=mn+1 = m場合、サイズ2のギャップが1つ222あり、n+1n+1n+1可能な場所があります。最大のギャップサイズはm−n+1m−n+1m-n+1であり、このギャップはnnn 数字の前または後に配置でき、合計でn+1n+1n+1可能な位置になります。最小の最大ギャップサイズは⌈m−nn+1⌉⌈m−nn+1⌉\lceil\frac{m-n}{n+1}\rceilです。任意の組み合わせT = {m \ choose n} ^ {-1}の確率を定義しますT=(mn)−1T=(mn)−1T= {m \choose n}^{-1}。 P(g …

1
帰無仮説の下で交換可能なサンプルの背後にある直感は何ですか?
順列テスト(ランダム化テスト、再ランダム化テスト、または正確なテストとも呼ばれます)は非常に便利で、たとえば、必要な正規分布の仮定がt-test満たされていない場合や、ランク付けによる値の変換時に役立ちますノンパラメトリックテストのようにMann-Whitney-U-test、より多くの情報が失われます。ただし、この種の検定を使用する場合、帰無仮説の下でのサンプルの交換可能性の仮定は1つだけの仮定を見落とすべきではありません。coinRパッケージで実装されているようなサンプルが3つ以上ある場合にも、この種のアプローチを適用できることも注目に値します。 この仮定を説明するために、平易な英語で比fig的な言葉や概念的な直観を使ってください。これは、私のような非統計学者の間で見過ごされているこの問題を明確にするのに非常に役立つでしょう。 注: 置換テストの適用が同じ仮定の下で保持または無効にならない場合に言及することは非常に役立ちます。 更新: 私の地区の地元の診療所から無作為に50人の被験者を収集したとします。彼らは、1:1の比率で薬またはプラセボを無作為に割り当てられました。それらはすべてPar1、V1(ベースライン)、V2(3か月後)、およびV3(1年後)のパラメーター1について測定されました。50個の被験者はすべて、機能Aに基づいて2つのグループにサブグループ化できます。Aポジティブ= 20およびAネガティブ=30。これらは、機能Bに基づいて別の2つのグループにサブグループ化することもできます。Bポジティブ= 15およびBネガティブ=35 。今、私はPar1すべての訪問ですべての被験者からの値を持っています。交換可能性の仮定の下で、次のPar1場合に順列検定を使用するレベルを比較でき ますか?-薬物と被験者をV2でプラセボを投与した被験者と比較する ますか?-機能Aの対象とV2の機能Bの対象を比較しますか? -V2で機能Aを持つ対象とV3で機能Aを持つ対象を比較しますか? -この比較はどのような状況で無効であり、交換可能性の仮定に違反しますか?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
同じ平均、異なる分散
8人のランナーがレースを実行しているとします。個々の実行時間の分布は正規であり、それぞれの平均はたとえば秒です。ランナー1の標準偏差は最も小さく、2番目が2番目に小さく、3番目が最も小さく、8個が最も大きくなります。2つの質問が私を混乱させています。(1)最初が最後に勝つ確率は何ですか?(2)レースに勝つ可能性が最も高いのは誰ですか?111111 私の答えはそれぞれとです。それらは同じ平均を共有しているため、がちょうどである確率はありませんか?どうすれば2番目の部分を厳密に実証できますか?また、勝ちの正確な確率を計算できますか?前もって感謝します。8 ˉ X 1 - ˉ X 8 < 0 1 / 21/21/21/2888x¯1−x¯8<0x¯1−x¯8<0\bar x_1-\bar x_8\lt 01/21/21/2

3
サンプルサイズ、最小値と最大値から正規分布を再構築できますか?中間点を使用して平均を代理できます
私はこれが統計的には少し強引かもしれないことを知っていますが、これは私の問題です。 範囲データ、つまり変数の最小、最大、サンプルサイズがたくさんあります。これらのデータの一部については平均値もありますが、多くはありません。これらの範囲を互いに比較して、各範囲の変動性を定量化し、平均を比較したいと思います。分布が平均に関して対称的であり、データがガウス分布を持っていると仮定する正当な理由があります。このため、平均値が存在しない場合、分布の中間点を平均値のプロキシとして使用することを正当化できると考えています。 私がやりたいのは、各範囲の分布を再構築し、それを使用してその分布の標準偏差または標準誤差を提供することです。私が持っている唯一の情報は、サンプルから観測された最大値と最小値、および平均値のプロキシとしての中点です。 このようにして、各グループの加重平均を計算でき、また、私が持っている範囲データと(対称および正規分布の)仮定に基づいて、各グループの変動係数も計算できるようになります。 私はこれを行うためにRを使用する予定であるため、コードのヘルプも歓迎します。


2
カイ2乗変量の無限コレクションの統計(たとえば、最小)を注文しますか?
今回が初めてなので、フォーマットやタグなど、何らかの形で質問を明確にできるかどうか教えてください。(うまくいけば、後で編集できます!)参照を見つけて、誘導を使用して自分自身を解決しようとしましたが、両方で失敗しました。 私は、自由度の異なる独立した確率変数の無数に無限の集合の次数統計に減少するように見える分布を単純化しようとしています。具体的には、独立した中で番目に小さい値の分布は何ですか? m個χ 2 2、χ 2 4、χ 2 6、χ 2 8、...χ2χ2\chi^2mmmχ22,χ24,χ26,χ28,…χ22,χ42,χ62,χ82,…\chi^2_2,\chi^2_4,\chi^2_6,\chi^2_8,\ldots 特別なケース興味があります:(独立した)の最小値の分布はどうですか?χ 2 2、χ 2 4、χ 2 6、...m=1m=1m=1χ22,χ24,χ26,…χ22,χ42,χ62,…\chi^2_2,\chi^2_4,\chi^2_6,\ldots 最小値の場合、累積分布関数(CDF)を無限積として書くことができましたが、それをさらに単純化することはできません。のCDF が (場合、これにより、期待値2の指数分布との等価性に関する以下の2番目のコメントが確認されます。)最小値のCDFは、として記述できます。 製品の最初の項はであり、「最後の」項は F 2 M(X )= γ (M 、X / 2 )/ Γ (M )= γ (M 、X / 2 )/(M - 1 )!= 1 − e − x / …

1
n iid正規変数の最大比率の期待値
がからのiidであり、がから番目に小さい要素を示すと仮定します。 2つの連続する要素間の比率の予想される最大値をどのように上限にできるでしょうか?つまり、次の上限をどのように計算できますか。 N (μ 、σ 2)X (I ) I X 1、。。。、X n X (i )X1,...,XnX1,...,XnX_1,...,X_nN(μ,σ2)N(μ,σ2)N(\mu,\sigma^2)X(i)X(i)X_{(i)}iiiX1,...,XnX1,...,XnX_1,...,X_nX(i)X(i)X_{(i)} E[maxi=1,...,n−1(X(i+1)X(i))]E[maxi=1,...,n−1(X(i+1)X(i))]E\left[\max\limits_{i=1,...,n-1}\left(\frac{X_{(i+1)}}{X_{(i)}}\right)\right] 私が見つけることができた文献は、主に2つの確率変数間の比率に焦点を当てています。その結果、2つの無相関正規分布のpdfがここに示されています。https://en.wikipedia.org/wiki/ Ratio_distribution#Gaussian_ratio_distribution。これにより、nnn変数の期待される平均比率を上限にできるようになりますが、この概念を一般化してnnn変数の期待される最大比率を見つける方法はわかりません。

1
間隔の比率分布とサンプルの意味は何ですか?
レッツ平均でIID指数確率変数のサンプルで、および聞かせて、このサンプルから順序統計こと。ましょう。X1,…,XnX1,…,XnX_1,\dots,X_nββ\betaX(1),…,X(n)X(1),…,X(n)X_{(1)},\dots,X_{(n)}X¯=1n∑ni=1XiX¯=1n∑i=1nXi\bar X = \frac{1}{n}\sum_{i=1}^n X_i 間隔を定義各も指数関数的であり、平均がことを示すことができます。Wi=X(i+1)−X(i) ∀ 1≤i≤n−1.Wi=X(i+1)−X(i) ∀ 1≤i≤n−1.W_i=X_{(i+1)}-X_{(i)}\ \forall\ 1 \leq i \leq n-1\,. WiWiW_iβi=βn−iβi=βn−i\beta_i=\frac{\beta}{n-i} 質問:が既知で負でない場合、どのように見つけますか?P(WiX¯>t)P(WiX¯>t)\mathbb{P}\left( \frac{W_i}{\bar X} > t \right)ttt 試行:これは1-F_ {W_i} \ left(t \ bar X \ right)に等しいことを知っています1−FWi(tX¯)1−FWi(tX¯)1 - F_{W_i}\left(t \bar X\right)。したがって、私は次のような総確率の法則を使用しました: P(Wi>tX¯)=1−FWi(tX¯)=1−∫∞0FWi(ts)fX¯(s)ds,P(Wi>tX¯)=1−FWi(tX¯)=1−∫0∞FWi(ts)fX¯(s)ds, \mathbb{P}\left( W_i > t \bar X \right) = 1 - F_{W_i}\left( t \bar …

1
ユニークなMVUEを見つける
この質問は、ロバート・ホッグの数学統計入門第6バージョン問題7.4.9、388ページからの質問です。 LET PDFファイルでIIDことゼロの他の場所、\シータ&gt; 0。X1,...,XnX1,...,XnX_1,...,X_nf(x;θ)=1/3θ,−θ&lt;x&lt;2θ,f(x;θ)=1/3θ,−θ&lt;x&lt;2θ,f(x;\theta)=1/3\theta,-\theta0 ()MLE検索θ^θ^\hat{\theta}のθθ\theta (b)はθ^θ^\hat{\theta}のための十分な統計θθ\theta?どうして ? (c)(n+1)θ^/n(n+1)θ^/n(n+1)\hat{\theta}/nは\ thetaの一意のMVUE θθ\thetaですか?どうして ? (a)と(b)は解決できると思いますが、(c)で混乱しています。 のために): してみましょうY1&lt;Y2&lt;...YnY1&lt;Y2&lt;...YnY_10、この導関数は負であることがわかります。 したがって、尤度関数L(θ;x)L(θ;x)L(\theta;x)は減少しています。 (−θ&lt;y1(−θ&lt;y1(-\theta< y_1 とyn&lt;2θ)yn&lt;2θ) y_n < 2\theta)、 (θ⇒⇒\Rightarrow (θ&gt;−y1(θ&gt;−y1(\theta>-y_1 と θ&gt;yn/2),⇒θ&gt;max(−y1,yn/2)θ&gt;yn/2),⇒θ&gt;max(−y1,yn/2)\theta>y_n/2), \Rightarrow \theta>max(-y_1,y_n/2) θ θ &gt; M X (- Y 1、Y N / 2 )θ = M X (- Y 1 、Y nはL(θ,x)L(θ,x)L(\theta,x)ときに、減少している、以降samllest値を有する尤度関数を最大を達成する、場合、尤度関数は最大値を達成します。θθ\thetaθ&gt;max(−y1,yn/2)θ&gt;max(−y1,yn/2)\theta>max(-y_1,y_n/2)θ=max(−y1,yn/2)θ=max(−y1,yn/2)\theta=max(-y1,y_n/2) ∴∴\therefore mleθ^=max(−y1,yn/2)θ^=max(−y1,yn/2)\hat{\theta}=max(-y_1,y_n/2) (b)の場合: …

1
注文統計を介して推定値がパーセンタイルに収束することを示します
LET からサンプリングIIDランダム変数のシーケンスであるアルファ安定分布パラメータで、α = 1.5 、バツ1、X2、… 、X3 nX1,X2,…,X3nX_1, X_2, \ldots, X_{3n}。α = 1.5 、β= 0 、c = 1.0 、μ = 1.0α=1.5,β=0,c=1.0,μ=1.0\alpha = 1.5, \; \beta = 0, \; c = 1.0, \; \mu = 1.0 今配列検討、Y J + 1 = X 3 J + 1 X 3 J + 2 X …

1
コンセンサスランキングの信頼性を測定する方法(Kemenny-Snellブックの問題)
仮定専門家がそれぞれの組ランク付けするように依頼された順序または優先的にオブジェクトを。ランキングでの同点を許可しましょう。kkknnn John KemenyとLaurie Snellは、1962年の著書「社会科学における数学モデル」で、次の問題を解決することを提案しています。 プロジェクト。 人の専門家によるコンセンサスランキングの信頼性の尺度を作成します。たとえば、これは、単一のエキスパートのランキングを変更することによって引き起こされる可能性のある最大の変更に基づいている場合があります。(複数のコンセンサスランキングの可能性に注意を払う必要があります。)特定の可能な最も信頼できるコンセンサスと最も信頼できないコンセンサスに関するいくつかの定理を証明します。111kkkkkk この本は、ランキングの表記とランキングの集計方法を示しています(つまり、多くの「個人」から1つの「集団」ランキングを取得します)。しかし、上記の問題に対する答えはありません。 まず、ケンドールの一致係数WWWについて考えましたが、適切ではないようです。どんなアイデアでも大歓迎です!

1
を見つけるためのより簡単な方法
一様分布から引き出さ3つのIIDサンプル検討 、θはパラメータです。E [ X (2 )を見つけたい | X (1 )、X (3 ) ] ここで、X (i )は順序統計量iです。u(θ,2θ)u(θ,2θ)u(\theta, 2\theta)θθ\thetaE[X(2)|X(1),X(3)]E[X(2)|X(1),X(3)] \mathbb{E}\left[X_{(2)}| X_{(1)}, X_{(3)}\right] X(i)X(i)X_{(i)}iii 結果は しかし、この結果を示すことができる唯一の方法は長すぎるようです。簡単な解決策を思い付くことができません。何か不足していますか、ショートカットはありますか?E[X(2)|X(1),X(3)]=X(1)+X(3)2E[X(2)|X(1),X(3)]=X(1)+X(3)2 \mathbb{E}\left[X_{(2)}| X_{(1)}, X_{(3)}\right] = \frac{X_{(1)}+ X_{(3)}}{2} 私がすることは次のとおりです: 条件付き密度を見つける f(x(2)|x(1),x(3))=f(x(1),x(2),x(3))f(x(1),x(3))f(x(2)|x(1),x(3))=f(x(1),x(2),x(3))f(x(1),x(3)) f(x_{(2)}| x_{(1)}, x_{(3)}) = \frac{ f(x_{(1)}, x_{(2)}, x_{(3)})}{f(x_{(1)}, x_{(3)})} 私は統合します E[X(2)|X(1),X(3)]=∫xf(x|x(1),x(3))dxE[X(2)|X(1),X(3)]=∫xf(x|x(1),x(3))dx \mathbb{E}\left[X_{(2)}| X_{(1)}, X_{(3)}\right] = \int x f(x| …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.