タグ付けされた質問 「bounds」

3
最小/最大値のみがわかっているデータの統計的方法
正確な値が不明なデータを扱う統計のブランチはありますが、各個人について、値の上限または下限を知っていますか? 私の問題の主な原因は、統計用語で表現するのに苦労しているという事実にあると思われますが、例を挙げて説明するとわかりやすくなります。 ある時点でAのメンバーがBに「遷移」できるように、2つの連結された集団AAAとBBBがあるとしますAAABBBが、その逆は不可能です。遷移のタイミングは可変ですが、ランダムではありません。たとえば、AAAは「子孫のない個人」であり、BBB「少なくとも1人の子孫を持つ個人」です。この進行が起こる年齢に興味がありますが、断面データしかありません。任意の個人について、それらがAAAまたはに属しているかどうかを確認できますBBB。これらの個人の年齢も知っています。母集団Aの各個人についてAAA、移行時の年齢が現在の年齢よりも大きくなることを知っています。同様に、メンバーのBBB場合、移行時の年齢が現在の年齢よりも低いことを知っています。しかし、私は正確な値を知りません。 移行の時代と比較したい他の要因があるとしましょう。たとえば、私は個人の亜種や体の大きさが最初の子孫の年齢に影響するかどうかを知りたいです。私は間違いなくそれらの質問に役立ついくつかの有用な情報を持っています。平均して、の個人のうちAAA、高齢の個人は後の移行を持っています。しかし、特に若い個人にとっては、情報は不完全です。また、母集団についても同様ですBBB。 この種のデータを処理する確立された方法はありますか?適切な場所から始めるために、このような分析を実行するための完全な方法、必ずしもいくつかの検索用語または有用なリソースが必要なわけではありません! 警告:AAAからへの移行BBBは瞬間的であるという単純な仮定を立てています。また、ほとんどの人は、十分な長さの生活をしていると仮定して、ある時点でBBBに進むと想定しています。そして、縦断的なデータは非常に役立つことを理解していますが、この場合は利用できないと想定しています。 私が言ったように、これが重複している場合はおologiesび申し上げますが、私の問題の一部は、何を検索すべきかわからないことです。同じ理由で、必要に応じて他のタグを追加してください。 サンプルデータセット:Sspは、2つの亜種またはYのいずれかを示します。子孫は、子孫なし(A)または少なくとも1人の子孫(B)を示しますXXXYYYAAABBB age ssp offsp 21 Y A 20 Y B 26 X B 33 X B 33 X A 24 X B 34 Y B 22 Y B 10 Y B 20 Y A 44 X B 18 Y A 11 Y B …

2
確率変数が最大になる確率をどのように制限できますか?
\newcommand{\P}{\mathbb{P}}有限平均\ mu_1 \ leq \ ldots \ leq \ mu_Nおよび分散\ sigma_1 ^ 2、\ ldots、\を持つNNN独立したランダム変数X1X1X_1、……\ldots、XnXnX_nがあるとしますsigma_N ^ 2。X_i \ neq X_Nが他のすべてのX_j、j \ neq iよりも大きい確率の分布のない境界を探しています。σ 2 1 ... σ 2 N X I ≠ X N Xのjは J ≠ Iμ1≤…≤μNμ1≤…≤μN\mu_1 \leq \ldots \leq \mu_Nσ21σ12\sigma_1^2……\ldotsσ2NσN2\sigma_N^2Xi≠XNXi≠XNX_i \neq X_NXjXjX_jj≠ij≠ij \neq i 言い換えると、簡単にするためにX_iの分布XiXiX_iが連続的であると仮定する場合(P(Xi=Xj)=0P(Xi=Xj)=0\P(X_i = X_j) = 0)、次の境界を探しています: …

4
プラス1標準偏差が最大値を超えることを意味できますか?
最小0と最大94.33のサンプルの平均74.10と標準偏差33.44があります。 私の教授は、平均プラス1つの標準偏差が最大値を超える方法を尋ねます。 私は彼女にこれについて多くの例を示しましたが、彼女は理解していません。私は彼女を示すためにいくつかの参照が必要です。これについては特に統計書のどの章や段落でもかまいません。


1
コピュラ密度の上限?
フレシェ-Hoeffding上限コピュラ分布関数に適用され、それは次式で与えられます。 C(あなた1、。。。、あなたd)≤ 分{ U1、。。、あなたd} 。C(u1,...,ud)≤min{u1,..,ud}.C(u_1,...,u_d)\leq \min\{u_1,..,u_d\}. CDFの代わりにコピュラ密度に同様の(限界密度に依存するという意味で)上限がありますか?c (u1、。。。、あなたd)c(u1,...,ud)c(u_1,...,u_d) どんな参考文献も大歓迎です。

2
サンプルの最大値の分散とは何ですか?
一連のランダム変数の最大値の分散の境界を探しています。言い換えれば、 ここでX = \ {X_1、\ ldots、X_M \}は固定であるような 閉じた形式の式を探しています。有限平均\ mu_1、\ ldots、\ mu_Mおよび分散\ sigma_1 ^ 2、\ ldots、\ sigma_M ^ 2のM個の確率変数のセット。BBBVar(maxiXi)≤B,Var(maxiXi)≤B, \mbox{Var}(\max_i X_i) \leq B \enspace, X={X1,…,XM}X={X1,…,XM}X = \{ X_1, \ldots, X_M \}MMMμ1,…,μMμ1,…,μM\mu_1, \ldots, \mu_Mσ21,…,σ2Mσ12,…,σM2\sigma_1^2, \ldots, \sigma_M^2 私はと推論できる Var(maxiXi)≤∑iσ2i,Var(maxiXi)≤∑iσi2, \mbox{Var}(\max_i X_i) \leq \sum_i \sigma_i^2 \enspace, これバウンドが非常に緩いようだが。数値テストでは、B=maxiσ2iB=maxiσi2B = \max_i \sigma_i^2が可能性があることを示しているようですが、これを証明できませんでした。どんな助けも大歓迎です。


1
経験的平均が値を超えると予想される回数
iid確率変数の列、と言う、与えられたのために、私は= 1 、2 、。。。、n、私は経験的平均の期待される回数を制限しようとしています1Xi∈[0,1]Xi∈[0,1]X_i \in [0,1]i=1,2,...,ni=1,2,...,ni = 1,2,...,n、値を超えるcは≥0:である、我々は、サンプルを描画し続けるように、 T DのEのF = N Σの J=1つのP({ 11n∑ni=1Xi1n∑i=1nXi\frac{1}{n}\sum_{i=1}^n X_ic≥0c≥0c \geq 0T=def∑j=1nP({1j∑i=1jXi≥c})T=def∑j=1nP({1j∑i=1jXi≥c}) \mathcal{T} \overset{def}{=} \sum_{j=1}^n \mathbb{P} \left(\left\{ \frac{1}{j}\sum_{i=1}^j X_i \geq c\right\}\right) あるa > 0に対してであると仮定すると、Hoeffdingの不等式を使用してc=a+E[X]c=a+E[X]c = a + \mathbb{E}[X]a>0a>0a > 0 T≤∑j=1ne−2ja2=1−e−2a2ne2a2−1T≤∑j=1ne−2ja2=1−e−2a2ne2a2−1\begin{align} \mathcal{T} & \leq \sum_{j=1}^n e^{-2ja^2} \\ & = \frac{1 - e^{-2 a^2 n}}{e^{2 …

1
異常に制限された応答変数の回帰の処理
理論的には-225から+225の範囲にある応答変数をモデル化しようとしています。変数は、ゲームをプレイしたときに被験者が得た合計スコアです。理論的には、被験者が+225を獲得することは可能です。それにもかかわらず、スコアは被験者のアクションだけでなく別のアクションのアクションにも依存していたため、スコアの最大の誰もが125でした(これは、お互いにプレーしている2人のプレーヤーが両方ともスコアできる最高のスコアです)。これは非常に高い頻度で発生しました。最低スコアは+35でした。 この125の境界は、線形回帰で問題を引き起こしています。私が考えられる唯一のことは、応答を0と1の間になるように再スケーリングし、ベータ回帰を使用することです。+225をスコアリングできるので、これを行う場合、125がトップ境界(または変換後の1)であると本当に正当化できるかどうかはわかりません。さらに、これを行った場合、私の下部境界はどうなるでしょう35。 おかげで、 ジョナサン

2
一様分布のユークリッドノルムの裾境界
一様に選択された要素のユークリッドノルムの頻度に関する既知の上限所定のしきい値よりも大きくなりますか?{−n, −(n−1), ..., n−1, n}d{−n, −(n−1), ..., n−1, n}d\:\{-n,~-(n-1),~...,~n-1,~n\}^d\: 私は主に、がよりはるかに小さい場合に指数関数的にゼロに収束する範囲に関心があります。nnnddd

2
仮説検定と総変動距離対カルバック・ライブラー分岐
私の研究では、次の一般的な問題に遭遇しました。同じドメイン上に2つの分布PPPとQQQがあり、それらの分布からのサンプルが多数(ただし有限)あります。サンプル独立して同一これら二つの分布のいずれかから分配される(分布が関係してもよいが:例えば、QQQの混合物であってもよいPPP。およびいくつかの他のディストリビューション)帰無仮説は、試料から来ることであるPPP、代替仮説はことですサンプルはからのものQQQです。 分布PPPと知って、サンプルのテストでタイプIとタイプIIのエラーを特徴づけようとしていQQQます。特に、私はPPPと知識に加えて、もう1つのエラーを制限することに興味がありQQQます。 私が求めている質問の関係についてmath.SE上の全変動距離の間にPPPとQQQ仮説検定には、私は受け入れたことの答えを受けました。その答えは理にかなっていますが、問題に関連するため、総変動距離と仮説検定の関係の背後にあるより深い意味に心を包むことができませんでした。したがって、私はこのフォーラムを利用することにしました。 私の最初の質問は次のとおりです。全体の変動は、タイプIとタイプIIのエラーの確率の合計にバインドされていますか?本質的に、サンプルがいずれかの分布によって生成された可能性があるゼロ以外の確率がある限り、エラーの少なくとも1つの確率はゼロ以外でなければなりません。基本的に、仮説テスターが信号処理をどれほど行っても、間違いを犯す可能性を回避することはできません。そして、総変動はその正確な可能性を制限します。私の理解は正しいですか? タイプIとIIのエラーと基になる確率分布とQの間には、KLダイバージェンスという別の関係もあります。したがって、私の2番目の質問は次のとおりです。KLダイバージェンスバウンドは、特定の仮説検定法(対数尤度比法の周りに多く出てくるように思われる)にのみ適用できますか、それともすべての仮説検定法に一般的に適用できますか?すべての仮説検定法に適用できる場合、なぜそれが合計変動限界と非常に異なるように見えるのですか?動作は異なりますか?PPPQQQ そして私の根底にある質問は、私がどちらかのバウンドを使用する必要がある所定の一連の状況がありますか、それとも純粋に便利な問題ですか?ある拘束を使用して、他の拘束を使用して結果をいつ導出する必要がありますか? これらの質問が些細なものである場合はお詫び申し上げます。私はコンピュータサイエンティストです(つまり、これは私には空想的なパターンマッチングの問題のようです:))。しかし、私はこの仮説テストのすべてを学び始めたばかりです。必要に応じて、質問を明確にするために最善を尽くします。

1
相関する確率変数の差の限界
2つの高度に相関する確率変数およびYが与えられた場合、その差の確率を制限します。X − Y | ある量を超える: P (| X − Y | &gt; K )&lt; δバツXXYYY| バツ− Y||X−Y| |X - Y| P(| X− Y| &gt;K)&lt; δP(|X−Y|&gt;K)&lt;δ P( |X - Y| > K) < \delta 簡単にするために、次のことを前提とします。 相関係数が"高"であることが知られている、と言う: ρX,Y=covar(X,Y)/σXσY≥1−ϵρX,Y=covar(X,Y)/σXσY≥1−ϵ \rho_{X,Y}= {covar(X,Y)} / {\sigma_X \sigma_Y} \geq 1 - \epsilon ゼロ平均である: μ X = μ …

3
あることを証明する方法
私は不平等を確立しようとしています |Ti|=∣∣Xi−X¯∣∣S≤n−1n−−√|Ti|=|Xi−X¯|S≤n−1n\left| T_i \right|=\frac{\left|X_i -\bar{X} \right|}{S} \leq\frac{n-1}{\sqrt{n}} ここで、はサンプルの平均値、はサンプルの標準偏差、つまり 。X¯X¯\bar{X}SSSS=∑ni=1(Xi−X¯)2n−1−−−−−−−−−√S=∑i=1n(Xi−X¯)2n−1S=\sqrt{\frac{\sum_{i=1}^n \left( X_i -\bar{X} \right)^2}{n-1}} であることがわかりやすいので、が、これは私が探していたものにあまり近くなく、有効な範囲でもありません。コーシーシュワルツと三角形の不等式を試してみましたが、どこにも行きませんでした。私がどこかで見逃している微妙なステップがあるに違いありません。どうぞよろしくお願いいたします。∑ni=1T2i=n−1∑i=1nTi2=n−1\sum_{i=1}^n T_i^2 = n-1 |Ti|&lt;n−1−−−−−√|Ti|&lt;n−1\left| T_i \right| < \sqrt{n-1}

2
回帰結果には予期しない上限があります
バランススコアを予測し、いくつかの異なる回帰方法を試しました。気づいたことの1つは、予測値に何らかの上限があるように見えることです。つまり、実際のバランスはですが、私の予測は約達しています。次のプロットは、実際のバランスと予測されたバランス(線形回帰で予測)を示しています。0.8[ 0.0 、1.0 )[0.0,1.0)[0.0, 1.0)0.80.80.8 そして、同じデータの2つの分布プロットを次に示します。 私の予測変数は非常に歪んでいるため(べき法則分布のユーザーデータ)、結果を次のように変更するBox-Cox変換を適用しました。 これは予測の分布を変更しますが、その上限はまだあります。だから私の質問は: 予測結果のそのような上限の考えられる理由は何ですか? 実際の値の分布に対応するように予測を修正するにはどうすればよいですか? おまけ: Box-Cox変換後の分布は、変換された予測子の分布に従うように見えるので、これが直接リンクされている可能性はありますか?その場合、分布を実際の値に合わせるために適用できる変換はありますか? 編集: 5つの予測子を持つ単純な線形回帰を使用しました。

1
上限、ここでおよび
(0 、1 )φ (X )= 1 / X E [ 1XバツXはから値をとることができる離散確率変数です。以来凸関数であり、我々が導出するジェンセンの不等式を使用することができ、下部:結合 上限 を導出することは可能ですか?(0,1)(0、1)(0,1)φ (x )= 1 / xφ(バツ)=1/バツ\varphi(x)=1/xE[ 11 − X] ≥ 11 − E[ X]= 11 − aE[11−バツ]≥11−E[バツ]=11−a E\left[\frac{1}{1-X}\right]\ge \frac{1}{1-E[X]}=\frac{1}{1-a}

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.