タグ付けされた質問 「expected-value」

確率変数の期待値は、確率変数が取り得るすべての可能な値の加重平均であり、重みはその値を受け取る確率と同じです。

1
置き換えて描画する場合の予想される重複(3重など)の数
次の問題があります。 100個のアイテム(n)があり、そのうち43個(m)を一度に1つずつ選択します(置き換えあり)。 予想される一意の数(一度だけ選択、k = 1)、倍精度(正確に2回k = 2選択)、三重(正確にk = 3)、四角などを解決する必要があります。 少なくとも1つのダブル(誕生日のパラドックス)が存在する確率については多くの結果を見つけることができましたが、母集団のペアの予想数については見つかりませんでした。

2
独立した二乗均一確率変数の合計の平方根の期待
ましょX1,…,Xn∼U(0,1)X1,…,Xn∼U(0,1)X_1,\dots,X_n \sim U(0,1)独立したidenticallly標準一様確率変数を分散させること。 Let Yn=∑inX2iI seek: E[Yn−−√]Let Yn=∑inXi2I seek: E[Yn]\text{Let }\quad Y_n=\sum_i^nX_i^2 \quad \quad \text{I seek: } \quad \mathbb{E}\big[\sqrt{Y_n } \big] YnYnY_nの予想は簡単です。 E[X2]E[Yn]=∫10y2y√=13=E[∑inX2i]=∑inE[X2i]=n3E[X2]=∫01y2y=13E[Yn]=E[∑inXi2]=∑inE[Xi2]=n3\begin{align} \mathbb{E}\left[X^2\right] &=\int_0^1\frac{y}{2\sqrt{y}}=\frac{1}{3}\\ \mathbb{E}\left[Y_n\right] &=\mathbb{E}\left[\sum_i^nX_i^2\right] = \sum_i^n\mathbb{E}\left[X_i^2\right]=\frac{n}{3} \end{align} 退屈な部分です。LOTUSを適用するには、YnYnY_n pdfが必要です。もちろん、2つの独立確率変数の和の確率密度関数は、それらの確率密度関数のたたみ込みです。しかし、ここにはnnn確率変数があり、たたみ込みは...複雑な式(恐ろしいしゃれが意図されたもの)につながると思います。もっと賢い方法はありますか? 私は正しい解決策を見たいと思いますが、それが不可能であるか複雑すぎる場合は、大きなnnn漸近近似は許容できる可能性があります。ジェンセンの不平等によって、私はそれを知っています E[Yn]−−−−−√=n3−−√≥E[Yn−−√]E[Yn]=n3≥E[Yn]\sqrt{\mathbb{E}[Y_n]}=\sqrt{\frac{n}{3}}\geq\mathbb{E}\left[\sqrt{Y_n}\right] しかし、自明ではない下限も見つけられない限り、これはあまり役に立ちません。独立したRVの合計だけでなく、独立したRVの合計の平方根があるため、CLTはここでは直接適用されないことに注意してください。たぶん、ここで役立つかもしれない他の限界定理(私は無視します)があるかもしれません。

1
確率変数を平均
ましょ IIDこととˉ X = Σ nは、私は= 1 X Iを。 E [ X iXiXiX_iX¯=∑ni=1XiX¯=∑i=1nXi\bar{X} = \sum_{i=1}^{n} X_i 当たり前のようですが、正式に導出するのに苦労しています。E[XiX¯]= ?E[XiX¯]= ? E\left[\frac{X_i}{\bar{X}}\right] = \ ?


1
複数の期待を計算するときにドローを最適に分散する方法
期待値を計算したいとします。 EYEバツ| Y[ f(X、Y)]EYEX|Y[f(X,Y)]E_YE_{X|Y}[f(X,Y)] モンテカルロシミュレーションを使用してこれを近似したいとします。 EYEバツ| Y[ f(X、Y)] ≈ 1R SΣr = 1RΣs = 1Sf(xr 、s、yr)EYEX|Y[f(X,Y)]≈1RS∑r=1R∑s=1Sf(xr,s,yr)E_YE_{X|Y}[f(X,Y)] \approx \frac1{RS}\sum_{r=1}^R\sum_{s=1}^Sf(x^{r,s},y^r) しかし、両方の分布からサンプルを抽出するのはコストがかかるため、固定数のみを抽出する余裕があると想定します。 KKK どのようにを割り当てるべきですか?例には、各分布へのK / 2ドロー、または極端な場合、外側の1ドローと内側のK − 1ドロー、その逆などが含まれます。KKKK/ 2K/2K/2K− 1K−1K-1 私の直感は、それが互いに対する分布の分散/エントロピーと関係があるはずだと私に教えてくれます。外側の点が質点であるとすると、MCエラーを最小化するの除算は、Yの 1を描画し、XのK − 1を描画します。Y。 KKKYYYK−1K−1K-1X|YX|YX|Y うまくいけば、これは明確でした。

4
予想されるサイコロの数は、合計がK以上になる必要がありますか?
6面のサイコロが繰り返しロールされます。合計がK以上になるには、予想されるロールの数はいくつですか? 編集前 P(Sum>=1 in exactly 1 roll)=1 P(Sum>=2 in exactly 1 roll)=5/6 P(Sum>=2 in exactly 2 rolls)=1/6 P(Sum>=3 in exactly 1 roll)=5/6 P(Sum>=3 in exactly 2 rolls)=2/6 P(Sum>=3 in exactly 3 rolls)=1/36 P(Sum>=4 in exactly 1 roll)=3/6 P(Sum>=4 in exactly 2 rolls)=3/6 P(Sum>=4 in exactly 3 rolls)=2/36 P(Sum>=4 in exactly …

1
通常のサンプルからの最小次数統計の期待値
2014年1月25日更新: 間違いは修正されました。アップロードされた画像の期待値の計算値は無視してください-これらは間違っています-この質問に対する回答が生成されたため、画像は削除しません。 2014年1月10日更新: 間違いが見つかりました-使用されたソースの1つにある数学のタイプミス。修正を準備しています... コレクションから最小の順序統計の密度 CDFと連続確率変数をIID F X(X )とPDF F X(X )であり、 F X (1 )(X (1 ))= N F X(X (1 ))[ 1 − F X(x (1 ))] n − 1nnnFX(x)FX(x)F_X(x)fX(x)fX(x)f_X(x)fX(1)(x(1))=nfX(x(1))[1−FX(x(1))]n−1[1]fX(1)(x(1))=nfX(x(1))[1−FX(x(1))]n−1[1]f_{X_{(1)}}(x_{(1)}) = nf_X(x_{(1)})\left[1-F_X(x_{(1)})\right]^{n-1} \qquad [1] これらの確率変数が標準正規である場合、 とその期待値であるので、 E (X (1 )) = N ∫ ∞ - ∞ X (1 …

2
2つの均一に分散されたポイント間の予想距離を見つける方法は?
Iは、座標を定義した場合および(X 2、Y 2)(X1,Y1)(X1,Y1)(X_{1},Y_{1})(X2,Y2)(X2,Y2)(X_{2},Y_{2}) X1,X2∼Unif(0,30) and Y1,Y2∼Unif(0,40).X1,X2∼Unif(0,30) and Y1,Y2∼Unif(0,40).X_{1},X_{2} \sim \text{Unif}(0,30)\text{ and }Y_{1},Y_{2} \sim \text{Unif}(0,40). それらの間の距離の期待値をどのように見つけますか? 距離は、によって算出されるので、私は、考えていたと期待される値ちょうど?(1/30+1/30)2+(1/40+1/40)2(X1−X2)2+(Y1−Y2)2−−−−−−−−−−−−−−−−−−−√)(X1−X2)2+(Y1−Y2)2)\sqrt{(X_{1}-X_{2})^{2} + (Y_{1}-Y_{2})^{2}})(1/30+1/30)2+(1/40+1/40)2(1/30+1/30)2+(1/40+1/40)2(1/30 + 1/30)^2 + (1/40+1/40)^2

1
対称分布の中心モーメント
対称分布の中心モーメント が奇数の場合ゼロであることを示しようとしています。たとえば、3番目の中心モーメントことを示すことから始めましたここからどこへ行くべきかわからない、何か提案はありますか?これを証明するより良い方法はありますか?fx(a+x)=fx(a−x)fx(a+x)=fx(a−x){\bf f}_x{\bf (a+x)} = {\bf f}_x{\bf(a-x)}E[(X−u)3]=0.E[(X−u)3]=0.{\bf E[(X-u)^3] = 0}.E[(X−u)3]=E[X3]−3uE[X2]+3u2E[X]−u3.E[(X−u)3]=E[X3]−3uE[X2]+3u2E[X]−u3.{\bf E[(X-u)^3] = E[X^3] -3uE[X^2] + 3u^2E[X] - u^3}.

1
非中心指数分布の期待される対数値
仮定XバツX非中央指数関数的に位置して配布されkkk及びレートλλ\lambda。次に、とは何ですかE(log(X))E(ログ⁡(バツ))E(\log(X))。 私はのためにことを知っているk=0k=0k=0、答えは−log(λ)−γ−ログ⁡(λ)−γ-\log(\lambda) - \gammaどこγγ\gammaであるオイラーの定数。場合はどうk>0k>0k > 0ですか?

2
混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックブートストラップ
以下の移植片は、この記事から引用したものです。私はブートストラップの初心者であり、R bootパッケージを使用した線形混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックのブートストラップブートストラップを実装しようとしています。 Rコード これが私のRコードです: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) Out ご質問 …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

4
期待値は、非正規分布の平均値、中央値などとどのように関連していますか?
連続確率変数の期待値は、非正規分布(例:歪正規)の算術平均、中央値などとどのように関連していますか?一般的で興味深い分布(例えば、対数正規、単純なバイ/マルチモーダル分布、その他奇妙で素晴らしいもの)に興味があります。 私は主に定性的な回答を探していますが、定量的または定式的な回答も歓迎します。私は特にそれをより明確にする視覚的表現を見たいと思います。

2
データのROC曲線を計算する
そのため、ハミング距離を使用して生体認証特性から個人を認証しようとしている16のトライアルがあります。しきい値は3.5に設定されています。私のデータは以下であり、トライアル1のみが真陽性です。 Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 私の混乱のポイントは、このデータからROC曲線(FPR対TPR OR FAR対FRR)を作成する方法が本当にわからないということです。どちらでもかまいませんが、どうやって計算するのか混乱しています。任意の助けいただければ幸いです。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

3
完全分散の法則の証明の何が問題になっていますか?
総分散の法則によれば、 Var(X)=E(Var(X∣Y))+Var(E(X∣Y))Var⁡(X)=E⁡(Var⁡(X∣Y))+Var⁡(E⁡(X∣Y))\operatorname{Var}(X)=\operatorname{E}(\operatorname{Var}(X\mid Y)) + \operatorname{Var}(\operatorname{E}(X\mid Y)) それを証明しようとすると、私は書きます Var(X)=E(X−EX)2=E{E[(X−EX)2∣Y]}=E(Var(X∣Y))Var⁡(X)=E⁡(X−E⁡X)2=E⁡{E⁡[(X−E⁡X)2∣Y]}=E⁡(Var⁡(X∣Y)) \begin{equation} \begin{aligned} \operatorname{Var}(X) &= \operatorname{E}(X - \operatorname{E}X)^2 \\ &= \operatorname{E}\left\{\operatorname{E}\left[(X - \operatorname{E}X)^2\mid Y\right]\right\} \\ &= \operatorname{E}(\operatorname{Var}(X\mid Y)) \end{aligned} \end{equation} どうしたの?

1
確率密度関数の平均が存在するかどうかを証明する方法
これはよく知られている実数値の確率変数の指定されたバツXXのPDFとfff、の平均値バツXX(存在する場合)によって発見された E [X] = ∫Rバツf(x )d x。E[X]=∫Rxf(x)dx.\begin{equation} \mathbb{E}[X]=\int_{\mathbb{R}}x\,f(x)\,\mathrm{d}x\,. \end{equation} 一般的な質問: ここで、上記の積分を閉じた形で解くことができないが、平均が存在して有限であるかどうかを簡単に判断したい場合、それを証明する方法はありますか?(おそらく)平均が存在するための特定の基準が満たされているかどうかを判断するために、被積分関数に適用できるいくつかのテストはありますか? アプリケーション固有の質問: 平均が存在するかどうかを確認したい次のpdfがあります: f(x )= | σ22μ1x + μ2σ21|σ31σ32a3(x)ϕ(μ2x−μ1σ1σ2a(x))for x∈R,f(x)=|σ22μ1x+μ2σ12|σ13σ23a3(x)ϕ(μ2x−μ1σ1σ2a(x))for x∈R,\begin{equation} f(x)=\frac{|\sigma_{2}^{2}\mu_{1}x+\mu_{2}\sigma_{1}^{2}|}{\sigma_{1}^{3}\sigma_{2}^{3}a^{3}(x)}\,\phi\left(\frac{\mu_{2}x-\mu_{1}}{\sigma_{1}\sigma_{2}a(x)}\right)\qquad \text{for}\ x\in\mathbb{R}\,, \end{equation} ここで、 μ1,μ2∈ Rμ1,μ2∈R\mu_{1},\mu_{2}\in\mathbb{R}、σ1、σ2> 0σ1,σ2>0\sigma_{1},\sigma_{2}>0、(X )= (X 2a (x )= (x2σ21+ 1σ22)1 / 2a(x)=(x2σ12+1σ22)1/2a(x)=\left(\frac{x^{2}}{\sigma_{1}^{2}}+\frac{1}{\sigma_{2}^{2}}\right)^{1/2}、及びϕ(g(x))=12π√e−g2(x)/2ϕ(g(x))=12πe−g2(x)/2\phi(g(x))=\frac{1}{\sqrt{2\pi}}\,e^{-g^{2}(x)/2}。 私はその意味が役に立たないように解決しようとしました。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.