タグ付けされた質問 「self-study」

クラスまたは自習用に使用される教科書、コース、またはテストからの定期的な練習。このコミュニティのポリシーは、完全な回答ではなく、そのような質問に「役立つヒントを提供する」ことです。

4
予想されるサイコロの数は、合計がK以上になる必要がありますか?
6面のサイコロが繰り返しロールされます。合計がK以上になるには、予想されるロールの数はいくつですか? 編集前 P(Sum>=1 in exactly 1 roll)=1 P(Sum>=2 in exactly 1 roll)=5/6 P(Sum>=2 in exactly 2 rolls)=1/6 P(Sum>=3 in exactly 1 roll)=5/6 P(Sum>=3 in exactly 2 rolls)=2/6 P(Sum>=3 in exactly 3 rolls)=1/36 P(Sum>=4 in exactly 1 roll)=3/6 P(Sum>=4 in exactly 2 rolls)=3/6 P(Sum>=4 in exactly 3 rolls)=2/36 P(Sum>=4 in exactly …

1
EMアルゴリズムはガウス混合モデルのパラメーターを一貫して推定しますか?
私は混合ガウスモデルを研究していて、この質問を自分で考えます。 KKKμk∈Rpμk∈Rp\mu_k\in\mathbb{R}^p1≤k≤K1≤k≤K1\leq k\leq KΣΣ\SigmaΣΣ\Sigma1/K1/K1/K KKKμk∈Rpμk∈Rp\mu_k\in\mathbb{R}^p1≤k≤K1≤k≤K1\leq k\leq KΣΣ\Sigma μkμk\mu_kΣΣ\Sigman→∞n→∞n\rightarrow\inftyμkμk\mu_kΣΣ\Sigma

1
が独立したベータの場合もベータであることを示します
数年前に私たちの大学の学期試験で出てきた問題を解決しようとしています。 場合独立している密度を有するランダム変数とをそれぞれその表示以下の。X1,X2X1,X2X_1,X_2ββ\betaβ(n1,n2)β(n1,n2)\beta(n_1,n_2)β(n1+12,n2)β(n1+12,n2)\beta(n_1+\dfrac{1}{2},n_2)X1X2−−−−−√X1X2\sqrt{X_1X_2}β(2n1,2n2)β(2n1,2n2)\beta(2n_1,2n_2) ヤコビアン法を使用して、の密度が次のようになることを確認しました: Y=X1X2−−−−−√Y=X1X2Y=\sqrt{X_1X_2}fY(y)=4y2n1B(n1,n2)B(n1+12,n2)∫1y1x2(1−x2)n2−1(1−y2x2)n2−1dxfY(y)=4y2n1B(n1,n2)B(n1+12,n2)∫y11x2(1−x2)n2−1(1−y2x2)n2−1dxf_Y(y)=\dfrac{4y^{2n_1}}{B(n_1,n_2)B(n_1+\dfrac{1}{2},n_2)}\int_y^1\dfrac{1}{x^2}(1-x^2)^{n_2-1}(1-\dfrac{y^2}{x^2})^{n_2-1}dx この時点で私は実際に迷っています。さて、メインの論文で、ヒントが提供されていました。ヒントを使ってみましたが、希望の表現が得られませんでした。ヒントは次のとおり逐語的です。 ヒント:と与えられた密度の観点からの密度の式を導き出し、で変数の変更を使用してみます。Y=X1X2−−−−−√Y=X1X2Y=\sqrt{X_1X_2}X1X1X_1X2X2X_2z=y2xz=y2xz=\dfrac{y^2}{x} したがって、この時点で、この変数の変更を考慮して、このヒントを利用しようとします。したがって、簡略化後、(を書き込む)fY(y)=4y2n1B(n1,n2)B(n1+12,n2)∫yy2z2y4(1−y4z2)n2−1(1−y2.z2y4)n2−1y2z2dzfY(y)=4y2n1B(n1,n2)B(n1+12,n2)∫y2yz2y4(1−y4z2)n2−1(1−y2.z2y4)n2−1y2z2dzf_Y(y)=\dfrac{4y^{2n_1}}{B(n_1,n_2)B(n_1+\dfrac{1}{2},n_2)}\int_{y^2}^y\dfrac{z^2}{y^4}(1-\dfrac{y^4}{z^2})^{n_2-1}(1-y^2.\dfrac{z^2}{y^4})^{n_2-1}\dfrac{y^2}{z^2}dzxxxzzzfY(y)=4y2n1B(n1,n2)B(n1+12,n2)∫yy21y2(1−y4x2)n2−1(1−x2y2)n2−1dxfY(y)=4y2n1B(n1,n2)B(n1+12,n2)∫y2y1y2(1−y4x2)n2−1(1−x2y2)n2−1dxf_Y(y)=\dfrac{4y^{2n_1}}{B(n_1,n_2)B(n_1+\dfrac{1}{2},n_2)}\int_{y^2}^y\dfrac{1}{y^2}(1-\dfrac{y^4}{x^2})^{n_2-1}(1-\dfrac{x^2}{y^2})^{n_2-1}dx どうすればいいのか分かりません。ヒントを適切に解釈しているかどうかさえわかりません。とにかく、残りのヒントを次に示します。 変数の変更を使用することで、平均化することで、必要な密度を2つの方法で表すことができます。今への統合の範囲を分割し、、書き込みおよび。z=y2xz=y2xz=\dfrac{y^2}{x}fY(y)=constant.y2n1−1∫1y2(1−y2x)n2−1(1−x)n2−1(1+yx)1x−−√dxfY(y)=constant.y2n1−1∫y21(1−y2x)n2−1(1−x)n2−1(1+yx)1xdxf_Y(y)=constant.y^{2n_1-1}\int_{y^2}^1(1-\dfrac{y^2}{x})^{n_2-1}(1-x)^{n_2-1}(1+\dfrac{y}{x})\dfrac{1}{\sqrt{x}}dx(y2,y)(y2,y)(y^2,y)(y,1)(y,1)(y,1)(1−y2x)(1−x)=(1−y)2−(yx−−√−x−−√)2(1−y2x)(1−x)=(1−y)2−(yx−x)2(1-\dfrac{y^2}{x})(1-x)=(1-y)^2-(\dfrac{y}{\sqrt{x}}-\sqrt{x})^2u=yx−−√−x−−√u=yx−xu=\dfrac{y}{\sqrt{x}}-\sqrt{x} まあ、正直なところ、私はこれらのヒントの使い方を理解できません。助けていただければ幸いです。前もって感謝します。

1
「ロバスト統計:影響関数に基づくアプローチ」の2.2a.16を実行するためのソリューション
ロバスト統計の 180ページ:影響関数に基づくアプローチには、次の質問があります。 16:示すことが常に位置不変の推定のための 。nが奇数またはnが偶数の場合の両方で、有限標本分解点ε ∗ nの対応する上限を求めます。ε∗≤12ε∗≤12\varepsilon^*\leq\frac{1}{2}ε∗nεn∗\varepsilon^*_nnnnnnn 2番目の部分(ピリオドの後)は実際には取るに足らない(最初の部分を与える)ですが、質問の最初の部分(文)を証明する方法を見つけることができません。 この質問に関する本のセクションでは、次のことがわかります(p98)。 定義2:サンプル(x l、… 、x n)における推定量T nの有限サンプル分解点は、次の式で与えられます。ε ∗ n(T n ; x i、… 、x n):= 1ε∗nεn∗\varepsilon^*_nTnTnT_n(xl,…,xn)(xl,…,xn)(x_l,\ldots, x_n) ε∗n(Tn;xi,…,xn):=1nmax{m:maxi1,…,imsupy1,…,ym|Tn(z1,…,zn)|&lt;∞}εn∗(Tn;xi,…,xn):=1nmax{m:maxi1,…,imsupy1,…,ym|Tn(z1,…,zn)|&lt;∞}\varepsilon^*_n(T_n;x_i,\ldots,x_n):=\frac{1}{n}\max\{m:\max_{i_1,\ldots,i_m}\sup_{y_1,\ldots,y_m}\;|T_n(z_1,\ldots,z_n)|<\infty\} (z1,…,zn)(z1,…,zn)(z_1,\ldots,z_n)mmmxi1,…,ximxi1,…,ximx_{i_1},\ldots,x_{i_m}y1,…,ym.y1,…,ym.y_1,\ldots,y_m. ε∗ε∗\varepsilon^*ε∗=limn→∞ε∗nε∗=limn→∞εn∗\varepsilon^*=\underset{n\rightarrow\infty}{\lim}\varepsilon^*_nTnTnT_nTn(x1,…,xn)=Tn(x1+c,…,xn+c), for all c∈RTn(x1,…,xn)=Tn(x1+c,…,xn+c), for all c∈RT_n(x_1,\ldots,x_n)= T_n(x_1+c,\ldots,x_n+c), \text{ for all } c\in \Bbb{R} 以下のコメントでwhuberの質問に(私が)答えます。この本は、推定量がp82から始まる数ページであると定義しています。私は主要な部分を再現しようとしています(whuberの質問に答えると思います)。TnTnT_n (X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n)HH\mathcal{H}RR\mathbb{R}HH\mathcal{H}RR\mathbb{R}FθFθF_\thetaθθ\thetaΘΘ\Theta ... (X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n)GnGnG_nGnGnG_n(1/n)∑ni=1Δxi(1/n)∑i=1nΔxi(1/n)\sum_{i=1}^n\Delta_{x_i}ΔXΔX\Delta_{X}XXXθθ\thetaTn=Tn(X1,…,Xn)=Tn(Gn)Tn=Tn(X1,…,Xn)=Tn(Gn)T_n=T_n(X_1,\ldots,X_n)=T_n(G_n){Tn,n≥1}{Tn,n≥1}\{T_n,n\geq 1\}nnn{Fθ;θ∈Θ}{Fθ;θ∈Θ}\{F_\theta;\theta\in\Theta\}F(H)F(H)\mathcal{F}(\mathcal{H})HH\mathcal{H} Tn(Gn)=T(Gn)Tn(Gn)=T(Gn)T_n(G_n)=T(G_n)nnnGnGnG_nT:domain(T)→RT:domain(T)→RT:\mbox{domain}(T)\rightarrow\mathbb{R}TTTF(H)F(H)\mathcal{F}(\mathcal{H})TTTTn(X1,…,Xn)→n→∞T(G)Tn(X1,…,Xn)→n→∞T(G)T_n(X_1,\ldots,X_n)\underset{n\rightarrow\infty}{\rightarrow}T(G)GGGdomain(T)domain(T)\mbox{domain}(T)T(G)T(G)T(G){Tn;n≥1}{Tn;n≥1}\{T_n;n\geq 1\}GGG ... T(Fθ)=θ for all …

1
2つの未知数がある場合、負の二項式は指数ファミリーのように表現できませんか?
分散パラメーターが既知の定数である場合、負の二項分布を指数の分布ファミリーとして表すための宿題がありました。これはかなり簡単でしたが、なぜパラメーターを固定しておく必要があるのか​​疑問に思いました。2つのパラメーターが不明なため、正しい形式にする方法を思い付くことができませんでした。 オンラインで見ると、それは不可能であるという主張を見つけました。しかし、私はこれが真実であるという証拠を見つけていません。自分でも思い付かないようです。誰かがこれの証拠を持っていますか? 以下に要求されるように、私はいくつかの主張を添付しました: 「固定数の故障(別名停止時間パラメーター)rを持つ負の二項分布のファミリーは指数ファミリーです。ただし、上記の固定パラメーターのいずれかが変動する場合、結果のファミリーは指数ファミリーではありません。 」 http://en.wikipedia.org/wiki/Exponential_family 「2パラメータの負の2項分布は、指数ファミリのメンバーではありません。しかし、分散パラメーターを既知の固定定数として扱う場合、それはメンバーです。」 http://www.unc.edu/courses/2006spring/ecol/145/001/docs/lectures/lecture21.htm

1
Johansenメソッドを使用して共積分ベクトルを取得する
私はより良いヨハンセンの方法を理解しようとしているので、 3つのプロセスがある、Likelihood-Based-Inference-Cointegrated-Autoregressive-Econometricsという本によって与えられた例3.1を開発しました。 バツ1 トン= ∑i = 1tε1 i+ ϵ2 トンX1t=∑i=1tϵ1i+ϵ2tX_{1t} = \sum_{i=1}^t \epsilon_{1i} + \epsilon_{2t} X2t=α∑i=1tϵ1i+ϵ3tX2t=α∑i=1tϵ1i+ϵ3t X_{2t} = \alpha \sum_{i=1}^t \epsilon_{1i} + \epsilon_{3t} X3t=ϵ4tX3t=ϵ4t X_{3t} = \epsilon_{4t} したがって、共積分ベクトルは[a、-1、0]と[0、0 1]になるはずですが、ヨハンセン法を実行すると、それらを取得できません。 私が試しているコードは次のとおりです: import numpy as np import matplotlib.pyplot as plt import pandas as pd from statsmodels.tsa.stattools import adfuller from statsmodels.tsa.johansen import coint_johansen …

1
片側コルモゴロフ・スミルノフ検定からの
片側コルモゴロフスミルノフ検定のppp値を取得する方法を理解しようとしています。2標本の場合、D + n 1、n 2およびD − n 1、n 2の CDFを見つけるのに苦労しています。以下は、1つのサンプルの場合のD + nの CDFとしていくつかの場所で引用されています。D+n1,n2Dn1,n2+D^{+}_{n_{1},n_{2}}D−n1,n2Dn1,n2−D^{-}_{n_{1},n_{2}}D+nDn+D^{+}_{n} p+n(x)=P(D+n≥x|H0)=x∑j=0⌊n(1−x)⌋(nj)(jn+x)j−1(1−x−jn)n−jpn+(x)=P(Dn+≥x|H0)=x∑j=0⌊n(1−x)⌋(nj)(jn+x)j−1(1−x−jn)n−jp^{+}_{n}\left(x\right) = \text{P}\left(D^{+}_{n} \ge x | \text{H}_{0}\right) = x\sum_{j=0}^{\lfloor n\left(1-x\right)\rfloor}{ \binom{n}{j} \left(\frac{j}{n}+x\right)^{j-1}\left(1 - x - \frac{j}{n}\right)^{n-j}} また、whuber sezは、この1つのサンプルのCDFのわずかに異なる定式化があります(ここでの表記との整合性を保つために、彼の引用のtをxxxに置き換えています)。ttt 確率積分変換を使用して、ドナルドクヌースはpでの(共通の)分布を導出します。TAoCP Volume 2の57とエクササイズ17 。 (D+n≤xn−−√)=xnn∑c≤k≤x(nk)(k−x)k(x+n−k)n−k−1(Dn+≤xn)=xnn∑c≤k≤x(nk)(k−x)k(x+n−k)n−k−1\left(D^{+}_{n}\le \frac{x}{\sqrt{n}}\right)=\frac{x}{n^{n}}\sum_{c\le k\le x}\binom{n}{k}\left(k-x\right)^{k}\left(x+n-k\right)^{n-k-1} H:これは、以下のような1サンプルの場合における片側仮説に適用される0: F (X )- F 0 ≤ 0、F (xは)の経験的CDFであり、X、およびF 0は、いくつかのCDFです。0: F(x)−F0≤00: …

2
EMアルゴリズムの練習問題
これは中間試験の練習問題です。問題はEMアルゴリズムの例です。(f)の部分で困っています。(a)から(e)までのパーツをリストアップして、前に間違えた場合に備えて完成させます。 ましょレートを持つ独立した指数確率変数もθ。残念ながら、実際のX値は観測されず、X値が特定の間隔内にあるかどうかのみが観測されます。ましょうG 1 、J = 1 { X J &lt; 1 }、G 2 、J = 1 { 1 &lt; X J &lt; 2 }、及びG 3 、J = 1 {X1,…,XnX1,…,XnX_1,\ldots,X_nθθ\thetaXXXXXXG1j=1{Xj&lt;1}G1j=1{Xj&lt;1}G_{1j} = \mathbb{1}\left\{X_j < 1\right\}G2j=1{1&lt;Xj&lt;2}G2j=1{1&lt;Xj&lt;2}G_{2j} = \mathbb{1}\left\{1< X_j<2\right\} (j=1、…、nの場合)。観測されたデータは( G 1 j、 G 2 j、 G 3 j)で構成されています。G3j=1{Xj&gt;2}G3j=1{Xj&gt;2}G_{3j} = \mathbb{1}\left\{X_j > 2\right\}j=1,…,nj=1,…,nj=1,\ldots,n(G1j,G2j,G3j)(G1j,G2j,G3j)(G_{1j},G_{2j},G_{3j}) …

4
「厳密に正の分布」とは何ですか?
私はジュデアパールの「因果関係」(2009年第2版)を読んでおり、セクション1.1.5条件付き独立性とグラフォイドで、彼は次のように述べています。 以下は、条件付き独立関係(X_ || _Y | Z)によって満たされるプロパティの(部分的な)リストです。 対称性:(X_ || _ Y | Z)==&gt;(Y_ || _X | Z)。 分解:(X_ || _ YW | Z)==&gt;(X_ || _Y | Z)。 弱い和集合:(X_ || _ YW | Z)==&gt;(X_ || _Y | ZW)。 収縮:(X_ || _ Y | Z)&(X_ || _ W | ZY)==&gt;(X_ || _ YW …

2
Distribution \ CLTの収束
その所与の、条件競合製品。です。は限界的な歪みがあります。Poisson()の場合、は正の定数です。N=nN=nN = nYYYχ2(2n)χ2(2n)\chi ^2(2n)NNNθθ\thetaθθ\theta 、それを示すよう、分布です。(Y − E (Y ))/ √θ→∞θ→∞\theta \rightarrow \infty (Y−E(Y))/Var(Y)−−−−−−√→N(0,1) (Y−E(Y))/Var⁡(Y)→N(0,1)\space \space (Y - E(Y))/ \sqrt{\operatorname{Var}(Y)} \rightarrow N(0,1) 誰かがこれを解決するための戦略を提案できますか?CLT(Central Limit Theorem)を使用する必要があるようですが、に関する情報を独自に取得するのは難しいようです。サンプルを取り、を生成するために導入できるrvはありますか?YYYYYY これは宿題なのでヒントをいただければ幸いです。

1
モーメントが存在しない場合のCLTの例
考慮してくださいXn=⎧⎩⎨1−12kw.p. (1−2−n)/2w.p. (1−2−n)/2w.p. 2−k for k&gt;nXn={1w.p. (1−2−n)/2−1w.p. (1−2−n)/22kw.p. 2−k for k&gt;nX_n = \begin{cases} 1 & \text{w.p. } (1 - 2^{-n})/2\\ -1 & \text{w.p. } (1 - 2^{-n})/2\\ 2^k & \text{w.p. } 2^{-k} \text{ for } k > n\\ \end{cases} これには無限のモーメントがあるにもかかわらず、あることを示す必要がありn−−√(X¯n)→dN(0,1)n(X¯n)→dN(0,1)\sqrt{n}(\bar{X}_n) \overset{d}{\to} N(0,1) 私は、リービーの連続性定理を使用してこれを表示しようとしました。つまり、左側の特性関数が標準法線の特性関数に収束することを示してみました。しかし、これを示すのは不可能のようでした。 この問題に対するヒントは、各を切り捨てることでした。つまり、とし、リンデバーグ条件を使用して、。XiXiX_iYni=XiI{Xi≤n}Yni=XiI{Xi≤n}Y_{ni} = X_i I\{X_i \leq n\}n−−√Y¯n→dN(0,1)nY¯n→dN(0,1)\sqrt{n} \bar{Y}_n …

2
IIDランダム変数の和の商の期待(ケンブリッジ大学ワークシート)
基本的な確率についての適切な知識が必要なインタビューを準備しています(少なくともインタビュー自体を通過するため)。学生時代から下のシートを改訂して作業しています。ほとんど簡単ですが、質問12で完全に困惑しています。 http://www.trin.cam.ac.uk/dpk10/IA/exsheet2.pdf 任意の助けいただければ幸いです。 編集:質問は: がおよびある独立して同一に分布する正の確率変数であると仮定します。ましょう。示すことがとき、および場合。X1,X2,...X1,X2,...X_1, X_2, ... E(X1)=μ&lt;∞E(X1)=μ&lt;∞\mathbb{E}(X_1) = \mu < \inftyE(X−11)&lt;∞E(X1−1)&lt;∞\mathbb{E}(X_1^{-1}) < \inftySn=∑ni=1XiSn=∑i=1nXiS_n = \sum_{i=1}^n X_iE(Sm/Sn)=m/nE(Sm/Sn)=m/n\mathbb{E}(S_m/S_n) = m/nm&lt;=nm&lt;=nm<=nE(Sm/Sn)=1+(m−n)μE(S−1n))E(Sm/Sn)=1+(m−n)μE(Sn−1))\mathbb{E}(S_m/S_n) = 1 + (m-n)\mu\mathbb{E}(S_n^{-1}))m&gt;=nm&gt;=nm>=n 実際、これをタイプする過程で、私は2番目の部分を解決しました。 以下のための、m&gt;=nm&gt;=nm>=nE(Sm/Sn)=E(X1+...+Xm)/E(X1+...+Xn)E(Sm/Sn)=E(X1+...+Xm)/E(X1+...+Xn)\mathbb{E}(S_m/S_n) = \mathbb{E}(X_1+ . . . +X_m)/\mathbb{E}(X_1+ . . . +X_n) =E(1+(Xn+1+...+Xm)/(X1+...+Xn))=E(1+(Xn+1+...+Xm)/(X1+...+Xn))=\mathbb{E}(1 + (X_{n+1} + ... + X_m)/(X_1 + ... + X_n)) 上記の比率の分子と分母は明らかに独立しているので、 =1+E(Xn+1+...+Xm)E(S−1n)=1+E(Xn+1+...+Xm)E(Sn−1) = 1 …

2
ブートストラップ標本の標本平均の分散
ましょは別個の観測値です(関係なし)。ましょX * 1、。。。、X * n個のブートストラップ標本(経験的CDFからのサンプル)を示すとせˉ X * N = 1X1,...,XnX1,...,XnX_{1},...,X_{n}X∗1,...,X∗nX1∗,...,Xn∗X_{1}^{*},...,X_{n}^{*}。検索E( ˉ X * N)とVR( ˉ X * Nを)。X¯∗n=1n∑ni=1X∗iX¯n∗=1n∑i=1nXi∗\bar{X}_{n}^{*}=\frac{1}{n}\sum_{i=1}^{n}X_{i}^{*}E(X¯∗n)E(X¯n∗)E(\bar{X}_{n}^{*})Var(X¯∗n)Var(X¯n∗)\mathrm{Var}(\bar{X}_{n}^{*}) これまでのところ、はX 1、です。。。、X nそれぞれ確率1X∗iXi∗X_{i}^{*}X1,...,XnX1,...,XnX_{1},...,X_{n}したがって E(X ∗ i)=11n1n\frac{1}{n}および E(X ∗ 2 i)=1E(X∗i)=1nE(X1)+...+1nE(Xn)=nμn=μE(Xi∗)=1nE(X1)+...+1nE(Xn)=nμn=μ E(X_{i}^{*})=\frac{1}{n}E(X_{1})+...+\frac{1}{n}E(X_{n})=\frac{n\mu}{n}=\mu 与える VをR(X * I)= E (X * 2 I)- (E (X * I))2 = μ 2 + σ 2 - μ …

3
統計生態学に関する本?
私はこの質問が以前に尋ねられたことを知っています:生態学的研究のための参考書ですが、それは私が探しているものではありません。 私が探しているのは、統計生態学についての良い本(または標準的な参考文献)を誰かが推薦できるかどうかです。私は統計を非常によく理解しているので、本は本当にどんなレベルでもありえます。私はこの本を使って、生態学における統計学の応用について何よりも自分自身に教えるので、良い/興味深い例の紹介本でも大いに評価されます。また、私の研究はベイジアン統計を対象とする傾向があるので、ベイジアン統計を組み込んだ本はさらに良いです!

1
通常の最小二乗法は効率的で公平な推定量をどのような仮定の下で与えますか?
ガウスマルコフの仮定の下で、通常の最小二乗法が効率的で不偏の推定量を与えることは本当ですか? そう: E(ut)= 0E(あなたt)=0E(u_t)=0 すべてのについてttt E(utあなたs)= σ2E(あなたtあなたs)=σ2E(u_tu_s)=\sigma^2 fort = st=st=s E(utあなたs)= 0E(あなたtあなたs)=0E(u_tu_s)=0 fort ≠ st≠st\neq s ここで、は残差です。あなたあなたu

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.