タグ付けされた質問 「self-study」

クラスまたは自習用に使用される教科書、コース、またはテストからの定期的な練習。このコミュニティのポリシーは、完全な回答ではなく、そのような質問に「役立つヒントを提供する」ことです。

6
プロジェクトオイラー問題213(「ノミサーカス」)をどのように解決すべきですか?
プロジェクトオイラー213を解決したいのですが、統計学の専門家なので、どこから始めればよいかわかりません。正確な回答が必要なため、モンテカルロ法が機能しないことに注意してください。いくつかの統計トピックをお勧めしますか?ここに解決策を投稿しないでください。 ノミサーカス 30×30の正方形のグリッドには900ノミが含まれ、最初は1正方形あたり1ノミです。ベルを鳴らすと、各ノミは隣接する正方形にランダムにジャンプします(通常、グリッドの端またはコーナーのノミを除き、4つの可能性があります)。 ベルが50回鳴った後の空いている正方形の予想数はいくつですか?小数点以下6桁に四捨五入して回答してください。

1
LKJcorrが相関行列に適しているのはなぜですか?
私は、(素晴らしい)本の統計的再考(Richard McElreath著)の第13章「Adventures in Covariance」を読んでいます。彼は次の階層モデルを提示しています。 (Rは相関行列です) 著者は、それLKJcorrが相関行列の正則化事前として機能する弱く情報的な事前であると説明しています。しかし、なぜそうなのでしょうか。LKJcorr分布がどのような特性を持っているので、相関行列にとってこれほど優れています。相関行列に実際に使用されている他の良い事前分布はどれですか?

1
負の二項分布の最尤推定量
問題は次のとおりです。 n値のランダムサンプルは、パラメーターk = 3の負の二項分布から収集されます。 パラメーターπの最尤推定量を求めます。 この推定量の標準誤差の漸近式を見つけます。 パラメータkが十分に大きい場合に、負の二項分布がほぼ正規になる理由を説明します。この通常の近似のパラメーターは何ですか? 私の作業は次のとおりです 。1.これが必要なことだと思いますが、ここで正確かどうか、または提供された情報からこれをさらに進めることができるかどうかわかりません。 p(x)=(x−1k−1)πk(1−π)x−kL(π)=Πnip(xn|π)ℓ(π)=Σniln(p(xn|π))ℓ‘(π)=Σnikπ−(x−k)(1−π)p(x)=(x−1k−1)πk(1−π)x−kL(π)=Πinp(xn|π)ℓ(π)=Σinln⁡(p(xn|π))ℓ‘(π)=Σinkπ−(x−k)(1−π)p(x) = {x-1 \choose k-1}\pi^k(1-\pi)^{x-k}\\ L(\pi) = \Pi_i^n p(x_n|\pi)\\ \ell(\pi) = \Sigma_i^n\ln(p(x_n|\pi))\\ \ell`(\pi) = \Sigma_i^n\dfrac{k}{\pi}-\dfrac{(x-k)}{(1-\pi)} 以下が求められていることだと思います。最後の部分では、π^π^\hat{\pi}を\ dfrac {k} {x} \ ell``(\ hat {\ pi})=-\ dfrac {k} {\ hat {\で置き換える必要があるように感じますkxkx\dfrac{k}{x} ℓ‘‘(π^)=−kπ^2+x(1−π^)2se(π^)=−1ℓ‘‘(π^)−−−−−−−√se(π^)=π^2k−(1−π^)2x−−−−−−−−−−−−√ℓ‘‘(π^)=−kπ^2+x(1−π^)2se(π^)=−1ℓ‘‘(π^)se(π^)=π^2k−(1−π^)2x\ell``(\hat{\pi}) = -\dfrac{k}{\hat{\pi}^2} + \dfrac{x}{(1-\hat{\pi})^2}\\ se(\hat{\pi}) = \sqrt{-\dfrac{1}{\ell``(\hat{\pi})}}\\ se(\hat{\pi}) = \sqrt{\dfrac{\hat{\pi}^2}{k} - …

4
次元の呪い:kNN分類器
私はケビンマーフィーの本「機械学習-確率論的展望」を読んでいます。最初の章では作者が次元の呪いを説明していて、わからない部分があります。例として、著者は次のように述べています。 入力がD次元の単位立方体に沿って均一に分布していることを考慮してください。データポイントの目的の割合が含まれるまで、xの周りにハイパーキューブを成長させることにより、クラスラベルの密度を推定するとします。この立方体の予想されるエッジの長さはe D(f )= f 1です。fff。eD(f)=f1DeD(f)=f1De_D(f) = f^{\frac{1}{D}} それは私が頭を動かすことができない最後の式です。あなたがカバーしたいなら、エッジの長さは各次元に沿って0.1でなければならないよりもポイントの10%を言うように思われますか?私の推論が間違っていることはわかっていますが、その理由は理解できません。

3
平均がデータの平均であることがわかっているのに、なぜMLEを使用して平均を推定するのですか?
私は平均を推定するために教科書の問題に出くわしました。教科書の問題は次のとおりです。 ことを前提としNNNデータポイントは、x1バツ1x_1、x2バツ2x_2、。。。、xNバツNx_N、平均が不明であるが分散が既知の1次元ガウス確率密度関数によって生成されました。平均のML推定値を導出します。 私の質問は、平均がデータの平均であることをすでに知っているのに、なぜMLEを使用して平均を推定する必要があるのか​​ということです。ソリューションはまた、MLE推定値がデータの平均であると述べています。平均がデータの平均にほかならないことを見つけるために、すべての骨の折れる最大化MLEステップを実行する必要がありますかつまり、(x 1 + x 2 + ⋯ + x N)/ N(x1+x2+⋯+xN)/N(バツ1+バツ2+⋯+バツN)/N(x_1+x_2+\cdots+x_N)/N?)

2
Rでのステップ出力の解釈
Rでは、stepコマンドはモデルへの入力変数を選択するのを助けることを意図していると思いますよね? 以下はexample(step)#-> swiss& から来ます step(lm1) > step(lm1) Start: AIC=190.69 Fertility ~ Agriculture + Examination + Education + Catholic + Infant.Mortality Df Sum of Sq RSS AIC - Examination 1 53.03 2158.1 189.86 <none> 2105.0 190.69 - Agriculture 1 307.72 2412.8 195.10 - Infant.Mortality 1 408.75 2513.8 197.03 - Catholic 1 …

4
同じ試験を最短で受けることにより、すべての回答を正解する
雨は勉強しないので、はい/いいえの質問のみで構成されていても、中期には完全に無知です。幸い、Rainの教授は彼女が好きなだけ何度でも同じ中間学期を再受験することを許可していますが、彼はスコアを報告するだけなので、Rainは彼女が間違った問題を知りません。Rainは、最低限の回数の再受験ですべての正解を得るにはどうすればよいですか? より正式に言えば、試験の合計は nnn はい/いいえの質問、その正解は X1,X2,…,Xn∼iidBernoulli(0.5)X1,X2,…,Xn∼iidBernoulli(0.5)X_1, X_2, \dots, X_n \stackrel{iid}{\sim} \text{Bernoulli}(0.5)。Rainが再受験する必要があると予想される回数を最小限に抑える戦略を見つけたいです。 しばらく考えていました。レインが初めて中期を取るとき、彼女のスコアは常にBinom(n,0.5)Binom(n,0.5)\text{Binom}(n, 0.5)、彼女の答えに関係なく、各戦略は同じ量のエントロピーを減少させます。しかし、これが何を意味するのかはわかりません。ランダムな推測がすべて「はい」またはすべて「いいえ」で答えるのと同じくらい良いということですか? これは宿題ではありませんが、次の研究プロジェクトをベースに計画しているので、 本格的な答えの代わりにいくつかのヒントを提供してください。 この質問にすでに回答している場合は、ポインタを教えてください。

2
法線ガウスベクトルの線形変換
次の声明を証明することは困難です。それはグーグルで見つけられた研究論文で与えられます。この声明を証明するために助けが必要です! ましょバツ= A SX=ASX= AS、あAA直交行列であり、SSSガウス分布であるが。正規直交基底で同じ分布を持つガウスの同位体挙動SSS。 SにAを適用した後のバツXXガウスはどうですか?あAASSS

2
UMVUE
ましょう密度からのランダムサンプルである(X1,X2,…,Xn)(X1,X2,…,Xn)(X_1,X_2,\ldots,X_n)fθ(x)=θxθ−110&lt;x&lt;1,θ&gt;0fθ(x)=θxθ−110&lt;x&lt;1,θ&gt;0f_{\theta}(x)=\theta x^{\theta-1}\mathbf1_{00 のUMVUEを見つけようとしています。θ1+θθ1+θ\frac{\theta}{1+\theta} の結合密度は(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n) fθ(x1,⋯,xn)=θn(∏i=1nxi)θ−110&lt;x1,…,xn&lt;1=exp[(θ−1)∑i=1nlnxi+nlnθ+ln(10&lt;x1,…,xn&lt;1)],θ&gt;0fθ(x1,⋯,xn)=θn(∏i=1nxi)θ−110&lt;x1,…,xn&lt;1=exp⁡[(θ−1)∑i=1nln⁡xi+nln⁡θ+ln⁡(10&lt;x1,…,xn&lt;1)],θ&gt;0\begin{align} f_{\theta}(x_1,\cdots,x_n)&=\theta^n\left(\prod_{i=1}^n x_i\right)^{\theta-1}\mathbf1_{00 \end{align} 母集団pdfは1パラメータ指数ファミリに属しているため、これは完全な十分な統計がfθfθf_{\theta}θθ\thetaT(X1,…,Xn)=∑i=1nlnXiT(X1,…,Xn)=∑i=1nln⁡XiT(X_1,\ldots,X_n)=\sum_{i=1}^n\ln X_i 以降、最初の考えで、の私に与えるUMVUEによってレーマン・シェッフェの定理。この条件付き期待値が直接見つかるか、条件付き分布を見つける必要があるかどうかはわかりません 。E(X1)=θ1+θE(X1)=θ1+θE(X_1)=\frac{\theta}{1+\theta}E(X1∣T)E(X1∣T)E(X_1\mid T)θ1+θθ1+θ\frac{\theta}{1+\theta}X1∣∑ni=1lnXiX1∣∑i=1nln⁡XiX_1\mid \sum_{i=1}^n\ln X_i 一方、私は次のアプローチを検討しました: 我々は、つまり。Xi∼i.i.dBeta(θ,1)⟹−2θlnXi∼i.i.dχ22Xi∼i.i.dBeta(θ,1)⟹−2θln⁡Xi∼i.i.dχ22X_i\stackrel{\text{i.i.d}}{\sim}\text{Beta}(\theta,1)\implies -2\theta\ln X_i\stackrel{\text{i.i.d}}{\sim}\chi^2_2−2θT∼χ22n−2θT∼χ2n2-2\theta\, T\sim\chi^2_{2n} したがって、カイ2乗pdfを使用して計算された次の未加工モーメントはrrr−2θT−2θT-2\theta\,TE(−2θT)r=2rΓ(n+r)Γ(n),n+r&gt;0E(−2θT)r=2rΓ(n+r)Γ(n),n+r&gt;0E(-2\theta\,T)^r=2^r\frac{\Gamma\left(n+r\right)}{\Gamma\left(n\right)}\qquad ,\,n+r>0 したがって、異なる整数の選択に対して、異なる整数の累乗の不偏推定量(およびUMVUE)が得られるようです。たとえば、およびとのUMVUEを直接指定してください。rrrθθ\thetaE(−Tn)=1θE(−Tn)=1θE\left(-\frac{T}{n}\right)=\frac{1}{\theta}E(1−nT)=θE(1−nT)=θE\left(\frac{1-n}{T}\right)=\theta1θ1θ\frac{1}{\theta}θθ\theta さて、我々が持っている。θ&gt;1θ&gt;1\theta>1θ1+θ=(1+1θ)−1=1−1θ+1θ2−1θ3+⋯θ1+θ=(1+1θ)−1=1−1θ+1θ2−1θ3+⋯\frac{\theta}{1+\theta}=\left(1+\frac{1}{\theta}\right)^{-1}=1-\frac{1}{\theta}+\frac{1}{\theta^2}-\frac{1}{\theta^3}+\cdots などのUMVUEを確実に取得できます。したがって、これらのUMVUEを組み合わせると、の必要なUMVUEを取得できます。この方法は有効ですか、それとも最初の方法から続行しますか?UMVUEが存在する場合、UMVUEは一意であるため、どちらも同じ答えを返すはずです。1θ,1θ2,1θ31θ,1θ2,1θ3\frac{1}{\theta},\frac{1}{\theta^2},\frac{1}{\theta^3}θ1+θθ1+θ\frac{\theta}{1+\theta} 明確にするために、E(1+Tn+T2n(n+1)+T3n(n+1)(n+2)+⋯)=1−1θ+1θ2−1θ3+⋯E(1+Tn+T2n(n+1)+T3n(n+1)(n+2)+⋯)=1−1θ+1θ2−1θ3+⋯E\left(1+\frac{T}{n}+\frac{T^2}{n(n+1)}+\frac{T^3}{n(n+1)(n+2)}+\cdots\right)=1-\frac{1}{\theta}+\frac{1}{\theta^2}-\frac{1}{\theta^3}+\cdots つまり、E(∑r=0∞Trn(n+1)...(n+r−1))=θ1+θE(∑r=0∞Trn(n+1)...(n+r−1))=θ1+θE\left(\sum_{r=0}^\infty \frac{T^r}{n(n+1)...(n+r-1)}\right)=\frac{\theta}{1+\theta} 場合、必要なUMVUEがである可能性はありますか?∑r=0∞Trn(n+1)...(n+r−1)∑r=0∞Trn(n+1)...(n+r−1)\displaystyle\sum_{r=0}^\infty \frac{T^r}{n(n+1)...(n+r-1)}θ&gt;1θ&gt;1\theta>1 用、私はなるだろう、及びUMVUEが異なることになるので。0&lt;θ&lt;10&lt;θ&lt;10<\theta<1g(θ )= θ (1 + θ + θ2+ ⋯ )g(θ)=θ(1+θ+θ2+⋯)g(\theta)=\theta(1+\theta+\theta^2+\cdots) 最初のアプローチの条件付き期待値を直接見つけることができなかったと確信しており、、私は先に進みました条件付き分布を検索します。そのため、の結合密度が必要でした。E(X1| Σ LNバツ私= t )= E(X1| Π X私= et)E(X1∣∑ln⁡Xi=t)=E(X1∣∏Xi=et)E(X_1\mid \sum\ln …

1
いつ交差検証を使用しないのですか?
サイトを読んだとき、ほとんどの回答は、相互検証が機械学習アルゴリズムで実行されるべきであることを示唆しています。しかし、「機械学習について」という本を読んでいるときに、相互検証を使用しない方がよい演習があることがわかりました。私は本当に混乱しています。データ全体のトレーニングアルゴリズムが交差検証よりも優れているのはいつですか?実際のデータセットで発生しますか? ましょうはk個の仮説クラスです。あなたが与えられていると仮定メートル例を訓練し、あなたがクラス学びたいIID Hを= ∪ kは、私は= 1 H Iを。2つの代替アプローチを検討してください。H1,...,HkH1,...,HkH_1,...,H_kmmmH=∪ki=1HiH=∪i=1kHiH=\cup^k_{i=1}H_i ERMルールを使用してmの例でを学ぶHHHmmm サイズのトレーニングセットにm個の例を分割及び大きさの検証セットα Mいくつかについて、α ∈ (0 、1 )。次に、検証を使用してモデル選択のアプローチを適用します。すなわち、Fiは各クラスの訓練RST H Iに(1 - α )のmに対するERMルール使用トレーニング例をH Iを、およびlet H 1、... 、Hの kは(1−α)m(1−α)m(1−\alpha)mαmαm\alpha mα∈(0,1)α∈(0,1)\alpha\in(0,1)HiHiH_i(1−α)m(1−α)m(1−\alpha)mHiHiH_ih^1,…,h^kh^1,…,h^k\hat{h}_1,\ldots,\hat{h}_k結果の仮説である。第二は、FIの有限クラスに対してERMルールを適用{ H 1、... 、Hの K }にαのm個の検証例。h^1,…,h^kh^1,…,h^k\hat{h}_1,\ldots,\hat{h}_kαmαm\alpha m 最初の方法が2番目の方法よりも優れているシナリオ、およびその逆のシナリオについて説明します。 quastionのイメージ。

3
データサイエンティストのインタビューの質問:低線形回帰とあなたは何をしますか
価格弾力性モデルのが非常に低い(5〜10%)と仮定して面接担当者から尋ねられた仕事の面接質問に直面しました。この質問をどのように解決しますか?R2R2R^2 回帰診断を行って何がうまくいかなかったか、または非線形メソッドを適用する必要があるかどうか以外に、私は何も考えられませんでした。どういうわけかインタビュアーは私の答えに満足していなかったと思います。このようなシナリオで、モデルを適合させ、が低いにもかかわらず、それを生産レベルの予測に使用するために何か他のことはありますか?R2R2R^2 編集:後の段階で、インタビュー中に問題をモデル化するためのデータが提供され、時間差変数、競合他社の価格の影響、季節性ダミーを追加して、それが違いを生むかどうかを確認しました。は17.6%になり、ホールドアウトサンプルでのパフォーマンスは悪かった。個人的には、このようなモデルをライブ環境で予測に使用すると、誤った結果が得られ、クライアントが失われるため、非倫理的であると考えます(このようなモデルの推奨価格を会社の収益に使用することを想像してください)。誰もが知る必要があるあまりにも明白であるようなシナリオで行われる他のことはありますか?「銀の弾丸」と言いたくて気づかない何かR2R2R^2 また、外生変数を追加すると、がさらに2%向上し、このシナリオで何ができるかを想像してみてください。モデリングプロジェクトを破棄する必要がありますか、それとも、ホールドアウトサンプルのパフォーマンスによって示される生産レベルの品質のモデルを開発する希望はまだありますか?R2R2R^2 EDIT2:私は投稿している。この中で質問をeconomics.stackexchange.comの経済学の観点からこの問題を理解するためのフォーラム

2
期待
LET、、、と無関係です。の期待は何ですか?X1X1X_1X2X2X_2⋯⋯\cdotsXd∼N(0,1)Xd∼N(0,1)X_d \sim \mathcal{N}(0, 1)X41(X21+⋯+X2d)2X14(X12+⋯+Xd2)2\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2} は対称で簡単に見つけることができます。しかし、私はの期待値を見つける方法を知りません。ヒントを教えてください。E(X21X21+⋯+X2d)=1dE(X12X12+⋯+Xd2)=1d\mathbb{E}\left(\frac{X_1^2}{X_1^2 + \cdots + X_d^2}\right) = \frac{1}{d}バツ41(X21+ ⋯ + X2d)2X14(X12+⋯+Xd2)2\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2} これまでに入手したもの を対称的に見つけたかった。しかし、この場合には、の場合と異なっているので、は。だから私は期待を見つけるためにいくつかの他のアイデアが必要です。E (X41(X21+ ⋯ + X2d)2)E(X14(X12+⋯+Xd2)2)\mathbb{E}\left(\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2}\right)E (X21バツ21+ ⋯ + X2d)E(X12X12+⋯+Xd2)\mathbb{E}\left(\frac{X_1^2}{X_1^2 + \cdots + X_d^2}\right)E (X4私(X21+ ⋯ + X2d)2)E(Xi4(X12+⋯+Xd2)2)\mathbb{E}\left(\frac{X_i^4}{(X_1^2 + \cdots + X_d^2)^2}\right)E (X2私バツ2j(X21+ ⋯ …

1
2サンプルのカイ2乗検定
この質問は、ファンデルファールトの本、漸近統計、pg。253.#3: その仮定とYを n個のパラメータと独立多項ベクターである(M 、1、... 、K)と(N 、B 1、... 、BのK)。帰無仮説の下で、私は = bが、私はあることを示しますXmバツメートル\mathbf{X}_mYnYん\mathbf{Y}_n(m,a1,…,ak)(メートル、a1、…、ak)(m,a_1,\ldots,a_k)(n,b1,…,bk)(ん、b1、…、bk)(n,b_1,\ldots,b_k)ai=bia私=b私a_i=b_i 有するχ 2 K - 1つの分布。ここで、C I=を(XはM、I+YN、I)/(M+N)。∑i=1k(Xm 、私− m c^私)2m c^私+ ∑i = 1k(Yn 、i− n c^私)2n c^私Σ私=1k(バツメートル、私−メートルc^私)2メートルc^私+Σ私=1k(Yん、私−んc^私)2んc^私\sum_{i=1}^k \dfrac{(X_{m,i} - m\hat{c}_i)^2}{m\hat{c}_i} + \sum_{i=1}^k \dfrac{(Y_{n,i} - n\hat{c}_i)^2}{n\hat{c}_i}χ2k − 1χk−12\chi^2_{k-1}c^私= (Xm 、私+ Yn 、i)/(m + n )c^私=(バツメートル、私+Yん、私)/(メートル+ん)\hat{c}_i = (X_{m,i} + Y_{n,i})/(m+n) 始めるのに助けが必要です。ここの戦略は何ですか?2つの加数を次のように組み合わせることができました。 Σi …

1
ユニークなMVUEを見つける
この質問は、ロバート・ホッグの数学統計入門第6バージョン問題7.4.9、388ページからの質問です。 LET PDFファイルでIIDことゼロの他の場所、\シータ&gt; 0。X1,...,XnX1,...,XnX_1,...,X_nf(x;θ)=1/3θ,−θ&lt;x&lt;2θ,f(x;θ)=1/3θ,−θ&lt;x&lt;2θ,f(x;\theta)=1/3\theta,-\theta0 ()MLE検索θ^θ^\hat{\theta}のθθ\theta (b)はθ^θ^\hat{\theta}のための十分な統計θθ\theta?どうして ? (c)(n+1)θ^/n(n+1)θ^/n(n+1)\hat{\theta}/nは\ thetaの一意のMVUE θθ\thetaですか?どうして ? (a)と(b)は解決できると思いますが、(c)で混乱しています。 のために): してみましょうY1&lt;Y2&lt;...YnY1&lt;Y2&lt;...YnY_10、この導関数は負であることがわかります。 したがって、尤度関数L(θ;x)L(θ;x)L(\theta;x)は減少しています。 (−θ&lt;y1(−θ&lt;y1(-\theta< y_1 とyn&lt;2θ)yn&lt;2θ) y_n < 2\theta)、 (θ⇒⇒\Rightarrow (θ&gt;−y1(θ&gt;−y1(\theta>-y_1 と θ&gt;yn/2),⇒θ&gt;max(−y1,yn/2)θ&gt;yn/2),⇒θ&gt;max(−y1,yn/2)\theta>y_n/2), \Rightarrow \theta>max(-y_1,y_n/2) θ θ &gt; M X (- Y 1、Y N / 2 )θ = M X (- Y 1 、Y nはL(θ,x)L(θ,x)L(\theta,x)ときに、減少している、以降samllest値を有する尤度関数を最大を達成する、場合、尤度関数は最大値を達成します。θθ\thetaθ&gt;max(−y1,yn/2)θ&gt;max(−y1,yn/2)\theta>max(-y_1,y_n/2)θ=max(−y1,yn/2)θ=max(−y1,yn/2)\theta=max(-y1,y_n/2) ∴∴\therefore mleθ^=max(−y1,yn/2)θ^=max(−y1,yn/2)\hat{\theta}=max(-y_1,y_n/2) (b)の場合: …

2
反例を証明または提供します。 もし、次いで、XnXnX_n →a.s.→a.s.\,{\buildrel a.s. \over \rightarrow}\, (∏ n i = 1 X i )1 / nXXX(∏ni=1Xi)1/n(∏i=1nXi)1/n(\prod_{i=1}^{n}X_i)^{1/n} →a.s.→a.s.\,{\buildrel a.s. \over \rightarrow}\, XXX 私の試み: FALSE:が負の値のみを取ることができると仮定し、と仮定しますX N ≡ X ∀ n個XXXXn≡XXn≡XX_n \equiv X ∀∀\forall nnn THEN、但しもため、厳密に負ではありません。代わりに、ネガティブからポジティブおよびネガティブへと切り替わります。したがって、はほぼ確実に収束しません。XnXnX_n →a.s.→a.s.\,{\buildrel a.s. \over \rightarrow}\, n (∏ n i = 1 X i )1 / n(∏ n i …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.