タグ付けされた質問 「mathematical-statistics」

形式的な定義と一般的な結果に関係する統計の数学的理論。

1
このパラメーター推定戦略は何と呼ばれますか?
レッツ平均して正規分布からのランダムサンプルであってもと分散。を推定する問題を考えます。X1,X2,…,XnX1,X2,…,XnX_1, X_2, \ldots, X_nμμ\muσ2σ2\sigma^2P(X>100)P(X>100)P(X > 100) これを実行する1つの方法は、を計算することです。この「プラグイン」推定器は一貫しており、そのバイアスとMSEは簡単に計算できます。n−1∑ni=11(Xi>100)n−1∑i=1n1(Xi>100)n^{-1}\sum_{i=1}^n \mathbb{1}(X_i > 100) 私の生徒の小さなグループが問題に取り組む別の方法を考え出しました:計算 これは、という事実によって動機付けられ この推定量も一貫していますが、そのバイアスとMSEの計算はより困難です。1−Φ(100−x¯s).1−Φ(100−x¯s). 1 - \Phi\left(\frac{100 - \bar{x}}{s} \right). P(X>100)=1−Φ[(100−μ)/σ].P(X>100)=1−Φ[(100−μ)/σ].P(X > 100) = 1 - \Phi[(100 - \mu)/\sigma]. 私の質問はこれです。この種の戦略には名前がありますか?まだプラグインしているのでお願いしますが、これはいわゆるプラグインエスティメータではありません。

2
AR(1)をMA(
AR(1)プロセスは Xt=ϕXt−1+εtXt=ϕXt−1+εt X_t = \phi X_{t-1} + \varepsilon_t この式を再帰的に使用すると、 Xt=ϕ(ϕXt−2+εt−1)+εt=ϕ2Xt−2+ϕεt−1+εt=⋯=ϕkXt−k+∑j=0kϕjεt−jXt=ϕ(ϕXt−2+εt−1)+εt=ϕ2Xt−2+ϕεt−1+εt=⋯=ϕkXt−k+∑j=0kϕjεt−j X_t = \phi(\phi X_{t-2} + \varepsilon_{t-1}) + \varepsilon_t = \phi^2X_{t-2} + \phi\varepsilon_{t-1} + \varepsilon_t = \cdots = \phi^k X_{t-k} + \sum_{j=0}^k \phi^j\varepsilon_{t-j} させたら k→∞k→∞k\to\infty、 我々が得る Xt=limk→∞(ϕkXt−k+∑j=0kϕjεt−j)=limk→∞(ϕkXt−k)+∑j=0∞ϕjεt−jXt=limk→∞(ϕkXt−k+∑j=0kϕjεt−j)=limk→∞(ϕkXt−k)+∑j=0∞ϕjεt−j X_t = \lim_{k\to\infty}(\phi^k X_{t-k} + \sum_{j=0}^k \phi^j\varepsilon_{t-j}) = \lim_{k\to\infty}(\phi^k X_{t-k}) + \sum_{j=0}^\infty \phi^j\varepsilon_{t-j} AR(1)とMA(∞∞\infty)の間の双対性は、2つの間に同等性があり、XtXtX_tを次のように書くことができることを示しています …


1
表示とを独立している:この教科書の問題に対する解決策を求めています
では一般化線形モデルへの紹介は以下のようドブソンとバーネットによって、運動1.4b&Cは次のようになります。 ましょう独立したランダム分布と各変数である。およびましょう。...Y1,...,YnY1,...,YnY_1,...,Y_nN(μ,σ2)N(μ,σ2)N(\mu,\sigma^2)Y¯¯¯¯=1n∑ni=1YiY¯=1n∑i=1nYi\overline{Y}=\frac{1}{n}\sum_{i=1}^{n}Y_iS2=1n−1∑ni=1(Yi−Y¯¯¯¯)2S2=1n−1∑i=1n(Yi−Y¯)2S^2=\frac{1}{n-1}\sum_{i=1}^{n}(Y_i-\overline{Y})^2 b。示すことS2=1n−1[∑ni=1(Yi−μ)2−n(Y¯¯¯¯−μ)2]S2=1n−1[∑i=1n(Yi−μ)2−n(Y¯−μ)2]S^2 = \frac{1}{n-1}[\sum_{i=1}^{n}(Y_i-\mu)^2-n(\overline{Y}-\mu)^2] c。(b)から、。これにより、どのようにしてとが独立していると推測できますか?∑(Yi−μ)2/σ2=(n−1)S2/σ2+[(Y¯¯¯¯−μ)2n/σ2]∑(Yi−μ)2/σ2=(n−1)S2/σ2+[(Y¯−μ)2n/σ2]\sum(Y_i-\mu)^2/\sigma^2 = (n-1)S^2/\sigma^2+[(\overline{Y}-\mu)^2n/\sigma^2] Y¯¯¯¯Y¯\overline{Y} S2S2S^2 私の問題は、cの式で太字の質問にどのように答えられるかわからないことです。 私は2つが一般に独立していることを証明する方法を知っています(以前に尋ねられました)。 さらに、私が解決策を見ると、彼らは言う: (c)と(d)はp.10の結果から続きます 10ページの使用の最も近いものは、カイ二乗分布の生殖財産であり、ない場合にのみif文なので、私はそれがここで使用することができないと思います。 だから私の質問は、c)の方程式が独立性を証明するのにどのように役立つのですか?

2
これは信頼区間を構築する有効な方法ですか?
3つのルールは、 Y〜ビン(N 、P )Y〜置き場(ん、p)Y\sim \text{Bin}(n,p) 次に、0 [ 0 、3 / N ][0、3/ん][0,3/n] の95%信頼区間 ppp。ウィキペディアや他の場所でのこのルールの派生について混乱しています。 ウィキペディアは、95%信頼区間を見つけることはすべてを見つけることと同じです ppp そのような Pp(Y= 0 )≥ 0.05Pp(Y=0)≥0.05P_p(Y=0)\geq 0.05。これを、95%信頼区間はランダムな領域であるという自分の理解と調整するのに苦労していますC(Y)C(Y)C(Y) そのような Pp(C(Y)pを カバー )= 0.95Pp(C(Y) カバー p)=0.95P_p(C(Y)\text{ covers }p)=0.95 すべてのために ppp。 編集:私の質問はあいまいであることに気付きました(そしてWikipediaの基礎となるロジックについての誤った推測を削除しました)。私の主な質問は:ウィキペディアの議論はどのように正当化されますか?私のもう1つの関連する質問は次のとおりです。1つの可能な値に対してのみ定義されている場合、間隔のカバレッジ確率をどのように検証しますかYYY?

1
対数正規確率変数の合計の分布を見つける
2つの対数正規確率変数の合計の分布を見つけようとしています。これを投稿する前に、クロス検証済み、スタックオーバーフロー、およびいくつかの論文で利用可能な文献を参照しました。 畳み込みを使用して、2つの対数正規rvの合計の分布を見つけました。近似は違いに対して機能します。しかし、合計ではありません。CDFとPDFの両方で0でひどいねじれが発生しています。その理由がわかりませんでした。微調整を少し行うだけで、分布の形が正しくなります。しかし、私がやっていたことが正しいかどうかはわかりません。 誰かが私をここに案内できますか?

3
Rでの季節的ARIMAモデリング
私は、あなたが次のリンクでそれを見つけることができる2007年から2017年に商品のために毎月の価格データを持っている: https://drive.google.com/open?id=0BxRCOgKAL4itcUZlOExrUmVOanc 私は次のためにRの季節ARIMAモデルを使用して、それを予測する必要があります年。auto.arima関数を使用している場合は、ARIMA(0,1,1)ではなく、として最適なモデルが提案されますARIMA(p,d,q)(P,D,Q)12。の季節的な部分model(P,D,Q)がどういうわけか欠落しています。なぜこれが起こっているのか分かりません。私のデータは季節的ではありませんか、それとも私のコードに問題がありますか?また、モデルによって与えられる予測値は重要ではない次の月の間一定です。助けてください!これがコードです: data <- read.delim("C:/Users/hp/Desktop/heckyl/forecasting model/Soybean_Prices.txt", header=F) View(data) summary(data) summary(data) ts.data = ts(data, frequency=12, start=c(2007,6)) ts.data plot(ts.data) dim(as.matrix(ts.data)) ################################################################################ # Training and Testing Dataset data.train = window(ts.data, start = c(2007,6), end = c(2013,12)) plot(data.train) dim(as.matrix(data.train)) data.test = window(ts.data, start = c(2014,1)) plot(data.test) dim(as.matrix(data.test)) ################################################################################ # Developing an SARIMA model …

2
推定量が不偏であることを証明した場合、それはパラメーター推定量が不偏であることを証明しますか?
LETのPDF有するIIDランダム変数である、、及び。バツ私バツ私X_if(x | θ )f(バツ|θ)f(\mathbf{x}|\theta)E(バツ私)= 6θ2E(バツ私)=6θ2E(X_i) = 6\theta^2θ > 0θ>0\theta > 0 Iパラメータ(のための推定計算したの)あることを。これが不偏推定量であることを証明するには、であることを証明する必要があります。ただし、であるため、θθ\thetaf(x | θ )f(バツ|θ)f(\mathbf{x}|\theta)θ^=バツ¯/ 6−−−√θ^=バツ¯/6\hat{\theta} = \sqrt{\bar{x}/6}E(θ^)=E(x¯/6−−−√)E(θ^)=E(x¯/6)E(\hat{\theta}) = E\left(\sqrt{\bar{x}/6}\right)θ^2=x¯/6θ^2=x¯/6\hat{\theta}^2 = \bar{x}/6E(θ^2)=E(バツ¯/6)=16E(∑Xin)=16n∑E(Xi)=16nn6θ2=θ2.E(θ^2)=E(x¯/6)=16E(∑Xin)=16n∑E(Xi)=16nn6θ2=θ2.\begin{align} E(\hat{\theta}^2) &= E(\bar{x}/6) \\ &=\frac{1}{6}E\left(\frac{\sum X_i}{n}\right)\\ &=\frac{1}{6n}\sum E(X_i) \\ &=\frac{1}{6n}n6\theta^2 \\&= \theta^2.\end{align} 一般的に、証明証明と同じではないため、またあり得る。ただし、この場合はです。x2=4x2=4x^2 =4x=2x=2x=2xxx−2−2-2θ>0θ>0\theta>0 私はが不偏であることを示しましたが、これはが不偏であることを示すのに十分ですか?θ^2θ^2\hat{\theta}^2θ^θ^\hat{\theta}

1
十分な統計の期待です
指数ファミリは、2つの成分を使用して定義されます。-基本密度 q0(x )q0(x)q_0(x) -多数の十分な統計 S私(x )Si(x)S_i(x) ファミリーはすべての確率密度であり、次のように記述できます。 q(x|(λ)i)∝q0(x)exp(∑iλiSi(x))q(x|(λ)i)∝q0(x)exp⁡(∑iλiSi(x)) q(x| (\lambda)_i ) \propto q_0(x) \exp \left( \sum_i \lambda_i S_i(x) \right) パラメータ間の関係が (λi)(λi) (\lambda_i) 十分な統計の期待値: Eq(Si(x)|(λi))=∫Si(x)q0(x)exp(∑iλiSi(x))dx∫q0(x)exp(∑iλiSi(x))dxEq(Si(x)|(λi))=∫Si(x)q0(x)exp⁡(∑iλiSi(x))dx∫q0(x)exp⁡(∑iλiSi(x))dx E_q( S_i(x) | (\lambda_i) ) = \frac{\int S_i (x) q_0(x) \exp \left( \sum_i \lambda_i S_i(x) \right) dx}{ \int q_0(x) \exp \left( \sum_i \lambda_i S_i(x) \right) dx} …

1
どの二項予測区間がテール確率に適しているか、つまり
私は以下の性質を持つ問題に取り組んでいます。 利用可能なデータは多数ありますオーダーバツバツx10610610^6 CDFは、非負の実数をサポートしています。FバツFXF_X ません。FバツFXF_X データはiidであると想定できます。 から抽出された将来のサンプルがサンプルの最小値下回る確率を推定しようとしています。要点は、この確率を特定の値未満に保つことですFバツFXF_Xバツ(1 )x(1)x_{(1)}α 。α。\alpha. 信頼区間に関心がある場合、アプローチは値を選択し(は負でないサポートを持っているため)、場合、CLT、カゼッラ、ジェフリーズ、アグレスティ、またはその他の多くの方法を適用するなど、いくつかのオプションのいずれかを使用して、左裾の 2項信頼区間を導出します。k>0k>0k>0xバツxFX^(k)=p^=#(バツ私≤ K )んFバツ^(k)=p^=#(バツ私≤k)ん\hat{F_X}(k)=\hat{p}=\frac{\#(x_i\le k)}{n} これは、特にため、大きなと小さなは脆弱に見えます。さらに、私の場合、将来の観測の予測区間を推定しています。これらの状況でうまく機能する二項予測間隔はありますか?んんnkkkk =バツ(1 )k=バツ(1)k=x_{(1)} ベイジアンアプローチは直接推定し、そこから機能します。これは、この問題の狭い範囲に厳密に必要なものよりも難しいようです。FFF 「いや、人生は不公平であり、この問題の良い解決策はありません」という答えは、それに添えるいい引用がある場合にも役立ちます。


1
数学的統計(モーメントと中心モーメント)
もし(必ずしも整数ではない)、その証明する方法生モーメントがあれば存在した場合にのみ中心モーメントが存在?いくつかの不平等を適用する必要があると思いますが、それを理解することができません。r≥1r≥1r \ge 1rthrthr^\text{th}rthrthr^\text{th}

2
いかがですか
分布を理解しようとしています。ウィキペディアには、確率密度関数について次のグラフがあります。χ2χ2\chi^2 このグラフは、場合、PDFが無限になることを示しています。分布のモードはとして定義されるため、k = 1k=1 k = 1χ2χ2\chi^2M X { K - 2 、0 }max{k−2,0}max \{k − 2, 0\}f1(0 )= ?f1(0)=?f_1(0) = ? Web上の他のグラフでは、よりも高くなるように見えました。ここのように:111 もちろん、累積分布関数はすべての自由度でに近づきます。111 確率分布関数がどのでもあたりでそのように動作する理由がわかりません。分布は周りでどのように定義されていか?000kkkχ2χ2\chi^2000

2
もし
変数があり、分散が有限であることを知っています(したがって、平均も有限です)。スケーリングした後、その分散が有限のままであることは常に真実ですか?XXX0≤Y≤10≤Y≤10 \le Y \le 1 とは必ずしも独立しているとは限らないことに注意してください。XXXYYY 編集:私は「最悪の場合」と考えているあるたびとたびいくつかのために、(およびミラーリングの場合)?YYY000X&lt;cX&lt;cX < c111X≥cX≥cX \ge cccc

2
平均二乗バイアスの分解(統計学習の要素内)
The Statistics of Elements of Statistical Learningの 224ページの式7.14がどのようにして導き出されるのか理解できません。誰かがそれを理解するのを手伝ってくれる? Average squared bias=Average[model bias]2+Average[estimation bias]2Average squared bias=Average[model bias]2+Average[estimation bias]2\textrm{Average squared bias} = \textrm{Average}[\textrm{model bias}]^2 + \textrm{Average}[\textrm{estimation bias}]^2
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.