タグ付けされた質問 「mathematical-statistics」

形式的な定義と一般的な結果に関係する統計の数学的理論。

1
変換の下で観察されたフィッシャー情報
:Y. Pawitanによって"オール尤度尤度を使用して統計的モデリングと推論"、再パラメータ化の可能性として定義される L *(ψ )= 最大{ θ :G (θ )= ψ } L (θ ) したがって、gが1対1の場合、L ∗(ψ )= L (g − 1(ψ )θ ↦ グラム(θ )= ψθ↦g(θ)=ψ\theta\mapsto g(\theta)=\psiL∗(ψ )= 最大{ θ :g(θ )= ψ }L (θ )L∗(ψ)=max{θ:g(θ)=ψ}L(θ) L^*(\psi)=\max_{\{\theta:g(\theta)=\psi\}} L(\theta) gggL∗(ψ )= L (g− 1(ψ ))L∗(ψ)=L(g−1(ψ))L^*(\psi)=L(g^{-1}(\psi))(p。45)。私があればと述べたエクササイズ2.20を表示しようとしていますスカラーである(と私は推測gは、同様のスカラ関数であると考えられる)、その後、 私は*(G (θ))= I (θ)| ∂ …

1
加法分解と乗法分解
私の質問は本当に単純なものですが、それらは本当に私を理解するものです:)私は、特定の時系列が加法または乗法分解法を使用して分解されるかどうかを評価する方法を本当に知りません。お互いを区別するための視覚的な手掛かりがあることは知っていますが、理解できません。 この時系列を例にとります: どのように説明しますか? よろしくお願いします。

1
確率への収束の定数へのシミュレーション
漸近的な結果は、無限の概念を含むステートメントであるため、コンピュータシミュレーションでは証明できません。しかし、理論が教えているように、物事が実際に進んでいるという感覚を得ることができるはずです。 理論的な結果を検討 リムn → ∞P(| Xん| >ϵ)=0、ϵ > 0limn→∞P(|Xn|>ϵ)=0,ϵ>0\lim_{n\rightarrow\infty}P(|X_n|>\epsilon) = 0, \qquad \epsilon >0 ここで、はn個の確率変数の関数であり、同一かつ独立して分布していると言います。これは、X nが確率でゼロに収束することを示しています。ここで私が推測する典型的な例は、X nがサンプルの平均からサンプルのiid​​rvの一般的な期待値を引いた場合です。バツんXnX_nんnnバツんXnX_nバツんXnX_n バツん= 1んΣi = 1んY私− E[ Y1]Xn=1n∑i=1nYi−E[Y1]X_n = \frac 1n\sum_{i=1}^nY_i - E[Y_1] 質問: 必ずしも有限サンプルからのコンピュータシミュレーション結果を使用して、上記の関係が「現実の世界で具体化する」ことを誰かに説得力をもって示すにはどうすればよいでしょうか。 特に定数への収束を選択したことに注意してください。 以下に私のアプローチを回答として示します。より良いものを望んでいます。 更新:頭の後ろの何かが気になりました-そして私は何を見つけました。私は古い質問を掘り起こし、最も興味深い議論が回答の1つに対するコメントで行われました。そこでは、@ Cardinalは一貫しているが、その分散は漸近的にゼロではなく有限であるという推定量の例を提供しました。したがって、私の質問のより難しい変形は次のようになります:この統計が非ゼロで有限の分散を漸近的に維持する場合、統計によって確率が定数に収束することをシミュレーションでどのように示すのですか?

4
将来の統計学の博士課程の学生にとって重要な純粋数学コースは何ですか?
線形代数と分析(特に測度理論)が重要であることを知っています。実際の複雑な分析で大学院レベルのコースを受講することは役に立ちますか?入門コース以外に抽象代数のコースを受講する必要がありますか。たとえば、可換代数や代数幾何学などです。

1
2つのガウスランダムベクトルの内積のモーメント生成関数
誰もが、それぞれが独立してとして分布する2つのガウスランダムベクトルの内積のモーメント生成関数を計算する方法を提案できますか?これに利用できる標準的な結果はありますか?どんなポインタでも大歓迎です。N(0,σ2)N(0、σ2)\mathcal N(0,\sigma^2)

1
空間統計に関する推奨書籍
i)空間ドメイン全体での単変量変数と多変量変数(実数、カウントデータ)の変動性を研究するのに最適な本は何ですか。ii)空間位置全体の分布に基づいて、単変量または多変量変数をサンプリングします。(要するに空間サンプリング)

1
対称分布の中心モーメント
対称分布の中心モーメント が奇数の場合ゼロであることを示しようとしています。たとえば、3番目の中心モーメントことを示すことから始めましたここからどこへ行くべきかわからない、何か提案はありますか?これを証明するより良い方法はありますか?fx(a+x)=fx(a−x)fx(a+x)=fx(a−x){\bf f}_x{\bf (a+x)} = {\bf f}_x{\bf(a-x)}E[(X−u)3]=0.E[(X−u)3]=0.{\bf E[(X-u)^3] = 0}.E[(X−u)3]=E[X3]−3uE[X2]+3u2E[X]−u3.E[(X−u)3]=E[X3]−3uE[X2]+3u2E[X]−u3.{\bf E[(X-u)^3] = E[X^3] -3uE[X^2] + 3u^2E[X] - u^3}.

2
最初のPCで説明される分散の量が平均ペアワイズ相関に非常に近いのはなぜですか?
最初の主成分と相関行列の平均相関との関係は何ですか? たとえば、経験的なアプリケーションでは、平均相関は、全分散(すべての固有値の合計)に対する最初の主成分(最初の固有値)の分散の比率とほぼ同じであることがわかります。 数学的な関係はありますか? 以下は、実験結果のグラフです。ここで、相関は、15日間のローリングウィンドウで計算されたDAX株価指数コンポーネントのリターンの平均相関であり、説明された分散は、同じく15日間のローリングウィンドウで計算された最初の主成分によって説明された分散のシェアです。 これは、CAPMなどの一般的なリスク要因モデルで説明できますか?

1
観測されたイベントと期待されたイベントを比較する方法は?
4つの可能なイベントの頻度の1つのサンプルがあるとします。 Event1 - 5 E2 - 1 E3 - 0 E4 - 12 そして、私は自分のイベントの発生が予想される確率を持っています: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 4つのイベントの観測頻度の合計(18)を使用して、イベントの予想頻度を計算できますか? expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 = 1.8 expectedE1 - …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

1
実験データが裾の重い分布に従っていることをどのように証明できますか?
サーバーの応答遅延に関するいくつかのテスト結果があります。理論分析によると、遅延分布(応答遅延の確率分布関数)は、裾が重い動作になるはずです。しかし、テスト結果がヘビーテール分布に従っていることをどのように証明できますか?

1
2次のテイラー級数を使用したエラーの伝播
ジョン・ライスの「数学統計とデータ分析」というテキストを読んでいます。確率変数の期待値と分散を近似することに関心があります。確率変数の期待値と分散を計算でき、関係わかっています。したがって、についてテイラー級数展開を使用すると、期待値と分散を近似することができます。YYYXXXY=g(X)Y=g(X)Y = g(X)YYYgggμXμX\mu_X 162ページで、彼は3つの方程式を示しています。 1次のテイラー級数展開を使用したの期待値。それは:です。これは後で質問でと呼ばれます。YYYμY≈g(μX)μY≈g(μX)\mu_Y \approx g(\mu_X)E(Y1)E(Y1)E(Y_1) 1次テイラー級数展開を使用したの分散。それは:です。これは後で質問でと呼ばれます。YYYσ2Y≈σ2X(g′(μX))2σY2≈σX2(g′(μX))2\sigma_Y^2 \approx \sigma_X^2 (g'(\mu_X))^2Var(Y1)Var(Y1)Var(Y_1) 2次のテイラー級数展開を使用したの期待値。それは。これは、後で質問でE(Y_2)と呼ばれます。YYYμY≈g(μX)+12σ2Xg′′(μX)μY≈g(μX)+12σX2g″(μX)\mu_Y \approx g(\mu_X) + \frac12 \sigma_X^2 g''(\mu_X)E(Y2)E(Y2)E(Y_2) Yには2つの異なる式があることに注意してくださいYYY。これは、テイラー級数展開で2つの異なる次数を使用しているためです。式1および2は、Y1=g(X)≈g(μX)+(X−μX)g′(μX)Y1=g(X)≈g(μX)+(X−μX)g′(μX)Y_1 = g(X) \approx g(\mu_X) + (X-\mu_X)g'(\mu_X)ます。式3は、Y2=g(X)≈g(μX)+(X−μX)g′(μX)+12(X−μX)2g′′(μX)Y2=g(X)≈g(μX)+(X−μX)g′(μX)+12(X−μX)2g″(μX)Y_2 = g(X) \approx g(\mu_X) + (X-\mu_X)g'(\mu_X) + \frac12 (X-\mu_X)^2 g''(\mu_X)ます。 特にVar(Y_2)の式Var(Y2)Var(Y2)Var(Y_2)は与えられていないことに注意してください。後で、著者はY1Y1Y_1(式2)の分散の方程式を使用しているようですが、実際には、Y2Y2Y_2(式3)の期待値を参照しています。これはVar(Y_2)= Var(Y_1)を意味するようVar(Y2)=Var(Y1)Var(Y2)=Var(Y1)Var(Y_2) = Var(Y_1)です。 手動で計算しようとしましたが、やや複雑な式になっています。これが私の仕事です(最後に期待項を取得しているので停止しました): X 3 V a r (Y 2)Var(Y2)Var(Y2)Var(Y_2)X3X3X^3Var(Y2)=E[(g(μX)+(X−μX)a+12(X−μX)2b−g(μX)−12σ2Xb)2]=E[((X−μX)a+(12(X−μX)2−12σ2X)b)2]=E[(ca+(12c2−12σ2X)b)2]=E[c2a2+ca(c2−σ2X)b+14(c2−σ2X)2b2]=E[(X2−2XμX+μ2X)a2+(X−μX)a((X2−2XμX+μ2X)−σ2X)b+14((X2−2XμX+μ2X)−σ2X)2b2]Var(Y2)=E[(g(μX)+(X−μX)a+12(X−μX)2b−g(μX)−12σX2b)2]=E[((X−μX)a+(12(X−μX)2−12σX2)b)2]=E[(ca+(12c2−12σX2)b)2]=E[c2a2+ca(c2−σX2)b+14(c2−σX2)2b2]=E[(X2−2XμX+μX2)a2+(X−μX)a((X2−2XμX+μX2)−σX2)b+14((X2−2XμX+μX2)−σX2)2b2] \begin{aligned} Var(Y_2) &= …

2
データのROC曲線を計算する
そのため、ハミング距離を使用して生体認証特性から個人を認証しようとしている16のトライアルがあります。しきい値は3.5に設定されています。私のデータは以下であり、トライアル1のみが真陽性です。 Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 私の混乱のポイントは、このデータからROC曲線(FPR対TPR OR FAR対FRR)を作成する方法が本当にわからないということです。どちらでもかまいませんが、どうやって計算するのか混乱しています。任意の助けいただければ幸いです。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

1
バイアスのない効率的な推定量は、他の(中央値の)バイアスのない推定量よりも確率的に支配的ですか?
概要 効率的な推定量(サンプル分散がCramér–Rao限界に等しい)は、真のパラメーターθθ\thetaに近い確率を最大化しますか? 私たちは見積もりと真のパラメータの違いや絶対差を比較すると言いますΔ = θ - θΔ^= θ^- θΔ^=θ^−θ\hat\Delta = \hat \theta - \theta 分布であるΔ効率的な推定のためには、確率的に支配的なの分布オーバーその他の不偏推定のために?Δ^Δ^\hat\DeltaΔ〜Δ~\tilde\Delta 動機 ため、私は質問のこの考えていますすべての賢明な損失(評価)関数の下で最適な見積もりから(私たちは1つの凸損失関数に関して公平最良推定量は、他の損失関数に関して公平最良推定量でもあると言うことができますIosif Pinelis、2015年、最高の不偏推定量の特性 。arXivプレプリントarXiv:1508.07636)。真のパラメータに近い確率的優位性は、私と似ているようです(これは十分な条件であり、より強力なステートメントです)。 より正確な表現 上記の質問文は幅広いものです。たとえば、どの種類の不偏性が考慮され、負と正の差について同じ距離測定基準がありますか? 次の2つのケースについて考えてみましょう。††^\dagger 予想1:もし、効率的な平均値と中央値、不偏推定量です。次に、任意の平均および中央値不偏推定量 where and θ^θ^\hat \thetaθ〜θ~\tilde \theta もし 、X > 0 そして P[ Δ^≤ X ] ≥ P[ Δ〜≤ X ]もし X < 0 、次いで P[ Δ^≥ X ] …

1
確率密度関数の平均が存在するかどうかを証明する方法
これはよく知られている実数値の確率変数の指定されたバツXXのPDFとfff、の平均値バツXX(存在する場合)によって発見された E [X] = ∫Rバツf(x )d x。E[X]=∫Rxf(x)dx.\begin{equation} \mathbb{E}[X]=\int_{\mathbb{R}}x\,f(x)\,\mathrm{d}x\,. \end{equation} 一般的な質問: ここで、上記の積分を閉じた形で解くことができないが、平均が存在して有限であるかどうかを簡単に判断したい場合、それを証明する方法はありますか?(おそらく)平均が存在するための特定の基準が満たされているかどうかを判断するために、被積分関数に適用できるいくつかのテストはありますか? アプリケーション固有の質問: 平均が存在するかどうかを確認したい次のpdfがあります: f(x )= | σ22μ1x + μ2σ21|σ31σ32a3(x)ϕ(μ2x−μ1σ1σ2a(x))for x∈R,f(x)=|σ22μ1x+μ2σ12|σ13σ23a3(x)ϕ(μ2x−μ1σ1σ2a(x))for x∈R,\begin{equation} f(x)=\frac{|\sigma_{2}^{2}\mu_{1}x+\mu_{2}\sigma_{1}^{2}|}{\sigma_{1}^{3}\sigma_{2}^{3}a^{3}(x)}\,\phi\left(\frac{\mu_{2}x-\mu_{1}}{\sigma_{1}\sigma_{2}a(x)}\right)\qquad \text{for}\ x\in\mathbb{R}\,, \end{equation} ここで、 μ1,μ2∈ Rμ1,μ2∈R\mu_{1},\mu_{2}\in\mathbb{R}、σ1、σ2> 0σ1,σ2>0\sigma_{1},\sigma_{2}>0、(X )= (X 2a (x )= (x2σ21+ 1σ22)1 / 2a(x)=(x2σ12+1σ22)1/2a(x)=\left(\frac{x^{2}}{\sigma_{1}^{2}}+\frac{1}{\sigma_{2}^{2}}\right)^{1/2}、及びϕ(g(x))=12π√e−g2(x)/2ϕ(g(x))=12πe−g2(x)/2\phi(g(x))=\frac{1}{\sqrt{2\pi}}\,e^{-g^{2}(x)/2}。 私はその意味が役に立たないように解決しようとしました。

1
方向ベクトルのコサインのモーメント/ mgf?
誰かが互いに独立してとして分布する2つのガウスランダムベクトルの余弦の2次モーメント(またはモーメント生成関数全体)を計算する方法を誰かが提案できますか?IE、次の確率変数の瞬間x,yx,yx,yN(0,Σ)N(0,Σ)\mathcal N (0,\Sigma) ⟨x,y⟩∥x∥∥y∥⟨x,y⟩‖x‖‖y‖\frac{\langle x, y\rangle}{\|x\|\|y\|} 最も近い質問は、内積の MGFを導出する2つのガウスランダムベクトルの内積のモーメント生成関数です。この質問をサンプルの共分散行列の固有値の分布にリンクするmathoverflowからのこの回答もありますが、それらを使用して2次モーメントを計算する方法はすぐにはわかりません。 私は2次元の代数的操作と、推測とチェックから3次元の結果を得るので、2次モーメントは\ Sigmaの固有値の半分のノルムに比例してスケーリングするΣΣ\Sigmaと思います。固有値a,b,ca,b,ca,b,c合計が1になると、二次モーメントは次のようになります。 (a−−√+b√+c√)−2(a+b+c)−2(\sqrt{a}+\sqrt{b}+\sqrt{c})^{-2} 数値チェックに以下を使用 val1[a_, b_, c_] := (a + b + c)/(Sqrt[a] + Sqrt[b] + Sqrt[c])^2 val2[a_, b_, c_] := Block[{}, x := {x1, x2, x3}; y := {y1, y2, y3}; normal := MultinormalDistribution[{0, 0, 0}, ( { {a, 0, 0}, …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.