タグ付けされた質問 「self-study」

クラスまたは自習用に使用される教科書、コース、またはテストからの定期的な練習。このコミュニティのポリシーは、完全な回答ではなく、そのような質問に「役立つヒントを提供する」ことです。

1
観測されたイベントと期待されたイベントを比較する方法は?
4つの可能なイベントの頻度の1つのサンプルがあるとします。 Event1 - 5 E2 - 1 E3 - 0 E4 - 12 そして、私は自分のイベントの発生が予想される確率を持っています: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 4つのイベントの観測頻度の合計(18)を使用して、イベントの予想頻度を計算できますか? expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 = 1.8 expectedE1 - …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

1
2次のテイラー級数を使用したエラーの伝播
ジョン・ライスの「数学統計とデータ分析」というテキストを読んでいます。確率変数の期待値と分散を近似することに関心があります。確率変数の期待値と分散を計算でき、関係わかっています。したがって、についてテイラー級数展開を使用すると、期待値と分散を近似することができます。YYYXXXY=g(X)Y=g(X)Y = g(X)YYYgggμXμX\mu_X 162ページで、彼は3つの方程式を示しています。 1次のテイラー級数展開を使用したの期待値。それは:です。これは後で質問でと呼ばれます。YYYμY≈g(μX)μY≈g(μX)\mu_Y \approx g(\mu_X)E(Y1)E(Y1)E(Y_1) 1次テイラー級数展開を使用したの分散。それは:です。これは後で質問でと呼ばれます。YYYσ2Y≈σ2X(g′(μX))2σY2≈σX2(g′(μX))2\sigma_Y^2 \approx \sigma_X^2 (g'(\mu_X))^2Var(Y1)Var(Y1)Var(Y_1) 2次のテイラー級数展開を使用したの期待値。それは。これは、後で質問でE(Y_2)と呼ばれます。YYYμY≈g(μX)+12σ2Xg′′(μX)μY≈g(μX)+12σX2g″(μX)\mu_Y \approx g(\mu_X) + \frac12 \sigma_X^2 g''(\mu_X)E(Y2)E(Y2)E(Y_2) Yには2つの異なる式があることに注意してくださいYYY。これは、テイラー級数展開で2つの異なる次数を使用しているためです。式1および2は、Y1=g(X)≈g(μX)+(X−μX)g′(μX)Y1=g(X)≈g(μX)+(X−μX)g′(μX)Y_1 = g(X) \approx g(\mu_X) + (X-\mu_X)g'(\mu_X)ます。式3は、Y2=g(X)≈g(μX)+(X−μX)g′(μX)+12(X−μX)2g′′(μX)Y2=g(X)≈g(μX)+(X−μX)g′(μX)+12(X−μX)2g″(μX)Y_2 = g(X) \approx g(\mu_X) + (X-\mu_X)g'(\mu_X) + \frac12 (X-\mu_X)^2 g''(\mu_X)ます。 特にVar(Y_2)の式Var(Y2)Var(Y2)Var(Y_2)は与えられていないことに注意してください。後で、著者はY1Y1Y_1(式2)の分散の方程式を使用しているようですが、実際には、Y2Y2Y_2(式3)の期待値を参照しています。これはVar(Y_2)= Var(Y_1)を意味するようVar(Y2)=Var(Y1)Var(Y2)=Var(Y1)Var(Y_2) = Var(Y_1)です。 手動で計算しようとしましたが、やや複雑な式になっています。これが私の仕事です(最後に期待項を取得しているので停止しました): X 3 V a r (Y 2)Var(Y2)Var(Y2)Var(Y_2)X3X3X^3Var(Y2)=E[(g(μX)+(X−μX)a+12(X−μX)2b−g(μX)−12σ2Xb)2]=E[((X−μX)a+(12(X−μX)2−12σ2X)b)2]=E[(ca+(12c2−12σ2X)b)2]=E[c2a2+ca(c2−σ2X)b+14(c2−σ2X)2b2]=E[(X2−2XμX+μ2X)a2+(X−μX)a((X2−2XμX+μ2X)−σ2X)b+14((X2−2XμX+μ2X)−σ2X)2b2]Var(Y2)=E[(g(μX)+(X−μX)a+12(X−μX)2b−g(μX)−12σX2b)2]=E[((X−μX)a+(12(X−μX)2−12σX2)b)2]=E[(ca+(12c2−12σX2)b)2]=E[c2a2+ca(c2−σX2)b+14(c2−σX2)2b2]=E[(X2−2XμX+μX2)a2+(X−μX)a((X2−2XμX+μX2)−σX2)b+14((X2−2XμX+μX2)−σX2)2b2] \begin{aligned} Var(Y_2) &= …

1
最小角度回帰は、相関関係を単調に減少させ続けますか?
最小角度回帰(LAR)の問題を解決しようとしています。これが問題である3.23ページ上の97のHastieら、統計的学習、第二の要素。ed。(5回目の印刷)。 すべての変数と応答が平均ゼロと標準偏差1を持つ回帰問題を考えてみましょう。また、各変数が応答と同一の絶対相関を持つと仮定します。 1N|⟨xj,y⟩|=λ,j=1,...,p1N|⟨xj,y⟩|=λ,j=1,...,p \frac{1}{N} | \left \langle \bf{x}_j, \bf{y} \right \rangle | = \lambda, j = 1, ..., p ましょうβはの最小二乗係数であるYにXおよびlet U(α )= α X βのためのα ∈ [ 0 、1 ]。β^β^\hat{\beta}yy\mathbf{y}XX\mathbf{X}u(α)=αXβ^u(α)=αXβ^\mathbf{u}(\alpha)=\alpha \bf{X} \hat{\beta}α∈[0,1]α∈[0,1]\alpha\in[0,1] 私はそれを示すように求められます と私はそれに問題があります。これは基本的に、各xjと残差との相関がuに向かって進んでも大きさが等しいことを示していることに注意してください。1N|⟨xj,y−u(α)⟩|=(1−α)λ,j=1,...,p1N|⟨xj,y−u(α)⟩|=(1−α)λ,j=1,...,p \frac{1}{N} | \left \langle \bf{x}_j, \bf{y}-u(\alpha) \right \rangle | = (1 - \alpha) \lambda, j = …

2
データのROC曲線を計算する
そのため、ハミング距離を使用して生体認証特性から個人を認証しようとしている16のトライアルがあります。しきい値は3.5に設定されています。私のデータは以下であり、トライアル1のみが真陽性です。 Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 私の混乱のポイントは、このデータからROC曲線(FPR対TPR OR FAR対FRR)を作成する方法が本当にわからないということです。どちらでもかまいませんが、どうやって計算するのか混乱しています。任意の助けいただければ幸いです。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

1
周辺密度の
タイトルが言うように、の限界密度を探していf(x,y)=c1−x2−y2−−−−−−−−−√,x2+y2≤1.f(x,y)=c1−x2−y2,x2+y2≤1.f (x,y) = c \sqrt{1 - x^2 - y^2}, x^2 + y^2 \leq 1. これまでのところ、はことがわかりました。私はを極座標に変換し、で積分することでそのことを理解しました。これが限界密度の部分に行き詰まっている理由です。私はそれを知っている、私は「大きな乱雑積分を取得、およびなしで私が回答ISN知っていることを解決する方法がわからないんだけど大きな厄介な積分になるはずです。代わりに見つけてから、を使ってを見つけることはか3ccc F(X、Y)のDRDθFX(X)=∫ ∞ - ∞ F(X、Y)のDYF(X、Y)DF32π32π\frac{3}{2 \pi}f(x,y)f(x,y)f(x,y)drdθdrdθdrd\thetafx(x)=∫∞−∞f(x,y)dyfx(x)=∫−∞∞f(x,y)dyf_x(x) = \int_{-\infty}^\infty f(x,y)dyF(x 、y)F(x,y)F(x,y) fx(x)dFdバツdFdx\frac{dF}{dx}fバツ(x )fx(x)f_x(x)?それは直感的な方法のように思えますが、私の教科書ではそれらの関係を説明するものを見つけることができないので、間違った仮定をしたくありませんでした。

1
指数の合計の分布
ましょバツ1バツ1X_1及び独立同一率の指数確率変数の分散も。してみましょう。バツ2バツ2X_2λλ\lambdaS2= X1+ X2S2=バツ1+バツ2S_2 = X_1 + X_2 Q:がPDFを持っていることを表示。S2S2S_2fS2(x)=λ2x e- λ X、X ≥ 0fS2(バツ)=λ2バツe−λバツ、バツ≥0f_{S_2}(x) = \lambda^2 x \text{e}^{-\lambda x},\, x\ge 0 レートポアソンプロセス(PP)に従ってイベントが発生した場合、は2番目のイベントの時間を表すことに注意してください。λλ\lambdaS2S2S_2 代替アプローチは高く評価されます。提供されるアプローチは、待ち行列理論と確率論的プロセスを学習するときに一般的に使用されます。 指数分布はガンマ分布の特殊なケースであることを思い出してください(形状パラメーター)。適用できるこちらのより一般的なバージョンがあることを知りました。111

1
共分散行列、相関行列、および/またはそれらの逆行列の行列式には、有用な解釈がありますか?
数年前にVBとT-SQLで共分散行列と相関行列、およびそれらの逆行列を計算する方法を学びながら、さまざまなエントリに、適切なデータマイニングシナリオで役立つような興味深いプロパティがあることを知りました。1つの明白な例は、共分散行列の対角線上の分散の存在です。私がまだ使用していないが、ある時点で役立つ可能性のあるいくつかのそれほど明白ではない例は、逆相関行列の分散インフレ係数と逆共分散行列の部分相関です。 ただし、文献で直接取り上げられていないのは、これらの行列の行列式を解釈する方法です。行列式は他の種類の行列に対しても頻繁に計算されるため、行列に関する多くの情報が見つかると予想していましたが、StackExchangeフォーラムと他のインターネットの両方のカジュアルな検索ではほとんど結果を出せませんでした。私が遭遇したほとんどの言及は、主成分分析(PCA)やホテリングの検定など、他の統計検定やアルゴリズムを計算するプロセスの単一ステップとして行列式を使用することに関係しています。単独でこれらの決定要因を解釈する方法に直接対処するものはありません。それらがデータマイニングに関する文献で頻繁に議論されない実際的な理由はありますか?さらに重要なことには、それらは、スタンドアロンの方法で有用な情報を提供しますか?その場合、それぞれの決定要因をどのように解釈できますか?私は行列式が線形変換によって誘発される符号付きボリュームの一種であることを理解しているので、これらの特定の行列式の行列式は、セット全体にわたる共分散や相関などのある種の体積測定を意味するのではないかと疑います( 2つの属性または変数間の通常の共分散および相関とは対照的に)。それはまた、それらの逆がどのようなボリュームを表すかという疑問を投げかけます。私はこのトピックや、さらに推測するのに必要な重い行列の計算についてはあまり詳しくありませんが、4種類すべての行列とその行列式をコーディングすることができます。私の質問は迫っていません、しかし、長期的には、これらのマトリックスとその決定要因を探索的データマイニングプロセスに定期的に含めることの価値があるかどうかを判断する必要があります。これらの特定の言語では、1対1の2変量の方法で共分散と相関を計算する方が安くなりますが、費用を正当化するより深い洞察を導き出すことができれば、余計なことをせずに行列式計算を実装します。プログラミングリソース。前もって感謝します。プログラミングリソースの観点から費用を正当化するより深い洞察を引き出すことができる場合は、さらに一歩進んで行列式計算を実装します。前もって感謝します。プログラミングリソースの観点から費用を正当化するより深い洞察を引き出すことができる場合は、さらに一歩進んで行列式計算を実装します。前もって感謝します。

2
してみましょう
私は現在、線形モデル理論について自己学習しています。驚くべきことの1つは、E [ Y ]E[Y]\mathbb{E}[\mathbf{Y}]はランダムベクトルに対して定義されてY = ⎡⎣⎢⎢⎢⎢y1y2⋮yん⎤⎦⎥⎥⎥⎥Y=[y1y2⋮yn]\mathbf{Y} = \begin{bmatrix} y_1 \\ y_2 \\ \vdots \\ y_n\end{bmatrix}いますが、それ以上のモーメントについての言及がないことです。共分散行列のほかに。 グーグル検索はあまり現れていない。あるkkk番目の(生)の瞬間YY\mathbf{Y}考えられ、または私が知らない別のアイデアはありますか? 複雑な質問に対する平面の回答のテキストから学習しています(目次はリンクファイルの17ページから始まります)。「と考え、」によって私が意味されているようなものがE [ Yk]E[Yk]\mathbb{E}\left[\mathbf{Y}^k\right]、そうであれば、どのような概念を定義するのでしょうか?私が持っている本は最初の生の瞬間のみをカバーしていますが、一変量確率での私の経験を考えると、を定義する方法に言及がないことや、それを定義するE [ Yk]E[Yk]\mathbb{E}\left[\mathbf{Y}^k\right]専門知識がないことは少し不思議です。 さらに、が定義されていない場合、私が知らない関連する概念が代わりに使用されているのでしょうか?E [ Yk]E[Yk]\mathbb{E}\left[\mathbf{Y}^k\right]

2
二次形式の分布に関する証明への奇妙な一歩
次の定理は、Hogg、Craig、Mckeanによる「Introduction to Mathematical Statistics」の第7版からのものであり、正規変数の2つの2次形式の独立性に必要かつ十分な条件に関するものです。 これはかなり長い抜粋ですが、私がいくつかの助けに感謝するのは9.9.6から9.9.7への移行のみです。以前の結果が暗黙的に使用された場合の全体像を示すために、前の手順を含めました。9.9.6と9.9.7が同等の表現である理由を教えてください。自分で9.9.7を導出しようとしましたが、すべての試みはフラストレーションに終わりました。 その後も証明は続きますが他に問題はありません。前もって感謝します。

1
線形判別分析
James、Witten、Hastie、Tibshiraniによる「統計学習入門」を勉強しています。 彼らの本の139ページで、彼らはベイズの定理紹介することから始めました。は数学定数ではありませんが、事前確率を示します。この方程式には何も奇妙なことはありません。pk(X)=P(Y=k|X=x)=πkfk(x)∑kl=1πlfl(x)pk(X)=P(Y=k|X=x)=πkfk(x)∑l=1kπlfl(x)p_k(X)=P(Y=k|X=x) = \dfrac{\pi_kf_k(x)}{\sum_{l=1}^k \pi_l f_l(x)}ππ\pi この本は、上記の方程式に組み込むことができる推定値を取得したいと主張しています。を推定するために、それが正常であると想定しています。1次元設定では、、ここでとは番目のクラスの平均と分散です。これは、想定された。(私は最後のステートメントから混乱し始めました。)fk(x)fk(x)f_k(x)fk(x)fk(x)f_k(x)fk(x)=12π−−√σexp(−12σ2(x−μk)2)fk(x)=12πσexp⁡(−12σ2(x−μk)2)f_k(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\exp(-\dfrac{1}{2\sigma^2}(x-\mu_k)^2)μkμk\mu_kσ2kσk2\sigma^2_kkkkσ21=σ22=⋯=σ2Kσ12=σ22=⋯=σK2\sigma^2_1 = \sigma^2_2 = \cdots = \sigma^2_K をにプラグ、これはかなり厄介な方程式(1)になります。fkfkf_kpxpxp_x px(k)=πk12π√σexp(−12σ2(x−μk)2)∑Kl=1πl12π√σexp(−12σ2(x−μl)2).px(k)=πk12πσexp⁡(−12σ2(x−μk)2)∑l=1Kπl12πσexp⁡(−12σ2(x−μl)2).p_x(k)=\dfrac{\pi_k \frac{1}{\sqrt{2\pi}\sigma}\exp(-\frac{1}{2\sigma^2}(x-\mu_k)^2)}{\sum_{l=1}^K \pi_l \frac{1}{\sqrt{2\pi}\sigma}\exp(-\frac{1}{2\sigma^2}(x-\mu_l)^2)}. 繰り返しになりますが、これは単なる置換であるため、ここでの驚きはありません。 ベイズ分類器は、方程式(1)が最大であるクラスに観測値を割り当てることを含みます。式(1)の対数を取り、項を並べ替えると、これが次の値が最大であるクラスに観測値を割り当てることと同等であることを示すことは難しくありません。 δk(x)=x⋅μkσ2−μ2k2σ2+log(πk)δk(x)=x⋅μkσ2−μk22σ2+log⁡(πk)\delta_k(x)=x \cdot \dfrac{\mu_k}{\sigma^2} - \dfrac{\mu_k^2}{2\sigma^2} + \log(\pi_k) 質問:これがどこから来たのか、そしてそれが何を意味するのかわかりません。方程式の対数を作ってみましたが、これにはなりません。これは最大の観測であるため、ここのどこかで導関数を使用していますか?

1
ベイジアン95%予測区間の解釈
次の二変量回帰モデルを仮定 IIDであるのために。U 、I N (0 、σ 2 = 9 )I = 1 、... 、n個y私= βバツ私+ u私、yi=βxi+ui, y_i = \beta x_i + u_i, あなた私uiu_iN(0 、σ2= 9 )N(0,σ2=9)N(0, \sigma^2 = 9)i = 1 、… 、ni=1,…,ni = 1,\ldots, n noninformative前想定、のための事後PDFことを示すことができるである ここでβ P (β | Y)= (18 π )- 1p (β)∝ 定数p(β)∝constantp(\beta) \propto \text{constant}ββ\beta …

1
十分な統計を完了する
最近、統計的推論の研究を始めました。私はさまざまな問題に取り組んできましたが、これは完全に困惑しています。 ましょうX1,…,XnX1,…,XnX_1,\dots,X_nその確率で割り当てる離散分布からのランダムサンプルである1313\frac{1}{3}値はθ−1, θ, or θ+1θ−1, θ, or θ+1\theta-1,\space\theta,\space\text{or}\space\theta+1、θθ\theta整数です。完全に十分な統計が存在しないことを示します。 何か案は?

4
ベイズ分類器の誤差を分析的に計算する
2つのクラスとw 2が既知のパラメーター(それらの平均として、と、はそれらの共分散)を持つ正規分布を持っている場合、それらのベイズ分類器の誤差を理論的にどのように計算できますか?w1w1w_1w2w2w_2M 2 Σ 1 Σ 2M1M1M_1M2M2M_2Σ1Σ1\Sigma_1Σ2Σ2\Sigma_2 また、変数がN次元空間にあるとします。 注:この質問のコピーはhttps://math.stackexchange.com/q/11891/4051からも入手できますが、未回答です。これらの質問のいずれかが回答されると、他の質問は削除されます。



弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.