タグ付けされた質問 「mathematical-statistics」

形式的な定義と一般的な結果に関係する統計の数学的理論。

2
ボンフェローニ修正は、いくつかの依存する仮説に対しては保守的すぎませんか?
ボンフェローニ修正は従属仮説にも有効であることをよく読みます。しかし、私はそれが真実だとは思わず、反例があります。誰かが私に(a)私の間違いがどこにあるか、または(b)私がこれについて正しいかどうかを教えてもらえますか? カウンターサンプルの設定 2つの仮説をテストするとします。LET最初の仮説が偽とであるそうでありません。同様に定義します。ましょう二つの仮説に関連したp値であるとしましょう表す括弧の中指定されたセットの指標関数。H1=0H1=0H_{1}=0H1=1H1=1H_{1}=1H2H2H_{2}p1,p2p1,p2p_{1},p_{2}[[⋅]][[⋅]][\![\cdot]\!] 固定されたように定義します これは明らかに確率密度ですオーバー。これは2つの密度のプロットですθ∈[0,1]θ∈[0,1]\theta\in [0,1]P(p1,p2|H1=0,H2=0)P(p1,p2|H1=0,H2=1)===12θ[[0≤p1≤θ]]+12θ[[0≤p2≤θ]]P(p1,p2|H1=1,H2=0)1(1−θ)2[[θ≤p1≤1]]⋅[[θ≤p2≤1]]P(p1,p2|H1=0,H2=0)=12θ[[0≤p1≤θ]]+12θ[[0≤p2≤θ]]P(p1,p2|H1=0,H2=1)=P(p1,p2|H1=1,H2=0)=1(1−θ)2[[θ≤p1≤1]]⋅[[θ≤p2≤1]]\begin{eqnarray*} P\left(p_{1},p_{2}|H_{1}=0,H_{2}=0\right) & = & \frac{1}{2\theta}[\![0\le p_{1}\le\theta]\!]+\frac{1}{2\theta}[\![0\le p_{2}\le\theta]\!]\\ P\left(p_{1},p_{2}|H_{1}=0,H_{2}=1\right) & = & P\left(p_{1},p_{2}|H_{1}=1,H_{2}=0\right)\\ & = & \frac{1}{\left(1-\theta\right)^{2}}[\![\theta\le p_{1}\le1]\!]\cdot[\![\theta\le p_{2}\le1]\!] \end{eqnarray*}[0,1]2[0,1]2[0,1]^{2} により、 と同様に。P(p1|H1=0,H2=0)P(p1|H1=0,H2=1)==12θ[[0≤p1≤θ]]+121(1−θ)[[θ≤p1≤1]]P(p1|H1=0,H2=0)=12θ[[0≤p1≤θ]]+12P(p1|H1=0,H2=1)=1(1−θ)[[θ≤p1≤1]]\begin{eqnarray*} P\left(p_{1}|H_{1}=0,H_{2}=0\right) & = & \frac{1}{2\theta}[\![0\le p_{1}\le\theta]\!]+\frac{1}{2}\\ P\left(p_{1}|H_{1}=0,H_{2}=1\right) & = & \frac{1}{\left(1-\theta\right)}[\![\theta\le p_{1}\le1]\!] \end{eqnarray*}p2p2p_{2} さらに、 これは、 P(H2=0|H1=0)P(H2=1|H1=0)==P(H1=0|H2=0)=2θ1+θP(H1=1|H2=0)=1−θ1+θ.P(H2=0|H1=0)=P(H1=0|H2=0)=2θ1+θP(H2=1|H1=0)=P(H1=1|H2=0)=1−θ1+θ.\begin{eqnarray*} P\left(H_{2}=0|H_{1}=0\right) & = & P\left(H_{1}=0|H_{2}=0\right)=\frac{2\theta}{1+\theta}\\ P\left(H_{2}=1|H_{1}=0\right) & …

4
構成された分布の尖度
下の画像を見てください。青い線は標準の標準PDFを示します。赤いゾーンは灰色の領域の合計に等しいはずです(ひどい描画では申し訳ありません)。 グレイゾーンを通常のpdfの上部(レッドゾーン)にシフトすることで、より高いピークを持つ新しい分布を作成できるでしょうか。 そのような変換を行うことができる場合、この新しい分布の尖度についてどう思いますか?Leptokurtic?しかし、それは正規分布と同じ尾を持っています!未定義?

3
演習を伴う数学的多変量統計の推奨事項
私自身を強化するために、多変量解析と推論に関する大学院レベルの数学的に厳密な教科書が必要です。Elements of Statistical Learningを読んで問題を解決してきましたが、他の焦点を絞った本が必要です。有名な分布(ウィシャート、ウィルクスラムダなど)、仮説検定、推定に関する理論(点、間隔)、およびその他の最新の資料などのトピックを歓迎します。私はこの質問をチェックしましたが、OPは彼の心理分析に役立つ何かを探していました。現在、私は多変量統計分析入門を持っているので、この本とその演習についてのコメントも聞きたいです。ありがとうございました。

1
偏りがなく制限のある推定量を持つことは可能ですか?
間にあるパラメータがあります。実験を実行してを取得できるとします 。ここで、は標準ガウスです。私が必要なのは、1)偏りのない2)ほぼ確実に境界がある推定です。要件(2)は私にとって重要です。θθ\theta[0,1][0,1][0,1]θ^=θ+wθ^=θ+w\hat{\theta} = \theta + wwwwθθ\theta 行うべき自然な考え方は、を設定する新しい推定量を作成することですθ^θ^\hat{\theta}111、それが上にある場合は111とする000それが以下であれば000。しかし、その後、推定量は偏りがありません。だから私は何をすべきですか? 正式に、問題は、関数が存在するか否かであるf:R→Rf:R→Rf: \mathbb{R} \rightarrow \mathbb{R}ようにf(θ^)f(θ^)f(\hat \theta)を満たす(1)及び(2)上記。さらに、複数のサンプルを描画した場合、状況は異なりますか?

3
一貫性に必要な十分な条件の反例
推定量がthetaの不偏推定量であり、nが無限大になる傾向があるため、その分散が0になる傾向がある場合、それはthetaの一貫した推定量であることがわかります。しかし、これは十分であり、必要条件ではありません。一貫しているが、nが無限大になる傾向があるため、分散が0になる傾向のない推定量の例を探しています。助言がありますか?

3
SPSSを使用した2x3混合設計ANOVAの事後テスト?
実験中に3回評価された10人の参加者の2つのグループがあります。グループ間および3つの評価全体の違いをテストするために、group(コントロール、実験)、time(最初、2、3)、およびを使用して2x3混合設計ANOVAを実行しましたgroup x time。両方timeとgroup有意な相互作用があったほか、重大な結果group x time。 グループメンバーシップに関しても、3回の評価の違いをさらにチェックする方法をよく知りません。実際、最初は、ANOVAのオプションで、ボンフェローニの補正を使用してすべての主要な効果を比較することだけを指定しました。しかし、この方法で、グループを区別せずに、サンプル全体の時間の違いをこのように比較したことに気付きましたね。 したがって、可能な解決策を見つけるためにインターネットでたくさん検索しましたが、結果はほとんどありませんでした。私と同じようなケースは2つしか見つかりませんでしたが、解決策は逆です! 記事では、混合設計の後、著者らは被験者ごとに1つずつ、2回の反復測定ANOVAを事後的に実行しました。このようにして、2つのグループは修正なしで個別に分析されます。 インターネットのガイドでは、混合ANOVAの実行中に、SPSS構文のCOMPARE(time) ADJ(BONFERRONI)直後にを手動で追加すると述べています/EMMEANS=TABLES(newgroup*time)。このように、3つの時間はグループごとに個別に比較されます。ボンフェローニ補正を使用すると、私は正しいのでしょうか。 どう思いますか?どちらが正しい方法でしょうか?
8 anova  mixed-model  spss  post-hoc  bonferroni  time-series  unevenly-spaced-time-series  classification  normal-distribution  discriminant-analysis  probability  normal-distribution  estimation  sampling  classification  svm  terminology  pivot-table  random-generation  self-study  estimation  sampling  estimation  categorical-data  maximum-likelihood  excel  least-squares  instrumental-variables  2sls  total-least-squares  correlation  self-study  variance  unbiased-estimator  bayesian  mixed-model  ancova  statistical-significance  references  p-value  fishers-exact  probability  monte-carlo  particle-filter  logistic  predictive-models  modeling  interaction  survey  hypothesis-testing  multiple-regression  regression  variance  data-transformation  residuals  minitab  r  time-series  forecasting  arima  garch  correlation  estimation  least-squares  bias  pca  predictive-models  genetics  sem  partial-least-squares  nonparametric  ordinal-data  wilcoxon-mann-whitney  bonferroni  wilcoxon-signed-rank  traminer  regression  econometrics  standard-error  robust  misspecification  r  probability  logistic  generalized-linear-model  r-squared  effect-size  gee  ordered-logit  bayesian  classification  svm  kernel-trick  nonlinear  bayesian  pca  dimensionality-reduction  eigenvalues  probability  distributions  mathematical-statistics  estimation  nonparametric  kernel-smoothing  expected-value  filter  mse  time-series  correlation  data-visualization  clustering  estimation  predictive-models  recommender-system  sparse  hypothesis-testing  data-transformation  parametric  probability  summations  correlation  pearson-r  spearman-rho  bayesian  replicability  dimensionality-reduction  discriminant-analysis  outliers  weka 

1
統計理論と決定理論の関係は何ですか?
統計と決定理論はどのように関連しているのだろうと思っていましたか? それは私にすべての統計問題/タスクが決定理論で定式化できるように見えます。また、意思決定理論の問題は、統計/確率問題、または決定論的な方法で定式化できます。統計学は意思決定理論で研究された問題の一部に過ぎないのでしょうか? または、それらは重複している2つの理論にすぎず、どちらも完全に他方の中に収まらないのですか? しかし、統計学の理論と決定論がそれぞれどのようなトピックでカバーされているかについて体系的な全体像を持っているわけではないことを認めざるを得ません。 よろしくお願いします!

2
回帰分析で多項式の次数を見つける
私は機械学習プロジェクトに取り組んでおり、データの曲線を当てはめようとしています。残念ながら、日付の特徴ベクトルはやや高くなっています。そのため、2Dまたは3D空間に実際にプロットして、データの形状がどのように見えるかを推測することはできません。 したがって、ヒットとトライアル以外に、私のデータに最適な多項式の次数を見つけるための数学的な方法はありますか? つまり、各次数の最小二乗誤差を調べて、最小の誤差を持つ誤差を選択できることを知っていますが、最初の最適化ループは、データに適合する曲線、2番目のループは次数のチェックに使用されます。助言がありますか?


1
以前の選択でベイズ推定量ではない許容可能な推定量を持つモデル?
私の知る限り、すべてのベイズ推定量は許容されます。(関連質問- 1、2。)私は私の教授が講義中に一度触れて思い出しラフ直感として、少なくとも、逆はすべての許容推定器は、前のいくつかの選択のためのベイズ推定量である、である、としても真である、ということ。彼は「例外がある」または「規則的な条件が必要である」という線に沿って何かを言いました。 質問:誰かが次のことについて何か知っていますか? 逆に必要な規則性条件はどれですか。すべての許容可能な推定量は、保持するための以前のベイズ推定量です。 および/または統計モデルの(良い)反例が存在している(合理的)許容推定器はありませんのためにベイズ推定任意の前の選択? 私の推測では、特にクロムウェルの法則に違反する以前のものが「効果的なモデルサイズ」を人為的に縮小することはよく知られているため、反例はクロムウェルの法則と関係がある可能性があります。したがって、何らかの理由ですべての事前分布がクロムウェルの規則に違反しなければならないモデルがある場合、(妥当な)反例が存在する可能性があると考えられます。 宿題の問題として、私たちは非常に限られたケースでこの逆を証明しなければなりませんでした:クロムウェルのルールに違反していない事前確率と、有限のパラメーター空間。有限パラメータ空間への制限は必須ではなかったと思いますが、コースの前提条件として機能解析がリストされていなかったため、無限次元のベクトル空間で凸解析を行う必要をなくすためだけです。とは言っても、すべての無限次元ベクトル空間が凸分析の一般化が適用されるバナッハ空間であるとは限らないため、反例が存在することを期待することもできますが、それらが存在する場合は、無限のパラメーター空間があることも期待します。 編集:この回答に基づいて、私が持っている別の推測は、すべての事前分布が何らかの理由で無限のベイズリスクを持っているモデル(おそらくコーシーモデル)の反例が存在する可能性があることです。

1
示す場合」sは独立していると場合
ましょう独立ランダム変数です。Xi∼Gamma(α,pi),i=1,2,...,n+1Xi∼Gamma(α,pi),i=1,2,...,n+1X_i\sim\text{Gamma}(\alpha,p_i),i=1,2,...,n+1 定義と。次に、が独立して分布していることを示します。Z1=∑n+1i=1XiZ1=∑i=1n+1XiZ_1=\sum_{i=1}^{n+1}X_iZi=Xi∑ij=1Xj,i=2,3,...,n+1Zi=Xi∑j=1iXj,i=2,3,...,n+1Z_i=\frac{X_i}{\sum_{j=1}^iX_j},\quad i=2,3,...,n+1Z1,Z2,...,Zn+1Z1,Z2,...,Zn+1Z_1,Z_2,...,Z_{n+1} の結合密度は、(X1,...,Xn+1)(X1,...,Xn+1)(X_1,...,X_{n+1}) fX(x1,...,xn+1)=[α∑n+1i=1pi∏n+1i=1Γ(pi)exp(−α∑i=1n+1xi)∏i=1n+1xpi−1i]Ixi>0,α>0,pi>0fX(x1,...,xn+1)=[α∑i=1n+1pi∏i=1n+1Γ(pi)exp⁡(−α∑i=1n+1xi)∏i=1n+1xipi−1]Ixi>0,α>0,pi>0f_{\bf X}(x_1,...,x_{n+1})=\left[\frac{\alpha^{\sum_{i=1}^{n+1}p_i}}{\prod_{i=1}^{n+1}\Gamma(p_i)}\exp\left(-\alpha\sum_{i=1}^{n+1}x_i\right)\prod_{i=1}^{n+1}x_i^{p_i-1}\right]\mathbf I_{x_i>0}\quad,\alpha>0,p_i>0 我々変換、その結果X=(X1,⋯,Xn+1)↦Z=(Z1,⋯,Zn+1)X=(X1,⋯,Xn+1)↦Z=(Z1,⋯,Zn+1)\mathbf X=(X_1,\cdots,X_{n+1})\mapsto\mathbf Z=(Z_1,\cdots,Z_{n+1}) Z1=∑n+1i=1XiZ1=∑i=1n+1XiZ_1=\sum_{i=1}^{n+1}X_iおよびZi=Xi∑ij=1Xj,i=2,3,...,n+1Zi=Xi∑j=1iXj,i=2,3,...,n+1Z_i=\frac{X_i}{\sum_{j=1}^iX_j},\quad i=2,3,...,n+1 ⟹xn+1=z1zn+1,⟹xn+1=z1zn+1,\implies x_{n+1}=z_1z_{n+1}, xn=z1zn(1−zn+1),xn=z1zn(1−zn+1),\qquad x_n=z_1z_n(1-z_{n+1}), xn−1=z1zn−1(1−zn)(1−xn+1),xn−1=z1zn−1(1−zn)(1−xn+1),\qquad x_{n-1}=z_1z_{n-1}(1-z_n)(1-x_{n+1}), ⋮⋮\qquad\vdots x3=z1z3∏n+1j=4(1−zj)x3=z1z3∏j=4n+1(1−zj)\qquad x_3=z_1z_3\prod_{j=4}^{n+1}(1-z_j) x2=z1z2∏n+1j=3(1−zj)x2=z1z2∏j=3n+1(1−zj)\qquad x_2=z_1z_2\prod_{j=3}^{n+1}(1-z_j) x1=z1∏n+1j=2(1−zj)x1=z1∏j=2n+1(1−zj)\qquad x_1=z_1\prod_{j=2}^{n+1}(1-z_j)、ここでおよび0<z1<∞0<z1<∞00および(。pi>0pi>0p_i>0i=1,2,...,n+1i=1,2,...,n+1i=1,2,...,n+1 言うまでもなく、逆解見つけてヤコビアンを評価するのは面倒で時間がかかりました。仕事をでなく、の分布も決定します。xixix_iZiZiZ_i の独立性を示す簡単な方法はありますか?ZiZiZ_i

2
PCA固有ベクトルが直交している理由と、PCAスコアとの相関関係は何ですか?
私はPCAについて読んでいますが、固有ベクトルは直交である必要があるという前提と、相関関係のない投影(PCAスコア)との関係を除いて、派生に関して何が起こっているのかを理解していますか?以下に、直交性と相関関係のリンクを使用する2つの説明がありますが、実際には説明できません:ONE、TWO。 2番目の図では 、投影がと無相関になるように、条件が課されていることをます。直交ベクトルが無相関変数を保証する理由を示す例を誰かが提供できますか?aT2a1=0a2Ta1=0a_{2}^{T}a_{1}=0y2=Xa2y2=Xa2y_{2}=Xa_2y1=Xa1y1=Xa1y_{1}=Xa_1 直交していないベクトルを選択した場合、PCAで何が起こりますか。これは可能ですか?直交性は、共分散行列が対称的であることの副産物であることを別の場所で読んだことがあります。これは、非ペアワイズ直交固有ベクトルを持つことが不可能であることを示唆します。ただし、最も「適切な」行列を探す最初の図では、を直交に選択して、より便利な行列選択しているように見えます。素敵な特性を持っています。p1,…,pmp1,…,pmp_{1},\ldots,p_{m}PP\textbf{P} 私はこのトピックに関する他の投稿を読みましたが、無相関変数による直感の組み込みには満足できません。私はこの混乱を理解する助けを本当に感謝します!!

2
2つのiid非中心スチューデントt変量の差の分布は何ですか
ましょうと IID非中央t確率変数です。バツ1X1X_1バツ2X2X_2 分布はどうなっていますか?バツ1−バツ2X1−X2X_1 - X_2 つまり、2つのiid非中心スチューデントt変量の差の分布は何ですか? がまたは観測された推定値であるとすると、コードでは、の尤度関数は次のようになります。dddバツ1X1X1バツ2X2X2Rddd likelihood = function(x) dt(d*sqrt(N), df, ncp = x*sqrt(N)) どこd = an observed estimate of X1 or X2、x = parameter range (-Inf to Inf)、N = sample size、とdf = N - 1。 PS dt(x,df,ncp)は非中心t分布の確率密度ncp関数で、3番目の引数は非中心性パラメーターです。


1
ベータ母集団のサンプル範囲の分布を見つける
レッツ密度を有するランダム変数をIIDしますX1,X2,…,XnX1,X2,…,XnX_1,X_2,\ldots,X_n f(x)=2(1−x)10&lt;x&lt;1f(x)=2(1−x)10&lt;x&lt;1f(x)=2(1-x)\mathbf1_{0<x<1} サンプル範囲の分布を導き出そうとしています。R=X(n)−X(1)R=X(n)−X(1)R=X_{(n)}-X_{(1)} 私がこれらの問題を行う通常の方法は、最初にを取るの結合密度を見つけ、次に限界密度としての分布を見つけることです。の共同分布を知っているので、これは一般に非常に簡単です。ただし、この特定の問題では、マージナルPDFを見つけるための統合は、手作業で評価するのがかなり面倒です。(R,S)(R,S)(R,S)S=X(1)S=X(1)S=X_{(1)}RRR(X(1),X(n))(X(1),X(n))(X_{(1)},X_{(n)}) 絶対連続分布の場合、変数の変化を介して、結合密度が次の式で与えられることが簡単に示されます。(R,S)(R,S)(R,S) fR,S(r,s)=n(n−1)(F(r+s)−F(s))n−2f(s)f(r+s)1s&lt;r+sfR,S(r,s)=n(n−1)(F(r+s)−F(s))n−2f(s)f(r+s)1s&lt;r+sf_{R,S}(r,s)=n(n-1)(F(r+s)-F(s))^{n-2}f(s)f(r+s)\mathbf1_{s<r+s} ここで、は人口分布関数です。FFF だからここに私は単純化した後 fR,S(r,s)=4n(n−1)(r(2−2s−r))n−2(1−s)(1−r−s)10&lt;s&lt;r+s&lt;1fR,S(r,s)=4n(n−1)(r(2−2s−r))n−2(1−s)(1−r−s)10&lt;s&lt;r+s&lt;1f_{R,S}(r,s)=4n(n-1)(r(2-2s-r))^{n-2}(1-s)(1-r-s)\mathbf1_{0<s<r+s<1} 手段のPDFその用あるべきですRRR0&lt;r&lt;10&lt;r&lt;10<r<1 fR(r)=∫1−r0fR,S(r,s)ds=4n(n−1)rn−2∫1−r0(2−2s−r)n−2(1−s)(1−r−s)dsfR(r)=∫01−rfR,S(r,s)ds=4n(n−1)rn−2∫01−r(2−2s−r)n−2(1−s)(1−r−s)ds\begin{align} f_R(r)&=\int_0^{1-r}f_{R,S}(r,s)\,ds \\&=4n(n-1)r^{n-2}\int_0^{1-r}(2-2s-r)^{n-2}(1-s)(1-r-s)\,ds \end{align} 今度は、部品統合しますI=∫1−r0(2−2s−r)n−2(1−s)(1−r−s)dsI=∫01−r(2−2s−r)n−2(1−s)(1−r−s)dsI=\int_0^{1-r}(2-2s-r)^{n-2}(1-s)(1-r-s)\,ds その指摘 d[(1−s)(1−r−s)]=(2s+r−2)dsd[(1−s)(1−r−s)]=(2s+r−2)dsd\,[(1-s)(1-r-s)]=(2s+r-2)\,ds 詳細をスキップして、 I=[(1−s)(1−r−s)(2−2s−r)n−12(1−n)]1−r0+∫1−r0(2−2s−r)n2(1−n)ds=(r−1)(2−r)n−12(1−n)−14(1−n)∫r2−rtndt=(r−1)(2−r)n−12(1−n)+14(n2−1)[rn+1−(2−r)n+1]I=[(1−s)(1−r−s)(2−2s−r)n−12(1−n)]01−r+∫01−r(2−2s−r)n2(1−n)ds=(r−1)(2−r)n−12(1−n)−14(1−n)∫2−rrtndt=(r−1)(2−r)n−12(1−n)+14(n2−1)[rn+1−(2−r)n+1]\begin{align} I&=\left[(1-s)(1-r-s)\frac{(2-2s-r)^{n-1}}{2(1-n)}\right]_0^{1-r}+\int_0^{1-r}\frac{(2-2s-r)^n}{2(1-n)}\,ds \\\\&=\frac{(r-1)(2-r)^{n-1}}{2(1-n)}-\frac{1}{4(1-n)}\int_{2-r}^{r}t^n\,dt \\\\&=\frac{(r-1)(2-r)^{n-1}}{2(1-n)}+\frac{1}{4(n^2-1)}\left[r^{n+1}-(2-r)^{n+1}\right] \end{align} それはそうではないかもしれませんが、これを手作業で行い、すべてのステップを書き留めるには、かなりの時間がかかりました。 最後に、私はのPDFファイルを取得などをRRR fR(r)=4n(n−1)rn−2[(r−1)(2−r)n−12(1−n)+14(n2−1){rn+1−(2−r)n+1}]10&lt;r&lt;1fR(r)=4n(n−1)rn−2[(r−1)(2−r)n−12(1−n)+14(n2−1){rn+1−(2−r)n+1}]10&lt;r&lt;1f_R(r)=4n(n-1)r^{n-2}\left[\frac{(r-1)(2-r)^{n-1}}{2(1-n)}+\frac{1}{4(n^2-1)}\left\{r^{n+1}-(2-r)^{n+1}\right\}\right]\mathbf1_{0<r<1} 正直なところ、面倒な計算の後で、これが統合されているかどうかを確認する必要があるかどうかはわかりません(ソフトウェアを使用せずに)。したがって、この答えが意味を成すかどうかはわかりません。111 問題を解決するための代替手順、およびおそらくより効率的な方法について知りたいのですが。CDFメソッドでもほぼ同じ複雑さになると思います。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.