タグ付けされた質問 「mathematical-statistics」

形式的な定義と一般的な結果に関係する統計の数学的理論。

2
IRTモデルとロジスティック回帰モデルの類似点と相違点
これらの両方のような基本的な類似性にもかかわらず、応答変数を直接モデル化するのではなく、成功の確率をモデル化します。これらのモデル間の相違点と類似点を指摘する、より信頼できる答えがあると思います。 1つの違いは、ロジスティックでは、異なるタイプと異なる数の独立変数を使用できることです。一方、IRTモデルでは、能力である独立変数は1つだけです。 もう1つの類似性:ロジスティックのパラメーターを推定するには、最尤法を使用します。IRTでは、パラメーター推定手法の1つとして限界最尤も使用します。 では、これら2つのモデルの統計的/数学的な違いを誰かに説明していただけますか?

2
ガウス確率変数の最大値の分散
ランダム変数からサンプリングされた、定義します X1,X2,⋯,XnX1,X2,⋯,XnX_1,X_2, \cdots, X_n∼N(0,σ2)∼N(0,σ2)\sim \mathcal{N}(0, \sigma^2)Z=maxi∈{1,2,⋯,n}XiZ=maxi∈{1,2,⋯,n}XiZ = \max_{i \in \{1,2,\cdots, n \}} X_i 我々は、そのE[Z]≤σ2logn−−−−−√E[Z]≤σ2log⁡n\mathbb{E}[Z] \le \sigma \sqrt{2 \log n}。\ text {Var}(Z)に上限/下限があるかどうか疑問に思っていましたかVar(Z)Var(Z)\text{Var}(Z)?

1
位置/スケール/形状パラメータの数学的定義は何ですか?
場所/スケール/形状パラメータの正確な定義を理解しようとしています(たとえばパレートタイプIでは、は形状パラメータと呼ばれ、はスケールパラメータです)。しかし、私が参照した本(Cambridge Dictionary of Statistics、HMC's Introduction to Mathematical Statistics、Feller's An Introduction to Probability Theory and its Applicationsなど)のみが、これらのパラメータの説明的な定義を提供しているようです(ロケーションパラメータは、Fellerのセンタリングパラメータと呼ばれています) )。ウィキペディアは、cdfとpdfの観点から定義を提供しましたが、ソースは提供されていません。caaaccc 非パラメトリック統計(HMCのCh.10など)の概念に基づいて、位置/スケール/形状パラメーターは次のように定義できると思います。 レッツ累積分布関数と確率変数。Aパラメーター、あれば機能的であるが、位置パラメータであるあり、場合はスケールパラメータですであり、位置でもスケールでもない場合は、形状パラメータです。F X θ = T (F X)T T (F X +)XXXFXFXF_Xθ=T(FX)θ=T(FX)\theta=T(F_X)TTTT (F a X)T(FX+a)T(FaX)=T(FX)+a,=aT(FX),∀a∈R,∀a≠0;T(FX+a)=T(FX)+a,∀a∈R,T(FaX)=aT(FX),∀a≠0;\begin{align*}T(F_{X+a})&=T(F_X)+a,&&\forall a\in\mathbb{R},\\ T(F_{aX})&=aT(F_X),&&\forall a\neq0;\end{align*}T(FaX)T(FX+b)T(F−X)=aT(FX),=T(FX),=T(FX);∀a>0,∀b∈R,T(FaX)=aT(FX),∀a>0,T(FX+b)=T(FX),∀b∈R,T(F−X)=T(FX);\begin{align*}T(F_{aX})&=aT(F_X),&&\forall a>0,\\ T(F_{X+b})&=T(F_X),&&\forall b\in\mathbb{R},\\ T(F_{-X})&=T(F_X);\end{align*} 私は正しいですか?または、無関係な概念を混乱させましたか?

4
相関する確率変数の線形結合の分散
私は証拠を理解 しかし、私は、任意の線形結合に一般化を証明するためにどのように理解していません。Va r (a X+ b Y)= a2Va r (X)+ b2Va r (Y)+ 2 a b Co v (X、Y)、Var(aバツ+bY)=a2Var(バツ)+b2Var(Y)+2abCov(バツ、Y)、Var(aX+bY) = a^2Var(X) +b^2Var(Y) + 2abCov(X,Y), ましょうするためのスカラーこと我々はベクトル持っているので、および相関確率変数のベクトルです。次に どのように証明しますか?総和表記とベクトル表記には証明があると思いますか?a私a私a_iI ∈ 1 、... 、n個私∈1、…、んi\in {1,\dots ,n}a––a_\underline aバツ––= X私、… 、Xんバツ_=バツ私、…、バツん\underline X = X_i,\dots ,X_nVar(a1X1+…anXn)=∑i=1na2iσ2i+2∑i=1n∑j>inaiaj Cov(Xi,Xj)Var(a1バツ1+…aんバツん)=Σ私=1んa私2σ私2+2Σ私=1んΣj>私んa私aj Cov(バツ私、バツj) Var(a_1X_1 + \dots a_nX_n) = \sum_{i=1}^n a_i^2 \sigma_i^2 + …

2
二次形式の分布に関する証明への奇妙な一歩
次の定理は、Hogg、Craig、Mckeanによる「Introduction to Mathematical Statistics」の第7版からのものであり、正規変数の2つの2次形式の独立性に必要かつ十分な条件に関するものです。 これはかなり長い抜粋ですが、私がいくつかの助けに感謝するのは9.9.6から9.9.7への移行のみです。以前の結果が暗黙的に使用された場合の全体像を示すために、前の手順を含めました。9.9.6と9.9.7が同等の表現である理由を教えてください。自分で9.9.7を導出しようとしましたが、すべての試みはフラストレーションに終わりました。 その後も証明は続きますが他に問題はありません。前もって感謝します。

1
十分な統計を完了する
最近、統計的推論の研究を始めました。私はさまざまな問題に取り組んできましたが、これは完全に困惑しています。 ましょうX1,…,XnX1,…,XnX_1,\dots,X_nその確率で割り当てる離散分布からのランダムサンプルである1313\frac{1}{3}値はθ−1, θ, or θ+1θ−1, θ, or θ+1\theta-1,\space\theta,\space\text{or}\space\theta+1、θθ\theta整数です。完全に十分な統計が存在しないことを示します。 何か案は?


1
エラスティックネットを書く正しい方法は何ですか?
エラスティックネットの正しい記述方法について混乱しています。いくつかの研究論文を読んだ後、3つの形があるようです 1)exp{ - λ1| βk| - λ2β2k}exp⁡{−λ1|βk|−λ2βk2}\exp\{-\lambda_1|\beta_k|-\lambda_2\beta_k^2\} 2)exp{ − (λ1| βk| + λ2β2k)σ2√}exp⁡{−(λ1|βk|+λ2βk2)σ2}\exp\{-\frac{(\lambda_1|\beta_k|+\lambda_2\beta_k^2)}{\sqrt{\sigma^2}}\} 3)exp{ − (λ1| βk| + λ2β2k)2つのσ2}exp⁡{−(λ1|βk|+λ2βk2)2σ2}\exp\{-\frac{(\lambda_1|\beta_k|+\lambda_2\beta_k^2)}{2\sigma^2}\} を追加する正しい方法がわかりません。上記の表現のいずれかが正しいですか?σ2σ2\sigma^2

2
正規リンク関数にはどのような有用なプロパティがありますか?
そこで、ここでは一般化線形モデルを研究しています。私はこの質問が非常に単純で単純であることを知っていますが、なぜリンク正準関数がそれほど有用であるのか正確にはわかりません。誰かがこの問題について直感を教えてくれませんか?

2
順序統計を与えられた一様確率変数の条件付き期待
仮定X = (X1、。。。、Xん)(X1,...,Xn)(X_1, ..., X_n)〜U(θ 、2 θ )U(θ,2θ)U(\theta, 2\theta)、θ ∈ R+θ∈R+\theta \in \Bbb{R}^+。 どのようにしてE[ X1| バツ(1 )、X(n )]E[X1|X(1),X(n)]E[X_1|X_{(1)},X_{(n)}]、ここでバツ(1 )X(1)X_{(1)}とバツ(n )X(n)X_{(n)}は、それぞれ最小と最大の次数統計ですか? 私の最初の考えは、注文統計が範囲を制限するため、それは単に(X(1 )+ X(n ))/ 2(X(1)+X(n))/2(X_{(1)}+X_{(n)})/2であると考えられますが、これが正しいかどうかはわかりません!

3
メジャーとして使用された統計は、レポートされた後に無効になりますか?[閉まっている]
休業。この質問には詳細または明確さが必要です。現在、回答を受け付けていません。 この質問を改善してみませんか?この投稿を編集して詳細を追加し、問題を明確にしてください。 2年前休業。 これが間違った場所であるかどうかお詫びします。しかし、私はディレクターに、彼の統計が真実を示さないことを説明しようとしています。彼は統計が報告されているものであり、スタッフが測定されるものであることを要求しているからです。しかし、私の説明は彼には通じません。 昔、名前の付いた法律、理論、またはそのための何かがあったことを読んだことを覚えています。それは完全にそれを説明しましたが、それが何であるか思い出せません。誰か知っていますか? 法の根拠は次のとおりです。レポートされた統計がパフォーマンスの測定基準として使用される場合、人々は統計が何を意味するのかではなく測定に対して正確に見えるようにすることを人々がすぐに習得するため、それらは効果測定ではなくなります。 チームの統計情報の表示方法を変更したい。

1
ポアソン/負の二項式の後の置換ありまたはなしのサンプリングを分析的に解く
短縮版 独立したポアソンドローと、置換の有無にかかわらずさらにサンプリングすることで得られる複合的な可能性を分析的に解決または近似しようとしています(実際にはどちらでもかまいません)。MCMC(Stan)で尤度を使用したいので、定数項までの解だけが必要です。最終的に、私は最初のドローがネガからであるプロセスをモデル化したいと思います。二項分布ですが、ポアソンのケースの解決策でそこに到達できると思います。 解決策が実行不可能である可能性は十分にあります(これが単純な問題か非常に難しい問題かを判断できるほど数学を理解していません)。したがって、問題がおそらく扱いにくい理由(たとえば、既知の困難な問題と比較する)の近似、否定的な結果、または直感にも興味があります。私が前進するのに役立つ有用なペーパー/定理/トリックへのリンクは、目前の問題へのそれらの関係が完全にうまくいかなくても、良い答えです。 公式声明 より正式には、まずY=(y1,...,yN),yn∼Pois(λn)Y=(y1,...,yN),yn∼Pois(λn)Y = (y_1, ..., y_N), y_n \sim Pois(\lambda_n)独立して引き出され、次いでIサンプルの全てからランダムにアイテム得るために。つまり、壷から色のボールを描画します。ここで、色のボールの量はから描画されます。ここで、は既知で固定されていると仮定し、Y Z = (Z 1、。。。、Z N)K N P 、O 、I S (λ N)K Σ N Y N ≥ KkkkYYYZ=(z1,...,zN)Z=(z1,...,zN)Z = (z_1,...,z_N)kkknnnPois(λn)Pois(λn)Pois(\lambda_n)kkk∑nyn≥k∑nyn≥k\sum_n y_n \geq k。技術的にサンプリングは置換なしで行われますが、置換ありのサンプリングを想定することは大したことではありません。 置換なしのサンプリングを解決するために2つの方法を試しましたが(一部の用語がキャンセルされたため、これはより簡単なケースのように思われました)、両方に行き詰まりました。交換せずにサンプリングする場合の可能性は次のとおりです。 P(Z=(z1,...,zN)|Λ=(λ1,...,λN))=∑Y;∀n:yn≥zn(∏Nn=1(ynzn)(∑Nn=1ynk)∏Nn=1Poisson(yn|λn))P(∑nyn≥k|Λ)P(Z=(z1,...,zN)|Λ=(λ1,...,λN))=∑Y;∀n:yn≥zn(∏n=1N(ynzn)(∑n=1Nynk)∏n=1NPoisson(yn|λn))P(∑nyn≥k|Λ) P(Z = (z_1, ..., z_N) | \Lambda = (\lambda_1, ..., \lambda_N)) = \frac{ …

2
漸近推論(大標本理論)における最近の研究と研究範囲は何ですか?
漸近推論/大標本理論の分野で行われている現在の重要な理論的研究は何ですか?現在、この分野の研究範囲はどのようなものですか?理論が最近発展している未解決の問題または特定の領域はありますか?それとも、さらなる発展の余地のない死んだ主題なのでしょうか? だれかが私の質問に答えたり、検索できるソース/リファレンスを提供したりできるとありがたいです。

4
をとして証明する
母集団の平均の信頼区間を含む統計的問題は、次の重み関数の観点から組み立てることができます。 w(α,n)≡tn−1,α/2n−−√for 0&lt;α&lt;1 and n&gt;1.w(α,n)≡tn−1,α/2nfor 0&lt;α&lt;1 and n&gt;1.w(\alpha, n) \equiv \frac{t_{n-1,\alpha/2}}{\sqrt{n}} \quad \quad \quad \quad \text{for } 0<\alpha<1 \text{ and } n > 1. たとえば、無限の超母集団の平均の標準的な古典的なレベルの信頼区間は、次のように書くことができます。1−α1−α1-\alpha CI(1−α)=[x¯n±w(α,n)⋅sn].CI(1−α)=[x¯n±w(α,n)⋅sn].\text{CI}(1-\alpha) = \Bigg[ \bar{x}_n \pm w(\alpha, n) \cdot s_n \Bigg]. 次の関数を使用して、限界および\ lim _ {\ alpha \ uparrow 1} w(\ alpha、n)= 0を確立することは簡単ですT分布。信頼区間のコンテキストでは、これは、信頼レベルを下げると区間が1つのポイントに縮小し、信頼レベルを上げると実際の線全体に拡大することを示しています。保持する必要があるもう1つの直感的なプロパティは、データを取得するにつれて間隔が1つのポイントに縮小することです。つまり、次のことを意味します。limα↓0w(α,n)=∞limα↓0w(α,n)=∞\lim_{\alpha \downarrow 0} w(\alpha, n) …

1
とがPDFでiidである場合の分布
私は次の問題に取り組んでいます: LET及び一般的な密度を有する独立したランダム変数である。してみましょうU = \分(X、Y)とV = \ MAX(X、Y) 。(U、V)の結合密度を求め、したがってU + Vの確率密度関数を求めます。XXXYYYf(x)=αβ−αxα−110&lt;x&lt;βf(x)=αβ−αxα−110&lt;x&lt;βf(x)=\alpha\beta^{-\alpha}x^{\alpha-1}\mathbf1_{0<x<\beta}α⩾1α⩾1\alpha\geqslant1U=min(X,Y)U=min(X,Y)U=\min(X,Y)V=max(X,Y)V=max(X,Y)V=\max(X,Y)(U,V)(U,V)(U,V)U+VU+VU+V U+V=X+YU+V=X+YU+V=X+Y、私は単にのPDFファイルを見つけることができますX+YX+YX+YのPDFものを見るためにU+VU+VU+Vなければなりません。 T = X + Yのpdf T=X+YT=X+YT=X+YがfT(t)=∫f(t−y)f(y)dy=α2β−2α∫min(t,β)max(t−β,0)(y(t−y))α−1dy10&lt;t&lt;2β(1)(1)fT(t)=∫f(t−y)f(y)dy=α2β−2α∫max(t−β,0)min(t,β)(y(t−y))α−1dy10&lt;t&lt;2βf_T(t)=\int f(t-y)f(y)\,\mathrm{d}y=\alpha^2\beta^{-2\alpha}\int_{\max(t-\beta,0)}^{\min(t,\beta)}(y(t-y))^{\alpha-1}\,\mathrm{d}y\,\mathbf1_{0<t<2\beta}\tag{1} ただし、その積分を単純化できるかどうかはわかりません。 実際の質問に戻ってくるの関節PDF (U,V)(U,V)(U,V)によって与えられます。 fU,V(u,v)=2f(u)f(v)10&lt;u&lt;v&lt;β=2α2β−2α(uv)α−110&lt;u&lt;v&lt;βfU,V(u,v)=2f(u)f(v)10&lt;u&lt;v&lt;β=2α2β−2α(uv)α−110&lt;u&lt;v&lt;βf_{U,V}(u,v)=2f(u)f(v)\mathbf1_{0<u<v<\beta}=2\alpha^2\beta^{-2\alpha}(uv)^{\alpha-1}\mathbf1_{0<u<v<\beta} 変数(U,V)→(W,Z)(U,V)→(W,Z)(U,V)\to(W,Z)ましたW=U+VW=U+VW=U+VおよびZ=UZ=UZ=Uです。ヤコビアンの絶対値は1です。また、0&lt;u&lt;v&lt;β⟹0&lt;z&lt;w2&lt;β0&lt;u&lt;v&lt;β⟹0&lt;z&lt;w2&lt;β0<u<v<\beta\implies 0<z<\frac{w}{2}<\betaです。したがって、Wの限界pdf WWWは fW(w)=2α2β−2α∫w/20(z(w−z))α−1dz10&lt;w&lt;2β(2)(2)fW(w)=2α2β−2α∫0w/2(z(w−z))α−1dz10&lt;w&lt;2βf_W(w)=2\alpha^2\beta^{-2\alpha}\int_0^{w/2}(z(w-z))^{\alpha-1}\,\mathrm{dz}\,\mathbf1_{0<w<2\beta}\tag{2} 確率変数の適切なサポートで、いくつかのエラーを犯した可能性があります。また、積分が基本関数の観点から解を持たない可能性もあります。いずれにしても、積分を進めることができませんでした。したがって、がと同じpdf であることを確認することさえできませんでした。と分布が異なるようです。そして、好奇心から、の分布には名前がありますか(その場合、そのような2つの確率変数のたたみ込みを検索したでしょう)。W=U+VW=U+VW=U+VT=X+YT=X+YT=X+YWWWTTTXXX 編集。 手で取得した最後の積分を続行 ∫w/20(z(w−z))α−1dz=w2α−1∫1/20tα−1(1−t)α−1dt=w2α−1I1/2(α,α)B(α,α)∫0w/2(z(w−z))α−1dz=w2α−1∫01/2tα−1(1−t)α−1dt=w2α−1I1/2(α,α)B(α,α)\int_0^{w/2}(z(w-z))^{\alpha-1}\,\mathrm{dz}=w^{2\alpha-1}\int_0^{1/2}t^{\alpha-1}(1-t)^{\alpha-1}\,\mathrm{dt}=w^{2\alpha-1}I_{1/2}(\alpha,\alpha)B(\alpha,\alpha)ここで、は正則化された不完全ベータ関数です。プロパティ、を取得します。最後に、IxIxI_{x}Ix(a,b)=1−I1−x(b,a)Ix(a,b)=1−I1−x(b,a)I_x(a,b)=1-I_{1-x}(b,a)I1/2(α,α)=12I1/2(α,α)=12I_{1/2}(\alpha,\alpha)=\frac{1}{2}∫w/20(z(w−z))α−1dz=12w2α−1B(α,α)∫0w/2(z(w−z))α−1dz=12w2α−1B(α,α)\int_0^{w/2}(z(w-z))^{\alpha-1}\,\mathrm{dz}=\frac{1}{2}w^{2\alpha-1}B(\alpha,\alpha) これは、 fW(w)=α2β−2αB(α,α)w2α−110&lt;w&lt;2βfW(w)=α2β−2αB(α,α)w2α−110&lt;w&lt;2βf_W(w)=\alpha^2\beta^{-2\alpha}B(\alpha,\alpha)w^{2\alpha-1}\mathbf1_{0<w<2\beta} これがの特定の範囲内の密度ではないことは容易にわかります。だから、どこかで大きな間違いをしたような気がします。Mathematicaで計算を確認しましたが、彼らは同意しているようです。www

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.