タグ付けされた質問 「marginal」

周辺分布は、共同分布に含まれる変数のサブセットの確率分布を指します。

2
ランダム効果、固定効果、および限界モデルの違いは何ですか?
統計の知識を広げようとしています。私は物理学のバックグラウンドから来て、統計的テストへの「レシピベース」アプローチを採用しています。 私の読書では、ランダム効果モデル、固定効果モデル、限界モデルという用語に出くわしました。私の質問は: 非常に簡単に言えば、それらは何ですか? それらの違いは何ですか? それらのいずれかは同義語ですか? OLS回帰、ANOVA、ANCOVAなどの従来のテストは、この分類のどこに該当しますか? 自己学習で次に進むべき場所を決めようとしているだけです。

5
コピュラの入門書
しばらくの間、私はセミナーのためにコピュラに関する良い入門書を探していました。私は理論的な側面について話す多くの資料を見つけていますが、それは良いことですが、それらに移る前に、このトピックに関する優れた直観的な理解を構築したいと考えています。 誰もが初心者に良い基盤を提供する良い論文を提案できますか(私は統計の1-2コースを持ち、周辺、多変量分布、逆変換などを合理的な範囲で理解しました)?

1
lmerモデルに使用する多重比較方法:lsmeansまたはglht?
1つの固定効果(条件)と2つのランダム効果(被験者内のデザインとペアによる参加者)を含む混合効果モデルを使用して、データセットを分析しています。モデルはlme4パッケージで生成されました:exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp)。 次に、固定効果(条件)のないモデルに対してこのモデルの尤度比検定を実行しましたが、有意差があります。データセットには3つの条件があるため、多重比較を行いたいのですが、どの方法を使用すればよいかわかりません。CrossValidatedや他のフォーラムで同様の質問をいくつか見つけましたが、それでもかなり混乱しています。 私が見たものから、人々は使用することを提案しました 1.lsmeansパッケージ- lsmeans(exp.model,pairwise~condition)私に次のような出力が得られます。 condition lsmean SE df lower.CL upper.CL Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552 Confidence level used: 0.95 $contrasts contrast estimate SE df t.ratio p.value Condition1 - Condition2 -0.04893538 0.03813262 62.07 -1.283 0.4099 Condition1 - …

3
周辺カウントのみが与えられた同時分布の最尤推定量
ましょうpx,ypx,yp_{x,y} 2つのカテゴリ変数の同時分布であるX,YX,YX,Yと、x,y∈{1,…,K}x,y∈{1,…,K}x,y\in\{1,\ldots,K\}。セイnnnのサンプルは、この分布から引き出されたが、我々は唯一の、すなわちのために、限界カウントを与えられているj=1,…,Kj=1,…,Kj=1,\ldots,K: Sj=∑i=1nδ(Xi=l),Tj=∑i=1nδ(Yi=j),Sj=∑i=1nδ(Xi=l),Tj=∑i=1nδ(Yi=j), S_j = \sum_{i=1}^{n}{\delta(X_i=l)}, T_j = \sum_{i=1}^{n}{\delta(Y_i=j)}, S j、T jが与えられた場合のの最尤推定量は何ですか?これは知られていますか?計算的に実行可能ですか?ML以外にこの問題に対する他の合理的なアプローチはありますか?px,ypx,yp_{x,y}Sj,TjSj,TjS_j,T_j

2
「部分的」および「限界的」相関の名前の背後にある直観
2つの変数間の条件付き相関が「部分」相関と呼ばれ、それらの間の単純な相関(他の変数で条件付けされていない場合)が「限界」相関と呼ばれる理由について誰かが知っていますか?「部分的」および「限界的」という言葉の背後にある直観は何ですか?彼らは「パーツ」や「マージン」をどのように扱いますか? これらの概念をよりよく理解するには、答えを学ぶのが良いでしょう。

1
条件付き分布を使用した周辺分布からのサンプリング?
一変量密度からサンプリングしたいのですが、関係はわかっています。fバツfXf_X fバツ(x )= ∫fバツ| Y(x | y)fY(y)dy。fX(x)=∫fX|Y(x|y)fY(y)dy.f_X(x) = \int f_{X\vert Y}(x\vert y)f_Y(y) dy. MCMC(積分表現に直接)の使用を避けたいので、とf Y(y )は簡単にサンプリングできるため、次のサンプラーを使用することを考えていました。fバツ| Y(x | y)fX|Y(x|y)f_{X\vert Y}(x\vert y)fY(y)fY(y)f_Y(y) 。j = 1 、… 、Nj=1,…,Nj=1,\dots, N サンプル。yj〜FYyj∼fYy_j \sim f_Y サンプル。バツj〜Fバツ| Y(⋅ | yj)xj∼fX|Y(⋅|yj)x_j \sim f_{X\vert Y}(\cdot\vert y_j) 次に、ペア終わります。。。、(x N、y N)、および限界サンプル(x 1、… 、x N)のみを取得します。 これは正しいです?(x1、y1)、。。。、(xN、yN)(x1,y1),...,(xN,yN)(x_1,y_1),...,(x_N,y_N)(x1、… 、xN)(x1,…,xN)(x_1,\dots,x_N)

1
多変数依存の共同分布から周辺分布を見つける方法は?
私の教科書の問題点の1つは次のとおりです。2次元の確率的連続ベクトルには、次の密度関数があります。 fX,Y(x,y)={15xy20if 0 &lt; x &lt; 1 and 0 &lt; y &lt; xotherwisefX,Y(x,y)={15xy2if 0 &lt; x &lt; 1 and 0 &lt; y &lt; x0otherwise f_{X,Y}(x,y)= \begin{cases} 15xy^2 & \text{if 0 < x < 1 and 0 < y < x}\\ 0 & \text{otherwise}\\ \end{cases} 周辺密度関数およびf Yが次のとおりであることを示します。fXfXf_XfYfYf_Y fX(x)={5x40if 0 &lt; x …

1
ベイズ因子の更新
ベイズ因子は、仮説のベイズ検定とベイジアンモデルの選択で、2つの周辺尤度の比によって定義されます:iidサンプルとそれぞれのサンプリング密度と、対応するおよび場合、2つのモデルを比較するためのベイズ係数は 本私は現在検討していますが、その奇妙な文がベイズ因子上記(x1,…,xn)(x1,…,xn)(x_1,\ldots,x_n)f1(x|θ)f1(x|θ)f_1(x|\theta)f2(x|η)f2(x|η)f_2(x|\eta)π1π1\pi_1π2π2\pi_2B12(x1,…,xn)=defm1(x1,…,xn)m2(x1,…,xn)=def∫∏ni=1f1(xi|θ)π1(dθ)∫∏ni=1f2(xi|η)π2(dη)B12(x1,…,xn)=defm1(x1,…,xn)m2(x1,…,xn)=def∫∏i=1nf1(xi|θ)π1(dθ)∫∏i=1nf2(xi|η)π2(dη)\mathfrak{B}_{12}(x_1,\ldots,x_n)\stackrel{\text{def}}{=}\frac{m_1(x_1,\ldots,x_n)}{m_2(x_1,\ldots,x_n)}\stackrel{\text{def}}{=}\frac{\int \prod_{i=1}^n f_1(x_i|\theta)\pi_1(\text{d}\theta)}{\int \prod_{i=1}^n f_2(x_i|\eta)\pi_2(\text{d}\eta)}B12(x1,…,xn)B12(x1,…,xn)\mathfrak{B}_{12}(x_1,\ldots,x_n)は、「個々のもの[ベイズ係数]を掛け合わせることによって形成されます」(p.118)。これは分解 が、による更新として、この分解には計算上の利点がないようですは、元の計算と同じ計算量を必要としますB12(x1,…,xn)=m1(x1,…,xn)m2(x1,…,xn)=m1(xn|x1,…,xn−1)m2(xn|x1,…,xn−1)×m1(xn−1|xn−2,…,x1)m2(xn−1|xn−2,…,x1)×⋯⋯×m1(x1)m2(x1)B12(x1,…,xn)=m1(x1,…,xn)m2(x1,…,xn)=m1(xn|x1,…,xn−1)m2(xn|x1,…,xn−1)×m1(xn−1|xn−2,…,x1)m2(xn−1|xn−2,…,x1)×⋯⋯×m1(x1)m2(x1)\begin{align*}\mathfrak{B}_{12}(x_1,\ldots,x_n)&=\frac{m_1(x_1,\ldots,x_n)}{m_2(x_1,\ldots,x_n)}\\&=\frac{m_1(x_n|x_1,\ldots,x_{n-1})}{m_2(x_n|x_1,\ldots,x_{n-1})}\times \frac{m_1(x_{n-1}|x_{n-2},\ldots,x_1)}{m_2(x_{n-1}|x_{n-2},\ldots,x_1)}\times\cdots\\&\qquad\cdots\times\frac{m_1(x_1)}{m_2(x_1)}\end{align*}m1(xn|x1,…,xn−1)m2(xn|x1,…,xn−1)m1(xn|x1,…,xn−1)m2(xn|x1,…,xn−1)\frac{m_1(x_n|x_1,\ldots,x_{n-1})}{m_2(x_n|x_1,\ldots,x_{n-1})}m1(x1,…,xn)m2(x1,…,xn)m1(x1,…,xn)m2(x1,…,xn)\frac{m_1(x_1,\ldots,x_n)}{m_2(x_1,\ldots,x_n)}外の人工おもちゃの例。 質問:ベイズ係数をからに 更新する一般的で計算効率の高い方法はありますか辺縁全体および 再計算する必要はありませんか?B12(x1,…,xn)B12(x1,…,xn)\mathfrak{B}_{12}(x_1,\ldots,x_n)B12(x1,…,xn+1)B12(x1,…,xn+1)\mathfrak{B}_{12}(x_1,\ldots,x_{n+1})m1(x1,…,xn)m1(x1,…,xn)m_1(x_1,\ldots,x_n)m2(x1,…,xn)m2(x1,…,xn)m_2(x_1,\ldots,x_n) 私の直感は、ベイズ係数一度に1つずつ新しい観測値に推定することに沿って進むパーティクルフィルター以外に、この質問に答える自然な方法はないということです。B12(x1,…,xn)B12(x1,…,xn)\mathfrak{B}_{12}(x_1,\ldots,x_n)

2
限界尤度の堅牢なMCMC推定量?
私はモンテカルロ法によって統計モデルの限界尤度を計算しようとしています: f(x)=∫f(x∣θ)π(θ)dθf(x)=∫f(x∣θ)π(θ)dθf(x) = \int f(x\mid\theta) \pi(\theta)\, d\theta 可能性は適切に動作します-滑らかで、対数の凹型-高次元です。重要性のサンプリングを試みましたが、結果は不安定で、使用している提案に大きく依存しています。ハミルトニアンモンテカルロをしていると考え、私の簡潔前制服を想定しにわたり事後サンプル計算すると私は見るまで、調和平均を取って、これを。学んだ教訓として、調和平均は無限の分散を持つことができます。ほぼ同じくらい簡単なMCMC推定器はありますか?θθ\theta

1
周辺密度の
タイトルが言うように、の限界密度を探していf(x,y)=c1−x2−y2−−−−−−−−−√,x2+y2≤1.f(x,y)=c1−x2−y2,x2+y2≤1.f (x,y) = c \sqrt{1 - x^2 - y^2}, x^2 + y^2 \leq 1. これまでのところ、はことがわかりました。私はを極座標に変換し、で積分することでそのことを理解しました。これが限界密度の部分に行き詰まっている理由です。私はそれを知っている、私は「大きな乱雑積分を取得、およびなしで私が回答ISN知っていることを解決する方法がわからないんだけど大きな厄介な積分になるはずです。代わりに見つけてから、を使ってを見つけることはか3ccc F(X、Y)のDRDθFX(X)=∫ ∞ - ∞ F(X、Y)のDYF(X、Y)DF32π32π\frac{3}{2 \pi}f(x,y)f(x,y)f(x,y)drdθdrdθdrd\thetafx(x)=∫∞−∞f(x,y)dyfx(x)=∫−∞∞f(x,y)dyf_x(x) = \int_{-\infty}^\infty f(x,y)dyF(x 、y)F(x,y)F(x,y) fx(x)dFdバツdFdx\frac{dF}{dx}fバツ(x )fx(x)f_x(x)?それは直感的な方法のように思えますが、私の教科書ではそれらの関係を説明するものを見つけることができないので、間違った仮定をしたくありませんでした。

1
最大エントロピー分布は、与えられた周辺分布と一致していますか?
一般に、既知の限界分布と一致する多くの結合分布ます。P(X1=x1,X2=x2,...,Xn=xn)P(X1=x1,X2=x2,...,Xn=xn)P(X_1 = x_1, X_2 = x_2, ..., X_n = x_n)fi(xi)=P(Xi=xi)fi(xi)=P(Xi=xi)f_i(x_i) = P(X_i = x_i) これらの共同分布の中で、周辺の積をとることで生成される積は、エントロピーが最も高いものですか?∏ifi(xi)∏ifi(xi)\prod_i f_i(x_i) 私は確かにこれが真実であると信じていますが、実際に証拠を見たいと思います。 私はすべての変数が離散的である場合に最も興味がありますが、連続的な場合の製品測定値に関連するエントロピーについての解説にも興味があります。

3
ガウス尤度+どの事前=ガウス限界か?
サンプルについてガウス尤度を与え様とのパラメータ空間とされて、平均ベクトルと共分散行列の任意のパラメーター化。yyyp(y|θ)=N(y;μ(θ),Σ(θ))p(y|θ)=N(y;μ(θ),Σ(θ))p(y|\theta) = \mathcal{N}(y;\mu(\theta),\Sigma(\theta))ΘΘ\Thetaμ(θ)μ(θ)\mu(\theta)Σ(θ)Σ(θ)\Sigma(\theta) 限界尤度なるように、事前密度と平均ベクトルおよび共分散行列パラメーター化を指定することは可能ですか?はガウス尤度ですか?p(θ)p(θ)p(\theta)μ(θ)μ(θ)\mu(\theta)Σ(θ)Σ(θ)\Sigma(\theta)p(y)=∫θ∈ΘN(y;μ(θ),Σ(θ))p(θ)dθp(y)=∫θ∈ΘN(y;μ(θ),Σ(θ))p(θ)dθp(y)=\int_{\theta\in\Theta}N(y;\mu(\theta),\Sigma(\theta))p(\theta)d\theta 共分散がわかっている自明な解、つまりを除外すると思います。ここで、は任意の固定共分散行列ですが、これは不可能です。Σ(θ)=ΣΣ(θ)=Σ\Sigma(\theta)=\SigmaΣΣ\Sigma 特別な場合および、つまりは1次元であり、、ここでは、表示できる均一密度を示します: μ(σ2)=μμ(σ2)=μ\mu(\sigma^2)=\muΣ(σ2)=σ2Σ(σ2)=σ2\Sigma(\sigma^2)=\sigma^2yyyp(σ2)=U(σ2;a,b)p(σ2)=U(σ2;a,b)p(\sigma^2)=\mathcal{U}(\sigma^2;a,b)U(σ2;a,b)U(σ2;a,b)\mathcal{U}(\sigma^2;a,b)p(y)=∫∞0N(y;μ,σ2)U(σ2;a,b)dσ2=1b−a∫baN(y;μ,σ2)not a Gaussian densityp(y)=∫0∞N(y;μ,σ2)U(σ2;a,b)dσ2=1b−a∫abN(y;μ,σ2)⏟not a Gaussian density\begin{align} p(y)&=\int_0^\infty \mathcal{N}(y;\mu,\sigma^2)\mathcal{U}(\sigma^2;a,b)d\sigma^2 \\ &= \frac{1}{b-a} \underbrace{\int_a^b \mathcal{N}(y;\mu,\sigma^2)}_\text{not a Gaussian density} \end{align} 受け入れられた回答には、公式または非公式の証明またはそれへのポインタが含まれています。

2
2つの一様分布の結合分布と周辺分布の計算に関する問題
我々は、ランダムな変数があるととして配布およびとして配布 、間隔で一様分布を意味する。 U [ 0 、1 ] X 2 U [ 0 、X 1 ] U 〔、B ] [ 、B ]バツ1X1X_1U[ 0 、1 ]U[0,1]U[0,1]バツ2X2X_2U[ 0 、X1]U[0,X1]U[0,X_1]U[ a 、b ]U[a,b]U[a,b][ a 、b ][a,b][a,b] Iは、関節PDFを計算することができたとの限界PDF。X 1(X1、X2)(X1,X2)(X_1,X_2)バツ1X1X_1 p (x1、x2)= 1バツ1、 のために 0 ≤ X1≤ 1 、0 ≤ X2≤ X1、p(x1,x2)=1x1, for 0≤x1≤1,0≤x2≤x1, p(x_1,x_2) = …

3
ベイズ正規化定数の直感
スクリーニングの可能性が80%、事前確率が10%、偽陽性率が50%の一般的に言及されているマンモグラフィスクリーニング問題、またはそのバリアントでは、陽性スクリーニングが癌を示すという条件付き事後確率は簡単に説明できます。存在はわずか15%です。これは、n = 1000、真の癌症例= 100、検出された癌= 80、および偽陽性= 450のカウントによって最も簡単に示されます。陽性スクリーニングが癌の存在を示す確率は、真陽性/(真陽性+誤検知)または80 /(100 + 450)= 0.145または15%。 直感は、真陽性と偽陽性の合計がすべての結果のサブセットを構成するため、真陽性は真陽性と偽陽性の合計に条件付けられるということです。これは、偽陰性と真陰性が計算から除外されるため、条件付きセットがサブセットになるためです。 問題を二項尤度と事前ベータの連続ケースにシフトすると、正規化定数は真陽性の項(p =比例)のように積分になります。 ∫10(nx)px(1−p)n−xΓ(a+b)Γ(a)Γ(b)pa−1(1−p)b−1dp∫01(nx)px(1−p)n−xΓ(a+b)Γ(a)Γ(b)pa−1(1−p)b−1dp\int_0^1 {\left( {\begin{array}{*{20}{c}}n\\x\end{array}} \right)p_{}^x{{(1 - p)}^{n - x}}\frac{{\Gamma (a + b)}}{{\Gamma (a)\Gamma (b)}}p_{}^{a - 1}{{(1 - {p_{}})}^{b - 1}}} dp % MathType!MTEF!2!1!+- % feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn % hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr % 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq-Jc9 % vqaqpepm0xbba9pwe9Q8fs0-yqaqpepae9pg0FirpepeKkFr0xfr-x % fr-xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 % qadaWdXaqaamaabmaapaqaauaabeqaceaaaeaapeGaamOBaaWdaeaa % peGaamiEaaaaaiaawIcacaGLPaaacaWGWbWaa0baaSqaaaqaaiaadI % …

1
ARプロセスの開始点の分布
モデル確率過程ます。ここでです。{バツt、t = 1 、 2 、... }{Xt,t=1,2,…}\{X_t, t = 1, 2, \ldots\}バツt= αバツt − 1+et、Xt=αXt−1+et,X_t = \alpha X_{t-1} + e_t,et〜Fet∼fe_t \thicksim f 初期点分布はと同じだと言えますか?バツ1X1X_1fff の定常限界密度が存在する場合、と同じであると言えますか?{バツt}{Xt}\{X_t\}バツ2(=Dαバツ1+e2)X2(=DαX1+e2)X_2 (\stackrel{D}{=}\alpha X_1 + e_2) の定常限界密度(存在する場合)はと同じですが、と同じである必要はないと思います。{バツt}{Xt}\{X_t\}バツ2X2X_2バツ1X1X_1
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.