タグ付けされた質問 「joint-distribution」

いくつかの確率変数の同時確率分布は、それらすべてが特定の領域に同時に存在する確率を与えます。


1
コピュラ密度の上限?
フレシェ-Hoeffding上限コピュラ分布関数に適用され、それは次式で与えられます。 C(あなた1、。。。、あなたd)≤ 分{ U1、。。、あなたd} 。C(u1,...,ud)≤min{u1,..,ud}.C(u_1,...,u_d)\leq \min\{u_1,..,u_d\}. CDFの代わりにコピュラ密度に同様の(限界密度に依存するという意味で)上限がありますか?c (u1、。。。、あなたd)c(u1,...,ud)c(u_1,...,u_d) どんな参考文献も大歓迎です。

5
用語「共同分布」と「多変量分布」の違いは?
「多変量分布」を理解する可能性が高い視聴者に対して「結合確率分布」を使用することについて書いているので、後者を使用することを検討しています。ただし、これを行っている間は意味を失いたくありません。 ウィキペディアは、これらが同義語であることを示しているようです。 彼らは?そうでない場合は、なぜですか?

3
周辺カウントのみが与えられた同時分布の最尤推定量
ましょうpx,ypx,yp_{x,y} 2つのカテゴリ変数の同時分布であるX,YX,YX,Yと、x,y∈{1,…,K}x,y∈{1,…,K}x,y\in\{1,\ldots,K\}。セイnnnのサンプルは、この分布から引き出されたが、我々は唯一の、すなわちのために、限界カウントを与えられているj=1,…,Kj=1,…,Kj=1,\ldots,K: Sj=∑i=1nδ(Xi=l),Tj=∑i=1nδ(Yi=j),Sj=∑i=1nδ(Xi=l),Tj=∑i=1nδ(Yi=j), S_j = \sum_{i=1}^{n}{\delta(X_i=l)}, T_j = \sum_{i=1}^{n}{\delta(Y_i=j)}, S j、T jが与えられた場合のの最尤推定量は何ですか?これは知られていますか?計算的に実行可能ですか?ML以外にこの問題に対する他の合理的なアプローチはありますか?px,ypx,yp_{x,y}Sj,TjSj,TjS_j,T_j

1
独立のための共同MGFに関する必要かつ十分な条件
CDFとの共同分布に対して、共同モーメント生成関数があるとします。あるの両方に必要かつ十分の独立の条件と?私は必要性だけを述べたいくつかの教科書を調べた:F X 、Y(X 、Y )M X 、Y(S 、T )= M X 、Y(S 、0 )⋅ M X 、Y(0 、T )X YMX,Y(s,t)MX,Y(s,t)M_{X,Y}(s,t)FX,Y(x,y)FX,Y(x,y)F_{X,Y}(x,y)MX,Y(s,t)=MX,Y(s,0)⋅MX,Y(0,t)MX,Y(s,t)=MX,Y(s,0)⋅MX,Y(0,t)M_{X,Y}(s,t)=M_{X,Y}(s,0)⋅M_{X,Y}(0,t)XXXYYY Fバツ、Y(x 、y)= Fバツ(X )⋅ FY(y)⟹Mバツ、Y(s 、t )= Mバツ(S )⋅ MY(t )FX,Y(x,y)=FX(x)⋅FY(y)⟹MX,Y(s,t)=MX(s)⋅MY(t)F_{X,Y}(x,y)=F_X(x)\cdot F_Y(y) \implies M_{X,Y}(s,t)=M_X(s) \cdot M_Y(t) 独立性が意味するため、この結果は明らかです。周辺のMGFは共同MGFによって決定されるため、次のようになります。MX,Y(s,t)=E(esX+tY)=E(esX)E(etY)MX,Y(s,t)=E(esX+tY)=E(esX)E(etY)M_{X,Y}(s,t)=\mathbb{E}(e^{sX+tY})=\mathbb{E}(e^{sX}) \mathbb{E}(e^{tY}) X,Y independent⟹MX,Y(s,t)=MX,Y(s,0)⋅MX,Y(0,t)X,Y independent⟹MX,Y(s,t)=MX,Y(s,0)⋅MX,Y(0,t)X,Y\text{ independent} \implies M_{X,Y}(s,t)=M_{X,Y}(s,0)⋅M_{X,Y}(0,t) しかし、オンラインで検索したところ、証拠がない、コンバースへの一時的な参照しか見つかりませんでした。次のスケッチプルーフは機能しますか? ジョイントMGF与えられると、これは、とおよびそれらのMGF の周辺分布を一意に決定します。M_X および。単独で周辺分布は、多くの他の可能な関節分布と互換性があり、一意た関節の分布を決定及び CDFと独立している、およびMGF:X Y …

2
変数が完全な同時依存性を示す場合、多変量中心極限定理(CLT)は成り立ちますか?
タイトルは私の質問を要約したものですが、明確にするために、次の簡単な例を検討してください。ましょう、I = 1、...、N。定義: \ begin {equation} S_n = \ frac {1} {n} \ sum_ {i = 1} ^ n X_i \ end {equation} および \ begin {equation} T_n = \ frac {1} {n} \ sum_ ^ N(X_I ^ 2 - 1の){I 1 =} \端{式} 私の質問:にもかかわらずS_NとT_Nがときに完全に依存しており、N = 1、DO \ SQRT {N} …

1
多変数依存の共同分布から周辺分布を見つける方法は?
私の教科書の問題点の1つは次のとおりです。2次元の確率的連続ベクトルには、次の密度関数があります。 fX,Y(x,y)={15xy20if 0 &lt; x &lt; 1 and 0 &lt; y &lt; xotherwisefX,Y(x,y)={15xy2if 0 &lt; x &lt; 1 and 0 &lt; y &lt; x0otherwise f_{X,Y}(x,y)= \begin{cases} 15xy^2 & \text{if 0 < x < 1 and 0 < y < x}\\ 0 & \text{otherwise}\\ \end{cases} 周辺密度関数およびf Yが次のとおりであることを示します。fXfXf_XfYfYf_Y fX(x)={5x40if 0 &lt; x …

1
観測されたイベントと期待されたイベントを比較する方法は?
4つの可能なイベントの頻度の1つのサンプルがあるとします。 Event1 - 5 E2 - 1 E3 - 0 E4 - 12 そして、私は自分のイベントの発生が予想される確率を持っています: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 4つのイベントの観測頻度の合計(18)を使用して、イベントの予想頻度を計算できますか? expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 = 1.8 expectedE1 - …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

1
離散一様確率変数間の間隔
LETこと(0,1)上の離散一様確率変数のIIDとその順序統計量があること。 n U (1 )、… 、U (n )U1、… 、UんU1,…,UnU_1, \ldots, U_nんnnU(1 )、… 、U(n )U(1),…,U(n)U_{(1)}, \ldots, U_{(n)} 定義のためにと。 i = 1 、… 、n U 0 = 0D私= U(私)− U(i − 1 )D私=U(私)−U(私−1)D_i=U_{(i)}-U_{(i-1)}i = 1 、… 、n私=1、…、んi=1, \ldots, nU0= 0U0=0U_0=0 私はの共同分布とそれらの限界分布、そしておそらくそれらの最初の数瞬間を理解しようとしています。誰かがこれについていくつかのヒントを与えることができますか?また、注文統計に関する本をお勧めしてもらえますか?U私U私U_i

1
最大エントロピー分布は、与えられた周辺分布と一致していますか?
一般に、既知の限界分布と一致する多くの結合分布ます。P(X1=x1,X2=x2,...,Xn=xn)P(X1=x1,X2=x2,...,Xn=xn)P(X_1 = x_1, X_2 = x_2, ..., X_n = x_n)fi(xi)=P(Xi=xi)fi(xi)=P(Xi=xi)f_i(x_i) = P(X_i = x_i) これらの共同分布の中で、周辺の積をとることで生成される積は、エントロピーが最も高いものですか?∏ifi(xi)∏ifi(xi)\prod_i f_i(x_i) 私は確かにこれが真実であると信じていますが、実際に証拠を見たいと思います。 私はすべての変数が離散的である場合に最も興味がありますが、連続的な場合の製品測定値に関連するエントロピーについての解説にも興味があります。

1
ポアソン/負の二項式の後の置換ありまたはなしのサンプリングを分析的に解く
短縮版 独立したポアソンドローと、置換の有無にかかわらずさらにサンプリングすることで得られる複合的な可能性を分析的に解決または近似しようとしています(実際にはどちらでもかまいません)。MCMC(Stan)で尤度を使用したいので、定数項までの解だけが必要です。最終的に、私は最初のドローがネガからであるプロセスをモデル化したいと思います。二項分布ですが、ポアソンのケースの解決策でそこに到達できると思います。 解決策が実行不可能である可能性は十分にあります(これが単純な問題か非常に難しい問題かを判断できるほど数学を理解していません)。したがって、問題がおそらく扱いにくい理由(たとえば、既知の困難な問題と比較する)の近似、否定的な結果、または直感にも興味があります。私が前進するのに役立つ有用なペーパー/定理/トリックへのリンクは、目前の問題へのそれらの関係が完全にうまくいかなくても、良い答えです。 公式声明 より正式には、まずY=(y1,...,yN),yn∼Pois(λn)Y=(y1,...,yN),yn∼Pois(λn)Y = (y_1, ..., y_N), y_n \sim Pois(\lambda_n)独立して引き出され、次いでIサンプルの全てからランダムにアイテム得るために。つまり、壷から色のボールを描画します。ここで、色のボールの量はから描画されます。ここで、は既知で固定されていると仮定し、Y Z = (Z 1、。。。、Z N)K N P 、O 、I S (λ N)K Σ N Y N ≥ KkkkYYYZ=(z1,...,zN)Z=(z1,...,zN)Z = (z_1,...,z_N)kkknnnPois(λn)Pois(λn)Pois(\lambda_n)kkk∑nyn≥k∑nyn≥k\sum_n y_n \geq k。技術的にサンプリングは置換なしで行われますが、置換ありのサンプリングを想定することは大したことではありません。 置換なしのサンプリングを解決するために2つの方法を試しましたが(一部の用語がキャンセルされたため、これはより簡単なケースのように思われました)、両方に行き詰まりました。交換せずにサンプリングする場合の可能性は次のとおりです。 P(Z=(z1,...,zN)|Λ=(λ1,...,λN))=∑Y;∀n:yn≥zn(∏Nn=1(ynzn)(∑Nn=1ynk)∏Nn=1Poisson(yn|λn))P(∑nyn≥k|Λ)P(Z=(z1,...,zN)|Λ=(λ1,...,λN))=∑Y;∀n:yn≥zn(∏n=1N(ynzn)(∑n=1Nynk)∏n=1NPoisson(yn|λn))P(∑nyn≥k|Λ) P(Z = (z_1, ..., z_N) | \Lambda = (\lambda_1, ..., \lambda_N)) = \frac{ …

2
独立性と順序の統計
手元に問題があり、続行できません。誰かが私を始めるのを手伝ってくれる? f (x )= 2 x 0 &lt; x &lt; 1 U 1 = Y 1Y1&lt;Y2&lt;Y3Y1&lt;Y2&lt;Y3Y_1<Y_2<Y_3:pdfをもつ分布からのサイズ3の順序統計量 また、定義します タスクは、を計算することです。f(x)=2x 0&lt;x&lt;1f(x)=2x 0&lt;x&lt;1 f(x)=2x\ \ \ 0<x<1U1=Y1Y2 and U2=Y2Y3U1=Y1Y2 and U2=Y2Y3U_1={Y_1\over Y_2} \ \ \text{and }\ \ \ U_2={Y_2\over Y_3}U1 &amp; U2U1 &amp; U2U_1\ \&\ U_2 私の作品:限界を発見しました。U1 &amp; U2U1 &amp; U2U_1\ \&\ U_2 …

2
結合確率変数の瞬間は何ですか?
簡単な質問ですが、オンラインで答えを見つけるのは驚くほど難しいです。 私は、RVのためにことを知っている、我々はk番目の時点を定義 場合等式は以下濃度のために、とルベーグ測度。XXX∫Xk dP=∫xkf(x) dx∫Xk dP=∫xkf(x) dx\int X^k \ d P = \int x^k f(x) \ dxp=f⋅mp=f⋅mp = f \cdot mfffmmm それで、例えば、のk番目のモーメントは何ですか?は私に対する答えのようには見えません...(X,Y)(X,Y)(X,Y)∫(X,Y) dP∫(X,Y) dP\int (X,Y) \ d P

1
X、Y単変量確率変数:それらは独立していますか?
LET及び単変量ランダムCDFを有する変数である:よう ここで、、は既知の関数です。X:Ω→RX:Ω→RX:\Omega\to\mathbb{R}Y:Ω→RY:Ω→RY:\Omega\to\mathbb{R}FX,Y(x,y)FX,Y(x,y)F_{X,Y}(x,y)G 1:R → R G 2:R →FX,Y(x,y)=G1(x)G2(y),∀(x,y)∈R×RFX,Y(x,y)=G1(x)G2(y),∀(x,y)∈R×R F_{X,Y}(x,y)=G_1(x)G_2(y),\forall (x,y)\in\mathbb{R}\times\mathbb{R} G1:R→RG1:R→RG_1:\mathbb{R}\to\mathbb{R}G2:R→RG2:R→RG_2:\mathbb{R}\to\mathbb{R} 質問:とが独立したRV であることは本当ですか?YXXXYYY 誰かが私にいくつかのヒントを与えることはできますか? 私が試した: が、なぜ(またはif)\ lim_ {y \ to \ infty} G_2(y)= 1なのかわかりません。LIM Y → ∞ G 2(Y )=Fバツ(x )= limy→ ∞Fバツ、Y(x 、y)= limy→ ∞G1(x )G2(y)= G1(x )⋅ リムy→ ∞G2(y)FX(x)=limy→∞FX,Y(x,y)=limy→∞G1(x)G2(y)=G1(x)⋅limy→∞G2(y) F_X(x)=\lim_{y\to\infty}F_{X,Y}(x,y)=\lim_{y\to\infty}G_1(x)G_2(y)=G_1(x)\cdot\lim_{y\to\infty}G_2(y) リムy→ ∞G2(y)= 1limy→∞G2(y)=1\lim_{y\to\infty}G_2(y)=1

1
非正規データのマハラノビス距離
マハラノビス距離は、分類の目的で使用される場合、通常、多変量正規分布を想定しており、重心からの距離は分布に従う必要があります(自由度は次元/特徴の数に等しい)。マハラノビス距離を使用して、新しいデータポイントがセットに属する確率を計算できます。χ2χ2\chi^2ddd 多変量正規分布に従わないデータセットがあります()。理論的には、各特徴はポアソン分布に従う必要があり、経験的にこれは多くの()特徴に当てはまるようで、ノイズに含まれていない特徴で、分析から削除できます。このデータの新しいポイントをどのように分類できますか?d≈1000d≈1000d \approx 1000≈200≈200\approx 200 2つのコンポーネントがあると思います。 このデータの適切な「マハラノビス距離」式は何ですか(つまり、多変量ポアソン分布)。他の分布への距離の一般化はありますか? 通常のマハラノビス距離を使用しても、別の定式化を使用しても、これらの距離の分布はどうなりますか?仮説検定を行う別の方法はありますか? あるいは... 各クラスの既知のデータポイントのは、(少なすぎます。経験的に最小値を決定します)から約まで幅広く変化します。マハラノビス距離はでスケーリングされるため、1つのモデル/クラスから次のモデル/クラスまでの距離を直接比較することはできません。データが正常に分布している場合、カイ2乗検定は、さまざまなモデルからの距離を比較する方法を提供します(臨界値または確率を提供することに加えて)。「マハラノビスのような」距離を直接比較する別の方法がある場合、たとえそれが確率を提供していなくても、私はそれで作業することができます。nnnn=1n=1n=1n=6000n=6000n=6000nnn

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.