タグ付けされた質問 「copula」

コピュラは、一様な周辺分布を持つ多変量分布です。コピュラは、周辺分布とは別に、確率変数間の依存関係の構造を表現またはモデル化するために主に使用されます。

3
結合分布がガウスではないガウス確率変数のペアを持つことは可能ですか?
就職の面接で誰かが私にこの質問をしましたが、彼らの共同分布は常にガウス分布であると答えました。私はいつでも平均と分散と共分散を持つ二変量ガウスを書くことができると思いました。2つのガウス分布の結合確率がガウス分布ではない場合がありますか?

5
コピュラの入門書
しばらくの間、私はセミナーのためにコピュラに関する良い入門書を探していました。私は理論的な側面について話す多くの資料を見つけていますが、それは良いことですが、それらに移る前に、このトピックに関する優れた直観的な理解を構築したいと考えています。 誰もが初心者に良い基盤を提供する良い論文を提案できますか(私は統計の1-2コースを持ち、周辺、多変量分布、逆変換などを合理的な範囲で理解しました)?

1
対数正規確率変数の達成可能な相関
およびの対数正規確率変数およびを考え。X 2ログ(X 1)〜N(0 、1 )ログ(X 2)〜N(0 、σ 2)X1X1X_1X2X2X_2log(X1)∼N(0,1)log⁡(X1)∼N(0,1)\log(X_1)\sim \mathcal{N}(0,1)log(X2)∼N(0,σ2)log⁡(X2)∼N(0,σ2)\log(X_2)\sim \mathcal{N}(0,\sigma^2) ρmaxρmax\rho_{\max} ρ (X 1、X 2)ρminρmin\rho_{\min}ρ(X1,X2)ρ(X1,X2)\rho (X_1,X_2) ρmax=ρ(exp(Z),exp(σZ))ρmax=ρ(exp⁡(Z),exp⁡(σZ))\rho_{\max}=\rho (\exp(Z),\exp(\sigma Z))および ρmin=ρ(exp(Z),exp(−σZ))ρmin=ρ(exp⁡(Z),exp⁡(−σZ))\rho_{\min}=\rho (\exp(Z),\exp(-\sigma Z))、 しかし、彼らは共単調性と反共等張性についていくつか言及しています。私は誰かがそれらがどのように関連しているかを理解するのを手伝ってくれることを望んでいました。(一般的な表現からこれを取得する方法は知っていますが、共単調性部分が何を言っているかを具体的に知りたいです。)

1
多変量標準正規分布とガウスコピュラの違い
多変量標準正規分布とガウスコピュラの違いは、密度関数を見ると同じように見えるので、どのような違いがあるのでしょうか。 私の問題は、ガウスコピュラが導入される理由、ガウスコピュラが生成する利点、またはガウスコピュラが多変量標準正規関数そのものにすぎない場合のその優位性です。 また、コピュラの確率積分変換の背後にある概念は何ですか?コピュラは一様変数を持つ関数であることを知っています。なぜ均一でなければならないのですか?多変量正規分布のような実際のデータを使用して、相関行列を見つけてみませんか?(通常、2つの資産のリターンをプロットしてそれらの関係を検討しますが、コピュラの場合は、代わりに確率であるUsをプロットします。) 別の質問。また、MVNからの相関行列が、コピュラのようにノンパラメトリックまたはセミパラメトリックになる可能性があるかどうかも疑います(コピュラのパラメータはケンドールのタウなどになります) 私はこの分野で初めてなので、あなたの助けにとても感謝しています。(しかし、私は多くの論文を読んでおり、これらは私が理解していない唯一のものです)

1
コピュラ密度の上限?
フレシェ-Hoeffding上限コピュラ分布関数に適用され、それは次式で与えられます。 C(あなた1、。。。、あなたd)≤ 分{ U1、。。、あなたd} 。C(u1,...,ud)≤min{u1,..,ud}.C(u_1,...,u_d)\leq \min\{u_1,..,u_d\}. CDFの代わりにコピュラ密度に同様の(限界密度に依存するという意味で)上限がありますか?c (u1、。。。、あなたd)c(u1,...,ud)c(u_1,...,u_d) どんな参考文献も大歓迎です。

1
ガウスコピュラからシミュレートする方法は?
FFFとような2つの単変量周辺分布がありGGG、そこからシミュレートできると仮定します。ここで、C (F 、G ; Σ )で表されるガウスコピュラを使用してそれらの結合分布を構築します。すべてのパラメーターは既知です。C(F,G;Σ)C(F,G;Σ)C(F,G;\Sigma) このコピュラからシミュレートするための非MCMCメソッドはありますか?

2
2つの相関するランダム変数をサンプリングするためのいくつかの手法は何ですか?
2つの相関するランダム変数をサンプリングするためのいくつかの手法は何ですか? 確率分布がパラメータ化されている場合(たとえば、対数正規) ノンパラメトリック分布がある場合。 データは、非ゼロの相関係数を計算できる2つの時系列です。履歴相関と時系列CDFが一定であると仮定して、将来これらのデータをシミュレートしたいと考えています。 ケース(2)の場合、1-DアナログはCDFを構築し、そこからサンプルを作成します。だから、2-D CDFを作成して同じことをすることができたと思います。ただし、個々の1-D CDFを使用し、ピックを何らかの方法でリンクすることで、近づく方法はないのでしょうか。 ありがとう!

5
相関する非正規データを生成する方法
相関する非正規データを生成する方法を見つけることに興味があります。理想的には、共分散(または相関)行列をパラメーターとして受け取り、それに近似するデータを生成するある種の分布です。しかし、ここに問題があります。私が見つけようとしている方法には、その多変量歪度や尖度も制御できる柔軟性が必要です。 Fleishmanの方法と通常の変量のべき乗法の使用はおなじみですが、これらの拡張機能のほとんどは、ユーザーが限界歪度と尖度の特定の組み合わせのみを許可し、多変量歪度/尖度をそのまま残していると思います。私が疑問に思ったのは、相関/共分散構造とともに、多変量歪度および/または尖度を指定するのに役立つ方法があるかどうかです。 約1年前、コピュラの分布に関するセミナーを受講しましたが、教授がぶどうのコピュラを使用することで、たとえば1次元の周辺それぞれで対称的であるが、共同で歪曲されたデータを生成できることをさりげなく言及したことを覚えています-その逆。または、さらに低い次元の余白には、最大の次元を対称(または非対称)に保ちながら、ゆがみや尖度を持たせることができます。私はそのような柔軟性が存在する可能性があるというアイデアに驚いていました。私は、前述の方法を説明する何らかの記事または会議論文を見つけようとしましたが、失敗しました:(。コピュラを使用する必要はありません。うまくいくものなら何でもオープンです。 編集:私が意味することを示すために、いくつかのRコードを追加しました。これまでのところ、Mardiaの多変量歪度と尖度の定義に精通しています。私が最初に問題に近づいたとき、対称コピュラ(この場合はガウス)を歪んだ周辺(この例ではベータ)で使用すると、周辺の単変量テストが重要になりますが、マルディアの多変量スキューネス/尖度のテストは重要だと思いました重要ではありません。私はそれを試してみましたが、期待通りに出ませんでした。 library(copula) library(psych) set.seed(101) cop1 <- {mvdc(normalCopula(c(0.5), dim=2, dispstr="un"), c("beta", "beta"),list(list(shape1=0.5, shape2=5), list(shape1=0.5, shape2=5)))} Q1 <- rmvdc(cop1, 1000) x1 <- Q1[,1] y1 <- Q1[,2] cop2 <- {mvdc(normalCopula(c(0.5), dim=2, dispstr="un"), c("norm", "norm"),list(list(mean=0, sd=1), list(mean = 0, sd=1)))} Q2 <- rmvdc(cop2, 1000) x2 <- Q2[,1] y2 <- Q2[,2] mardia(Q1) …

2
相関ベルヌーイ試験、多変量ベルヌーイ分布?
私は仕事で持っている研究の質問を簡素化しています。私が5枚のコインを持っていると想像して、ヘッドを成功と呼びましょう。これらは成功確率p = 0.1の非常に偏ったコインです。コインが独立している場合、少なくとも1ヘッド以上の確率を取得するのは非常に簡単で、です。私のシナリオでは、私のベルヌーイ試験(コイントス)は独立していません。私がアクセスできる唯一の情報は、成功の確率(それぞれがp = .1です)と、バイナリ変数間の理論的なピアソン相関です。1−(1−1/10)51−(1−1/10)51-(1-1/10)^5 この情報だけで1つ以上の成功の確率を計算する方法はありますか?これらの理論的な結果はシミュレーション研究の精度を導くために使用されるため、シミュレーションベースのアプローチを避けようとしています。多変量ベルヌーイ分布を調べてきましたが、相関と成功の限界確率でのみ完全に指定できるとは思いません。私の友人は、ベルヌーイ辺縁でガウスコピュラを構築することを推奨し(Rパッケージを使用copula)pMvdc()、大きなサンプルで関数を使用して希望する確率を取得しましたが、どうやってそれを実行するのか正確にはわかりません。

1
R / mgcv:なぜte()とti()テンソル積が異なる表面を生成するのですか?
のmgcvパッケージにRは、テンソル積の相互作用をフィッティングするための2つの関数がte()ありti()ます。私は2つの作業の基本的な分業を理解しています(非線形の相互作用を当てはめるか、この相互作用を主効果と相互作用に分解するか)。私が理解していないのは、なぜte(x1, x2)、そしてti(x1) + ti(x2) + ti(x1, x2)(わずかに)異なる結果を生成するのかということです。 MWE(から適応?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 


2
混合分布の逆CDFサンプリング
コンテキスト外のショートバージョン ましょうyyy CDFを有する確率変数である F(⋅)≡{θθ+(1−θ)×CDFlog-normal(⋅;μ,σ) y = 0 y > 0F(⋅)≡{θ y = 0 θ+(1−θ)×CDFlog-normal(⋅;μ,σ) y > 0 F(\cdot) \equiv \cases{\theta & y = 0 \\ \theta + (1-\theta) \times \text{CDF}_{\text{log-normal}}(\cdot; \mu, \sigma) & y > 0} 逆CDF法を使用して描画をシミュレートしたいとしましょうyyy。それは可能ですか?この関数は、厳密には逆を持ちません。次に、2つの正規分布の混合分布の逆変換サンプリングがあります。これは、ここで逆変換サンプリングを適用する既知の方法があることを示唆しています。 2ステップの方法は知っていますが、自分の状況に適用する方法がわかりません(以下を参照)。 背景付きロングバージョン MCMC(具体的には、Stan)を使用して、ベクトル値応答yi=(y1,…,yK)iyi=(y1,…,yK)iy^i = \left( y_1 , \dots , y_K \right)^iに次のモデルを適合させました。 θik≡logit−1(αkxi),μik≡βkxi−σ2k2F(⋅)≡{θθ+(1−θ)×CDFlog-normal(⋅;μ,σ) y …

2
適応コピュラとは何ですか?
私の基本的な質問は、適応コピュラとは何ですか? 適応コピュラについてのプレゼンテーションのスライドがあります(残念ながら、スライドの作成者に質問することはできません)。これは何に適していますか? スライドは次のとおりです。 次に、スライドは変化点テストに進みます。私はこれが何であるか、そしてなぜ私はコピュラに関連してこれが必要なのかと思っていますか? スライドは、適応的に推定されたパラメータープロットで終了します。 これは、私の見積もりが遅れていることを示しているようです。他の解釈、コメントは素晴らしいです!

1
相関確率のベクトルがある場合。相関関係を壊すことなく、それらをバイナリに変換するにはどうすればよいですか?
私の最終的な目標は、相関するベルヌーイ確率変数のサイズのベクトルを生成する方法を持つことができるようにすることです。これを行う1つの方法は、ガウスクープラアプローチを使用することです。ただし、ガウシアンクープラアプローチでは、ベクトルが残ります。NNN (p1,…,pN)∈[0,1]N(p1,…,pN)∈[0,1]N (p_1, \ldots, p_N) \in [0,1]^N Suppose that I have generated (p1,…,pN)(p1,…,pN)(p_1, \ldots, p_N) such that the common correlation between them is ρρ\rho. Now, how can I transform these into a new vector of 000 or 111's? In other words, I would like: (X1,…,XN)∈{0,1}N(X1,…,XN)∈{0,1}N (X_1, \ldots, X_N) \in \{0,1\}^N …

1
MCMC for PDFのcdfsに相当するものは何ですか?
特定のコピュラ、つまりで定義された多変量cdfからのシミュレーションに関する相互検証された質問と共に、私はより大きな図、つまり、そのような関数が与えられた場合、対応する確率分布からシミュレーションする一般的なアルゴリズムを計算できますか?、[ 0 、1 ]C(u1,…,uk)C(u1,…,uk)C(u_1,\ldots,u_k)[0,1]k[0,1]k[0,1]^k 明らかに、一つの解決策は、区別することである対応するPDF生成するために時間をし、その後からのサンプルを生成するメトロポリス・ヘイスティングスような一般的なMCMCアルゴリズムを呼び出す(又は)。k個のκ (U 1、... 、U K)C κCCC kkkκ(u1,…,uk)κ(u1,…,uk)\kappa(u_1,\ldots,u_k)CCCκκ\kappa 余談:別の解決策は、シミュレーションにラプラススティエルス変換を使用して、アルキメデスのコピュラに固執することですが、これは実際には常に可能であるとは限りません。上記の質問を解決しようとしたときに私が見つけたように。 私の質問は、可能であれば、この差別化ステップを一般的な方法で回避することです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.