タグ付けされた質問 「bivariate」

2つの変数の結合確率分布。

3
結合分布がガウスではないガウス確率変数のペアを持つことは可能ですか?
就職の面接で誰かが私にこの質問をしましたが、彼らの共同分布は常にガウス分布であると答えました。私はいつでも平均と分散と共分散を持つ二変量ガウスを書くことができると思いました。2つのガウス分布の結合確率がガウス分布ではない場合がありますか?

3
密度推定はどこで役立ちますか?
少し簡潔な数学を経て、カーネル密度の推定について少し直感が得られたと思います。しかし、3つを超える変数の多変量密度を推定することは、その推定量の統計的性質の観点から、良いアイデアではないかもしれないことも認識しています。 それでは、たとえば、ノンパラメトリック法を使用して、二変量密度をどのような状況で推定する必要がありますか?3つ以上の変数の推定を心配するのに十分な価値がありますか? 多変量密度の推定の適用に関するいくつかの有用なリンクを指すことができれば、それは素晴らしいことです。

2
共同正規性は、正常なランダム変数の合計が正常であるための必要条件ですか?
関連する質問に対する私のこの回答に続くコメントで、ユーザーssdecontrolとGlen_b は、合計正規性を主張するためにと共同正規性が必要かどうかを尋ねました。ジョイントの正規性が十分であることは、もちろんよく知られています。この補足的な質問はそこでは取り上げられておらず、おそらくそれ自体で検討する価値があります。XXXYYYX+YX+YX+Y 共同正規性は限界正規性を意味するので、私は尋ねます が通常のランダム変数であるが、とが 一緒に通常のランダム変数ではないような 通常のランダム変数とが存在しますか?XXXYYYX+YX+YX+YXXXYYY 場合はと正規分布を持つ必要はありません、正常な確率変数を簡単に見つけることができます。1つの例は、以前の回答にあります(リンクは上記のとおりです)。上記のハイライトされた質問に対する答えは「はい」であると信じており、この質問に対する答えとして例を(私が思うに)掲載しています。XXXYYY

1
最小リスク分類子の計算しきい値?
2つのクラスとに属性あり、分布がととします。次のコストマトリックスの前のが等しい場合:、C 2、X N(0 、0.5 )N(1 、0.5 )P (C 1)= P (C 2)= 0.5C1C1C_1C2C2C_2xxxN(0,0.5)N(0,0.5) \cal{N} (0, 0.5)N(1,0.5)N(1,0.5) \cal{N} (1, 0.5)P(C1)=P(C2)=0.5P(C1)=P(C2)=0.5P(C_1)=P(C_2)=0.5 L=[010.50]L=[00.510]L= \begin{bmatrix} 0 & 0.5 \\ 1 & 0 \end{bmatrix} なぜ、は最小リスク(コスト)分類器のしきい値ですか?x0&lt;0.5x0&lt;0.5x_0 < 0.5 これは私が誤解している私のメモの例です(つまり、このしきい値にどのように到達したのですか?) 編集1:尤度比のしきい値には、P(C1)/ P(C2)を使用できると思います。 編集2:しきい値に関するいくつかのテキストをパターンのDuda Bookから追加します。

5
二変量正規分布データから楕円領域を取得する方法は?
私は次のようなデータを持っています: 私は正規分布を適用しようとしました(カーネル密度の推定はうまく機能しますが、それほど高い精度は必要ありません)。これは非常にうまく機能します。密度プロットは楕円を作成します。 その楕円関数を取得して、点が楕円の領域内にあるかどうかを判断する必要があります。どうやってするか? RまたはMathematicaコードを歓迎します。
11 r  regression  pdf  bivariate 

1
「バグプロット」または「二変量ボックスプロット」とは何ですか?
私は箱ひげ図の多次元(ここでは2変量)バージョンを紹介する論文を見つけました。そのバグプロットは正確には何ですか?頂点に基づいてネストされた一連のポリゴンを確認できます。これらのポリゴンの1つはバグプロットとして宣言されています。ネストされたポリゴン構築のアイデアは何ですか?バグプロットであるポリゴンはどれですか(中央またはポイントの平均数を保持)。バグプロットのエッジには、いくつかの有用なプロパティがありますか(特にポイントセットを分割するなど)?

2
平均と分散がわかっている場合、2変量正規データの共分散の最尤推定値は何ですか?
平均としてゼロ、分散として1を持つ2変量正規分布からの無作為標本があるとすると、唯一の未知のパラメーターは共分散です。共分散のMLEとは何ですか?私はそれが1のようなものでなければならないことを知っていますしかし、これをどうやって知るのでしょうか?1んΣんj = 1バツjyj1n∑j=1nxjyj\frac{1}{n} \sum_{j=1}^{n}x_j y_j

1
Anova()とdrop1()がGLMMに異なる回答を提供したのはなぜですか?
次の形式のGLMMがあります。 lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 私が使用している場合drop1(model, test="Chi")、私は私が使用している場合とは異なる結果を得るAnova(model, type="III")車のパッケージからかsummary(model)。後者の2つは同じ答えを与えます。 大量の偽造データを使用して、これらの2つの方法は通常違いがないことがわかりました。それらは、平衡線形モデル、不平衡線形モデル(異なるグループでnが等しくない場合)、および平衡一般化線形モデルに対して同じ答えを示しますが、平衡一般化線形混合モデルに対しては同じ答えを与えません。したがって、ランダムな要素が含まれている場合にのみ、この不一致が現れます。 これらの2つの方法の間に違いがあるのはなぜですか? GLMMを使用する場合は必要がありますAnova()かdrop1()使用できますか? これらの2つの違いは、少なくとも私のデータでは、かなりわずかです。どちらを使用するかは問題ですか?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

2
合計が正常ではない2つの*相関した*正規変数の例
私は、わずかに正常であるが共同して正常ではない相関ランダム変数のペアのいくつかの素晴らしい例を知っています。参照してください、この答えによってディリップSarwate、およびこれによって枢機卿を。 また、合計が正常でない2つの正規確率変数の例も認識しています。Macroによるこの回答を参照してください。ただし、この例では、2つの確率変数は相関していません。 非ゼロの共分散を持ち、合計が正規でない2つの正規確率変数の例はありますか?あるいは、2変量正規ではない場合でも、相関する2つの正規確率変数の合計が正常でなければならないことを証明することは可能ですか? [コンテキスト:分布を求める宿題があります。ここで、とは相関標準法線です。私はそれらが二変量正常であることを指定することを意図した質問だと思います。しかし、私は non-zero に対するこの追加の仮定なしに何かが言えるかどうか疑問に思っています。]aX+bYaX+bYaX+bYXXXYYYρρ\rhoρρ\rho ありがとう!


4
これはどんな分布ですか?
2つの変数間の共分散がゼロの制限分布に直面しましたが、それらの相関はです。そのような分布はありますか?どのように説明できますか?111 詳細を教えてください。OK、XとYは、分散と平均が異なる(nがない)2変量正規分布ですが、corr = 1-(1 / n)ですが、Yn | Xn = xの極限分布を調べます。

2
通常のマージンと指定された(ピアソン)相関による条件付き期待値の制限
別のフォーラムで次の質問を見ました。 「成人男性の身長と体重の両方が通常のモデルで説明でき、これらの変数間の相関が0.65であると仮定します。男性の身長が彼を60パーセンタイルに配置する場合、彼の体重はどのパーセンタイルであると予想しますか?」 問題のフォーラムの誰かが、質問はマージンが正常(height and weight ... can be described with normal models)であり、2変量の正常性について話しており、質問に単一の答えがないことをすでに指摘していることを私は知っています。 明らかに、答えは実際の2変量依存関係(コピュラ)に依存します。 私の質問は: 通常のマージンと指定された母集団相関(ρρ\rho、ピアソン相関)が与えられた場合、X とYの両方が正規であり、相関ρがある場合、境界を見つけるのに適度に簡単な方法はありますか?E(Y| バツ= xq)E(Y|X=xq)E(Y|X=x_q)バツ、YX,YX,Yρρ\rho 条件付き期待値の正確な最大値と最小値がある場合、それ(および優先的には、それぞれが発生する状況*)を知っておくとよいでしょう。 *私はそれらの状況がどうなるかについて強い疑いを抱いています(つまり、関与する可能性のある依存の種類。特に、特定の種類の縮退分布が範囲を与えることを期待します)。深さ。(私は誰かがすでにそれを知っている可能性が高いと思います。) それができない場合、最大値と最小値の両方の上限または下限が興味深いでしょう。 代数的な答えはいいでしょうが、私は代数的な答えを必ずしも必要としません(いくつかのアルゴリズムはそうするでしょう)。 概算または部分的な回答が役立つ/役立つ場合があります。 誰も良い答えを持っていない場合、私はそれを自分で試してみるかもしれません。

1
Royモデルの2変量標準正規および暗黙条件付き確率の特性
長いタイトルで申し訳ありませんが、私の問題はかなり具体的であり、1つのタイトルで説明するのは困難です。 私は現在ロイモデル(治療効果分析)について学んでいます。 私のスライドには、1つの導出ステップがありますが、これは理解できません。 治療群での治療の予想結果を計算します(ダミーDは治療か非治療か)。これは E[Y1|D=1]E[Y1|D=1]\begin{align} E[Y_1|D=1] \end{align} 以来、このように書き換えることができる E [ Y 1 | D = 1 ]Y1=μ1+U1Y1=μ1+U1Y_1=\mu_1 + U_1 についても説明しましたが、Y1&gt;Y0の場合、 D=1となるため、次のようになります。E[Y1|D=1]=E[μ1+U1|D=1]=μ1+E[U1|D=1]E[Y1|D=1]=E[μ1+U1|D=1]=μ1+E[U1|D=1]\begin{align} E[Y_1|D=1] &= E[\mu_1+U_1|D=1]\\ &=\mu_1+ E[U_1|D=1] \end{align}D=1D=1D=1Y1&gt;Y0Y1&gt;Y0Y_1>Y_0 Y1−Y0&gt;0Y1−Y0&gt;0Y_1-Y_0>0 μ1+U1−(μ0−U0)&gt;0μ1+U1−(μ0−U0)&gt;0\mu_1+U_1-(\mu_0-U_0)>0 (μ1+U1)/σ−(μ0−U0)/σ&gt;0(μ1+U1)/σ−(μ0−U0)/σ&gt;0(\mu_1+U_1)/\sigma-(\mu_0-U_0)/ \sigma >0 Z−ϵ&gt;0Z−ϵ&gt;0Z-\epsilon>0 したがって、ϵ &lt; Zの場合、D=1D=1D=1ϵ&lt;Zϵ&lt;Z\epsilonc)=E[\rho u_2|u_2>c]=\rho E[u_2|u_2>c)=\rho\frac{\phi(c)}{1-\Phi(c)} σ1 ϵσ1ϵ\sigma_{1\epsilon}ρρ\rho μ1− E[ U1| ϵ&lt;Z] = μ1+ ρ φ (Z)Φ (Z)μ1−E[U1|ϵ&lt;Z]=μ1+ρϕ(Z)Φ(Z)\begin{align} …

1
二変量中央値のデータと信頼 "楕円"(領域?)を見つけますか?
二変量中央値の周りのデータと信頼楕円を計算する方法について疑問に思っています。たとえば、次のデータの二変量平均のデータ楕円または信頼楕円を簡単に計算できます(ここではデータ楕円のみを示しています)。 library("car") set.seed(1) df &lt;- data.frame(x = rnorm(200, mean = 4, sd = 1.5), y = rnorm(200, mean = 1.4, sd = 2.5)) plot(df) with(df, dataEllipse(x, y, level = 0.68, add = TRUE)) しかし、私は二変量中央値に対してこれをどのように行うのかと苦労していますか?単変量の場合、リストラップをブートストラップして必要な間隔を生成することができますが、これを二変量の場合に変換する方法がわかりませんか? @Andy Wが指摘したように、中央値は一意に定義されていません。この例では、そのポイントでの観測間の距離のL1ノルムを最小化するポイントを見つけることにより、空間中央値を使用しました。観測されたデータポイントから空間中央値を計算するために最適化が使用されました。 さらに、実際のユースケースにおけるx、yデータペアは、非類似度マトリックスの主座標分析の2つの固有ベクトルであるため、特定の攻撃手段を提供する場合、xとyは直交している必要があります。 実際の使用例では、ユークリッド空間の点のグループのデータ/信頼楕円を計算します。例えば: 分析は、グループ間の分散の均一性のリーベン検定の多変量類似体です。多変量中心傾向の尺度として空間中央値または標準グループの重心を使用し、空間中央値の場合の上の図のデータ楕円に相当するものを追加します。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.