タグ付けされた質問 「independence」

イベント(または確率変数)は、それらのいくつかについての情報が他の発生(/分布)の確率について何も伝えていない場合、独立しています。代わりに、この変数を独立変数の使用[予測子]に使用しないでください。


3
例:バイナリ結果にglmnetを使用したLASSO回帰
私は興味のある結果が二分されglmnetているLASSO回帰の使用に手を出し始めています。以下に小さな模擬データフレームを作成しました。 age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, 2, 2, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

8
既存の変数と定義された相関関係を持つランダム変数を生成します
シミュレーション研究のために、既存の変数に対する事前定義された(母集団)相関を示すランダム変数を生成する必要があります。YYY 私は、に見えたRパッケージcopulaとCDVine特定の依存構造を持つランダムな多変量分布を生成することができました。ただし、結果の変数の1つを既存の変数に修正することはできません。 アイデアや既存の機能へのリンクを歓迎します! 結論: さまざまなソリューションで、2つの有効な答えが出ました。 カラカルによるR スクリプト。事前定義された変数との正確な(サンプル)相関を持つランダム変数を計算します 事前定義された変数に対する定義された母集団相関を持つランダム変数を計算するR 関数 [@ttnphnsの追加:質問のタイトルを単一の固定変数の場合から任意の数の固定変数に拡大するために自由を取りました。すなわち、いくつかの固定された既存の変数と事前定義された相関を持つ変数を生成する方法]

13
連続して10頭あると、次のトスが尻尾になる可能性が高くなりますか?
私は、次が真であると仮定します。公正なコインを想定し、コインを投げながら、行の10頭を得ることが次のコイントスが尾であることの可能性を高めるません関係なく、周りに翻弄される確率および/または統計的な専門用語のどのような量、 (しゃれを許しなさい)。 そうであると仮定して、私の質問はこれです:私は一体どうやって誰かを説得するのですか? 彼らは賢くて教育を受けていますが、私はこれに関して正しいと思うかもしれないとは考えないように決心しているようです(議論)。

4
共分散と独立性?
私は教科書から、はXとYが独立していることを保証しないと読みました。しかし、それらが独立している場合、それらの共分散は0でなければなりません。適切な例はまだ考えられません。誰かがそれを提供できますか?cov(X,Y)=0cov(X,Y)=0\text{cov}(X,Y)=0

7
2つの連続変数が独立していることをテストするにはどうすればよいですか?
XとYの共同分布からのサンプルがあるとします。XとYは独立しているという仮説をどのように検証しますか?(Xn,Yn),n=1..N(Xn,Yn),n=1..N(X_n,Y_n), n=1..NXXXYYYXXXYYY XXXとYの結合または周辺分布の法則については仮定されていませんYYY(すべての結合の正規性の中で、独立性は相関が0であるため同一です000) XXXとYの間の可能な関係の性質については想定されていませんYYY。非線形である可能性があるため、変数は無相関(r=0r=0r=0)ですが、高度に共依存(I=HI=HI=H)です。 私は2つのアプローチを見ることができます: 両方の変数をビンし、フィッシャーの正確検定またはG 検定を使用します。 プロ:定評のある統計検定を使用する 短所:ビニングに依存 推定依存性のと:(これはの独立のためにととそれらは互いに完全に決定)。XXXYYYI(X;Y)H(X,Y)I(X;Y)H(X,Y)\frac{I(X;Y)}{H(X,Y)}000XXXYYY111 プロ:明確な理論的意味を持つ数字を生成します Con:おおよそのエントロピー計算に依存します(つまり、再びビニングします) これらのアプローチは理にかなっていますか? 人々が使用する他の方法は何ですか?

1
複数のランダム変数の積の分散
2つの独立変数の答えを知っています: V a r(XY)= E(X2Y2)− (E(XY))2= V a r(X)V a r(Y)+ V a r(X)(E(Y))2+ V a r(Y)(E(X))2Var(XY)=E(X2Y2)−(E(XY))2=Var(X)Var(Y)+Var(X)(E(Y))2+Var(Y)(E(X))2 {\rm Var}(XY) = E(X^2Y^2) − (E(XY))^2={\rm Var}(X){\rm Var}(Y)+{\rm Var}(X)(E(Y))^2+{\rm Var}(Y)(E(X))^2 しかし、3つ以上の変数の積をとると、各変数の分散と期待値の観点から答えはどうなりますか?V a r( X1バツ2⋯ Xn)Var(X1X2⋯Xn){\rm Var}(X_1X_2 \cdots X_n)

10
飛行機を直接飛ばすと、飛行機のcrash落事故で死亡する可能性は減りますか?
私は最近、飛行機のin落による死亡の可能性を最小限に抑えることについて、友人と意見の相違がありました。これは初歩的な統計問題です。 彼は、飛行機のcrash落事故で死亡する可能性を減らすため、目的地に直接飛ぶことを好むと述べました。彼の論理は、民間航空会社のcrash落の確率が10,000分の1である場合、目的地に着くために2機の飛行機で飛行すると死亡の可能性が2倍になるというものでした。 私のポイントは、飛行機に乗るたびに、将来の飛行機のcrash落で彼が死ぬ可能性が高まるわけではないということでした。つまり、各飛行機の飛行は独立しています。誰かがその年に100機の飛行機で飛んだとしても、たった1機で飛んだとしても、両方のチラシは次のフライトで飛行機crash落事故で死亡する可能性が10,000分の1あります。 別のポイント:目的地は4時間先だと言います。直行便を利用する場合、衝突するリスクがある状態で4時間空中にいます。ここで、4つの異なる接続便を利用するとします。各便の所要時間は約1時間です。このシナリオでは、約4時間空中にいます。したがって、直行便を利用する場合でも、お金を節約して乗り継ぎ便を利用する場合でも、危険にさらされる時間はほぼ同じです。 私の最後のポイントは、短いフライトほどcrash落率が低いということでした。私はそれをどこからともなく引き出しました。私はゼロの研究を行い、それをバックアップするゼロのデータを持っていますが、...それは論理的に思えます。 誰が正しいのか、そしてその理由は?ここには多くの問題があります。


3
統計的独立は因果関係の欠如を意味しますか?
2つの確率変数AとBは統計的に独立しています。これは、プロセスのDAGで:およびもちろん意味します。しかし、それはまた、BからAへの玄関口がないことを意味しますか?(A⊥⊥B)(A⊥⊥B)(A {\perp\!\!\!\perp} B)P(A|B)=P(A)P(A|B)=P(A)P(A|B)=P(A) そのため、を取得する必要があるためです。その場合、統計的独立性は自動的に因果関係の欠如を意味しますか?P(A|do(B))=P(A)P(A|do(B))=P(A)P(A|do(B))=P(A)

3
XとYが無相関の場合、X ^ 2とYも無相関ですか?
2つの確率変数とが無相関の場合、とが無相関であることもわかりますか?私の仮説はイエスです。Y X 2 YXXXYYYX2X2X^2YYY E [ X Y ] = E [ X ] E [ Y ]X,YX,YX, Y無相関は、またはE[XY]=E[X]E[Y]E[XY]=E[X]E[Y]E[XY]=E[X]E[Y] E[ XY] = ∫x yfバツ(x )fY(y)dx dy= ∫x fバツ(x )dX ∫yfY(y)dy= E[ X] E[ Y]E[XY]=∫xyfX(x)fY(y)dxdy=∫xfX(x)dx∫yfY(y)dy=E[X]E[Y] E[XY]=\int xy f_X(x)f_Y(y)dxdy=\int xf_X(x)dx\int yf_Y(y)dy=E[X]E[Y] それは次のことも意味しますか? E[ X2Y] = ∫バツ2yfバツ(x )fY(y)dx dy= ∫バツ2fバツ(x )dX ∫yfY(y)dy= E[ …

3
「独立した観測」とはどういう意味ですか?
私は、独立した観測の仮定が意味するものを理解しようとしています。いくつかの定義は次のとおりです。 「2つのイベントは、場合にのみ独立しています。」(統計用語辞書)P(a∩b)=P(a)∗P(b)P(a∩b)=P(a)∗P(b)P(a \cap b) = P(a) * P(b) 「あるイベントが発生しても、別のイベントの確率は変わりません」(ウィキペディア)。 「1つの観測値のサンプリングは、2番目の観測値の選択に影響しません」(David M. Lane)。 しばしば与えられる従属的な観察の例は、以下のように教師内にネストされた学生です。教師は生徒に影響を与えますが、生徒はお互いに影響を与えないと仮定しましょう。 では、これらのデータの定義はどのように違反されますか?[student = 1]のサンプリング[grade = 7]は、次にサンプリングされるグレードの確率分布に影響しません。(または、もしそうなら、観測1は次の観測に関して何を予測しますか?) gender 代わりに 測定した場合、観測はなぜ独立しているのteacher_idでしょうか?同じように観測に影響しませんか? teacher_id student_id grade 1 1 7 1 2 7 1 3 6 2 4 8 2 5 8 2 6 9


3
直交、相関、独立の関係は何ですか?
計画されたコントラストを使用して一元配置分散分析で異なる手段を見つけるとき、それらが無相関であり、タイプIエラーが膨らまないようにするために、制約は直交する必要があるという記事を読みました。 どのような状況でも、直交が無相関を意味する理由はわかりません。その視覚的/直感的な説明が見つからないため、これらの記事/回答を理解しようとしました https://www.psych.umn.edu/faculty/waller/classes/FA2010/Readings/rodgers.pdf 統計の文脈で直交とはどういう意味ですか? しかし、私には、彼らは互いに矛盾しています。最初は、2つの変数が無相関および/または直交の場合、それらは線形独立であるが、それらが線形独立であるという事実は、それらが無相関および/または直交であることを意味しないと言います。 2番目のリンクには、「直交は無相関を意味する」、「XとYが独立している場合は直交であるが、逆は成り立たない」などの回答があります。 2番目のリンクの別の興味深いコメントは、2つの変数間の相関係数がこれらの変数に対応する2つのベクトル間の角度のコサインに等しいことを示しています。これは、2つの直交ベクトルが完全に無相関であることを意味します(最初の記事とは異なります)クレーム)。 それでは、独立性、直交性、相関関係の本当の関係は何ですか?たぶん私は何かを見逃したが、それが何であるかを見つけることができません。

4
独立したランダム変数の機能
独立したランダム変数の関数自体が独立しているという主張は本当ですか? 結果は、いくつかの証明、たとえば正規分布の標本平均と標本分散の独立性の証明などで暗黙的に使用されることがよくありますが、その正当性を見つけることができませんでした。一部の著者はそれを与えられたとおりに受け取っているようですが、これが常に当てはまるかどうかはわかりません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.