タグ付けされた質問 「chi-squared」

テスト(通常、分布、独立性、または適合度)またはそのようなテストに関連する分布のファミリー。

1
従属カイ2乗確率変数の比率の分布
仮定X I〜N (0 、σ 2)独立しています。X=X1+X2+⋯+XnX=X1+X2+⋯+Xn X = X_1 + X_2+\cdots+ X_n Xi∼N(0,σ2)Xi∼N(0,σ2)X_i \sim N(0,\sigma^2) 私の質問は、ディストリビューションが何をするかです Z=X2X21+X22+⋯+X2nZ=X2X12+X22+⋯+Xn2 Z = \frac{X^2}{X_1^2 + X_2^2 + \cdots + X_n^2} フォローする?ここから、Wとして表される2つのカイ2乗確率変数の比率がはベータ分布に従います。これはWとYの間の独立性を前提としていると思います。私の場合でも、Zの分母にはXの2乗の成分が含まれています。WW+YWW+Y\frac{W}{W + Y}WWWYYYZZZXXX もベータ分布のバリエーションに従う必要があると思いますが、よくわかりません。この仮定が正しい場合、それを証明する方法がわかりません。ZZZ

2
なぜマクネマーの検定は正規分布ではなくカイ二乗を使用するのですか?
正確でないマクネマーの検定がカイ二乗漸近分布をどのように使用するかに気づきました。しかし、正確な検定(2つのケースのテーブルの場合)は二項分布に依存しているため、二項分布の正規近似を提案することが一般的ではないのはなぜですか。 ありがとう。

2
フィッシャーの正確確率検定はどの分布を想定していますか?
私の仕事では、フィッシャーの正確確率検定のいくつかの使用法を見てきましたが、それが自分のデータにどれだけうまく適合するかと思っていました。いくつかの情報源を見て、統計の計算方法を理解しましたが、仮定された帰無仮説の明確で正式な説明を見たことはありません。 誰かが私に仮定された分布の正式な説明を説明したり参照したりできますか?分割表の値に関する説明に感謝します。

1
クロステーブル分析のどのテスト:BoschlooまたはBarnard?
30人の患者の小さなデータセットから2x2テーブルを分析しています。私たちは、どの治療法を選ぶべきかについてのヒントを与えるいくつかの変数を遡及的に見つけようとしています。変数(obs normal / strange)と処理決定(A / B)は特に興味深いので、データは次のようになります。 Obs/Tr. Dec.normalstrangeA12012B1351825530Obs/Tr. Dec.ABnormal121325strange055121830\begin{array} {|r|r|r|r|} \hline \text{Obs/Tr. Dec.} &\text{A} &\text{B}\\ \hline \text{normal} &12 &13 &25\\ \hline \text{strange} &0 &5 &5\\ \hline &12 &18 &30\\ \hline \hline \end{array} 明らかに、1つのセルは、カイ2乗検定を除外するエントリに欠けており、フィッシャーの正確確率検定は飽和p値を与えません(ただし、まだ<10%)。したがって、私の最初のアイデアは、より強力なテストを見つけることでした。私はブログを読んで おり、この記事では、バーナードのテストとボクロスのテストについて、一般に、強力なテストにつながる3つのシナリオがあります。 列と行の合計を修正フィッシャーの正確確率検定→→\rightarrow 列または(xclusive)行合計が固定 Barnardの正確検定→→\rightarrow 何も修正されていない Boschloosの正確な検定→→\rightarrow 上記の記事は、治療Aと治療Bの合計が以前にほとんど知られていないため、フィッシャーの正確確率検定を除外できることを指摘しました。しかし、他の選択肢はどうですか?正常なコントロールがある場合のコントロールでは、コントロールできる数のプラセボとverumグループをコントロールできるため、2を選択します:Barnard。私の場合、私にはわかりません。一方で、同様の数学的な問題(プラセボ/バームの合計に等しい観測レベルの合計)があるため、バーナードにつながりますが、デザインを変えることができません。 nr。3につながるサンプルを取得する前の観察の正常/奇妙さ:Boschloo。 それでは、どのテストを使用する必要がありますか。その理由は何ですか。もちろんハイパワーが欲しいです。 (私が知りたいもう1つの質問はchisq.test、rの場合に使用する方が良いprop.test(x, alternative = "greater")かどうかです。理論的な側面については、ここで説明します。)


2
期待
LET、、、と無関係です。の期待は何ですか?X1X1X_1X2X2X_2⋯⋯\cdotsXd∼N(0,1)Xd∼N(0,1)X_d \sim \mathcal{N}(0, 1)X41(X21+⋯+X2d)2X14(X12+⋯+Xd2)2\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2} は対称で簡単に見つけることができます。しかし、私はの期待値を見つける方法を知りません。ヒントを教えてください。E(X21X21+⋯+X2d)=1dE(X12X12+⋯+Xd2)=1d\mathbb{E}\left(\frac{X_1^2}{X_1^2 + \cdots + X_d^2}\right) = \frac{1}{d}バツ41(X21+ ⋯ + X2d)2X14(X12+⋯+Xd2)2\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2} これまでに入手したもの を対称的に見つけたかった。しかし、この場合には、の場合と異なっているので、は。だから私は期待を見つけるためにいくつかの他のアイデアが必要です。E (X41(X21+ ⋯ + X2d)2)E(X14(X12+⋯+Xd2)2)\mathbb{E}\left(\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2}\right)E (X21バツ21+ ⋯ + X2d)E(X12X12+⋯+Xd2)\mathbb{E}\left(\frac{X_1^2}{X_1^2 + \cdots + X_d^2}\right)E (X4私(X21+ ⋯ + X2d)2)E(Xi4(X12+⋯+Xd2)2)\mathbb{E}\left(\frac{X_i^4}{(X_1^2 + \cdots + X_d^2)^2}\right)E (X2私バツ2j(X21+ ⋯ …

1
2サンプルのカイ2乗検定
この質問は、ファンデルファールトの本、漸近統計、pg。253.#3: その仮定とYを n個のパラメータと独立多項ベクターである(M 、1、... 、K)と(N 、B 1、... 、BのK)。帰無仮説の下で、私は = bが、私はあることを示しますXmバツメートル\mathbf{X}_mYnYん\mathbf{Y}_n(m,a1,…,ak)(メートル、a1、…、ak)(m,a_1,\ldots,a_k)(n,b1,…,bk)(ん、b1、…、bk)(n,b_1,\ldots,b_k)ai=bia私=b私a_i=b_i 有するχ 2 K - 1つの分布。ここで、C I=を(XはM、I+YN、I)/(M+N)。∑i=1k(Xm 、私− m c^私)2m c^私+ ∑i = 1k(Yn 、i− n c^私)2n c^私Σ私=1k(バツメートル、私−メートルc^私)2メートルc^私+Σ私=1k(Yん、私−んc^私)2んc^私\sum_{i=1}^k \dfrac{(X_{m,i} - m\hat{c}_i)^2}{m\hat{c}_i} + \sum_{i=1}^k \dfrac{(Y_{n,i} - n\hat{c}_i)^2}{n\hat{c}_i}χ2k − 1χk−12\chi^2_{k-1}c^私= (Xm 、私+ Yn 、i)/(m + n )c^私=(バツメートル、私+Yん、私)/(メートル+ん)\hat{c}_i = (X_{m,i} + Y_{n,i})/(m+n) 始めるのに助けが必要です。ここの戦略は何ですか?2つの加数を次のように組み合わせることができました。 Σi …

1
2x2およびIx2(単一因子-バイナリ応答)分割表のロジスティック回帰とカイ2乗?
2x2およびIx2の分割表でのロジスティック回帰の使用を理解しようとしています。たとえば、これを例として使用します カイ二乗検定とロジスティック回帰の違いは何ですか?次のような複数の名目上の因子(Ix2テーブル)を持つテーブルはどうでしょうか。 ここに同様の質問がありますが、答えは主にカイ二乗がmxnテーブルを処理できるということですが、私の質問は、バイナリの結果と単一の名目上の因子がある場合の具体的なものです。(リンクされたスレッドはこのスレッドも指しますが、これは複数の変数/因子に関するものです)。 それがバイナリ応答を持つ単一の因子(つまり、他の変数を制御する必要がない)の場合、ロジスティック回帰を行う目的の違いは何ですか?

3
G検定とピアソンのカイ2乗検定
分割表で独立性をテストしています。G検定とピアソンのカイ2乗検定のどちらが良いかわかりません。サンプルサイズは数百ですが、いくつかの低い細胞数があります。ウィキペディアのページで述べたように、カイ二乗分布の近似は、ピアソンのカイ二乗検定よりもG検定の方が優れています。しかし、モンテカルロシミュレーションを使用してp値を計算しているので、これら2つのテストの間に違いはありますか?N× MN×MN \times M

2
ピアソンのカイ二乗統計はカイ二乗分布をどのように近似しますか
したがって、ピアソンのカイ二乗統計がテーブルに対して与えられた場合、その形式は次のようになります。1×N1×N1 \times N ∑i=1n(Oi−Ei)2Ei∑i=1n(Oi−Ei)2Ei\sum_{i=1}^n\frac{(O_i - E_i)^2}{E_i} 次に、これは、サンプルサイズが大きくなるにつれて、自由度のカイ2乗分布であるに近似します。 N - 1 Nχ2n−1χn−12\chi_{n-1}^2n−1n−1n-1NNN 私が理解していないのは、この漸近近似がどのように機能するかです。分母のは置き換えられるべきだと思います。これにより、が得られます。しかしもちろん、これにはではなくの自由度があるため、明らかに他のことが起こっています。s 2 iEiEiE_i χ 2 、N =Σを N iが= 1 Z 2 I ZI〜N(0、1)N、N-1s2inisi2ni\frac{s_i^2}{n_i}χ2n=∑ni=1Z2iχn2=∑i=1nZi2\chi_n^2 = \sum_{i=1}^nZ_i^2Zi∼n(0,1)Zi∼n(0,1)Z_i\sim n(0,1)nnnn−1n−1n-1

1
Anova()とdrop1()がGLMMに異なる回答を提供したのはなぜですか?
次の形式のGLMMがあります。 lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 私が使用している場合drop1(model, test="Chi")、私は私が使用している場合とは異なる結果を得るAnova(model, type="III")車のパッケージからかsummary(model)。後者の2つは同じ答えを与えます。 大量の偽造データを使用して、これらの2つの方法は通常違いがないことがわかりました。それらは、平衡線形モデル、不平衡線形モデル(異なるグループでnが等しくない場合)、および平衡一般化線形モデルに対して同じ答えを示しますが、平衡一般化線形混合モデルに対しては同じ答えを与えません。したがって、ランダムな要素が含まれている場合にのみ、この不一致が現れます。 これらの2つの方法の間に違いがあるのはなぜですか? GLMMを使用する場合は必要がありますAnova()かdrop1()使用できますか? これらの2つの違いは、少なくとも私のデータでは、かなりわずかです。どちらを使用するかは問題ですか?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

2
カイ二乗の信頼区間
2つの「適合度のカイ2乗」検定を比較するための解決策を見つけようとしています。より正確には、2つの独立した実験の結果を比較します。これらの実験では、著者らは適合度のカイ2乗を使用して、ランダムな推測(期待される周波数)と観測される周波数を比較しました。2つの実験は同じ数の参加者を獲得し、実験手順は同じですが、刺激のみが変更されました。2つの実験結果は、有意なカイ2乗を示しました(式1:X²(18)= 45; p <.0005および式2:X²(18)= 79; p <.0001)。 さて、私がやりたいのは、これらの2つの結果に違いがあるかどうかをテストすることです。信頼区間の使用が解決策になると思いますが、これらの結果だけでこれらの信頼区間を計算する方法がわかりません。あるいは、効果の大きさを比較するテスト(コーエンのw)? 誰かが解決策を持っていますか? どうもありがとう! FD

2
分布の等価性のカイ2乗検定:許容されるゼロの数はいくつですか?
21の異なる表現型のうち1つしか持つことができない変異体の2つのグループを比較しています。これらの結果の分布が2つのグループ間で類似しているかどうかを確認します。 「分布の等値のカイ2乗検定」を計算し、いくつかのもっともらしい結果を与えるオンライン検定を見つけました。ただし、この表にはかなりの数のゼロがあるため、この場合はカイ二乗を使用できますか? 次の表は、2つのグループと特定の表現型の数を示しています。 2 1 2 3 1 6 1 4 13 77 7 27 0 1 0 4 0 2 2 7 2 3 1 5 1 9 2 6 0 3 3 0 1 3 0 3 1 0 1 2 0 1

4
Pythonを使用して列にカテゴリカルデータがあるかどうかを統計的に証明する方法
すべてのカテゴリー変数を見つける必要があるpythonのデータフレームがあります。int型もカテゴリ型になる可能性があるため、列の型のチェックは常に機能するとは限りません。 したがって、列がカテゴリカルであるかどうかを識別するための正しい仮説検定方法を見つけるのに助けを求めます。 私はカイ二乗検定の下で試しましたが、これで十分かどうかはわかりません import numpy as np data = np.random.randint(0,5,100) import scipy.stats as ss ss.chisquare(data) お知らせ下さい。

2
独立性の検定と均質性の検定
私は基本的な統計コースを教えており、今日は2つのカテゴリーの独立性のカイ2乗検定と均質性の検定について説明します。これら2つのシナリオは概念的には異なりますが、同じテスト統計と分布を使用できます。均一性のテストでは、カテゴリの1つの限界合計は、設計自体の一部であると想定されます。これらは、各実験グループに対して選択された被験者の数を表します。しかし、カイ2乗検定はすべての周辺合計の条件付けを中心に展開するため、均質性の検定とカテゴリカルデータを使用した独立性の検定を区別しても、数学的影響はありません-少なくとも、この検定を使用する場合はありません。 私の質問は次のとおりです:独立性のテスト(すべての周辺がランダム変数)または同質性のテスト(周辺の1つのセットが存在する場合)に応じて、異なる分析をもたらす統計的思考または統計的アプローチの学校はありますか?デザインで設定)? 継続的なケースでは、同じ対象についてを観察し、独立性をテストするか、または異なる母集団で観察し、それらが同じ分布に由来するかどうかをテストする場合、方法は異なります(相関分析対t検定)。カテゴリカルデータが離散化された連続変数から得られた場合はどうなりますか?独立性と均質性のテストは区別できないでしょうか?(X 1、X 2)(X,Y)(X,Y)(X,Y)(X1,X2)(X1,X2)(X_1, X_2)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.