タグ付けされた質問 「t-test」

2つのサンプルの平均、または1つのサンプルの平均(またはパラメーター推定値)を指定された値と比較するためのテスト。発明者の仮名にちなんで「学生t検定」としても知られています。

1
ボックスプロットの要約データのみを使用したT検定
2つの箱ひげ図から5つの数値の要約(最小、Q1、中央値、Q3、最大)があり、2つの箱ひげ図のグループの平均が有意に異なるかどうかをテストしたいと思います。 t検定を使用してこれを実行したいのですが、使用できるデータがありません(5つの数値の要約のみ)。 平均の違いをテストする方法はありますか?またはt検定の大雑把な近似?また、私はサンプルサイズと平均を知っています。
8 t-test  boxplot 

3
H0が既に拒否されている場合、t検定パワーが比較的小さいことを気にする必要がありますか?
2つの非常に小さなサンプル(それぞれ)があり、それらの2つのサンプルのt検定検出力は0.49です。これは比較的小さい(Rで計算)。ただし、ウェルチ2標本のt検定ではp値が0.032であるため、帰無仮説を棄却できます。0.032n=7n=7n=7power.t.test()0.0320.0320.032 さて、私は力が小さいことを気にする必要がありますか? 私の理解は、power = 1−β1−β1 - \betaここで、ββ\betaはタイプIIエラーの確率です。ここで、それは私のテストがH0を拒否する必要がある場合の約50%でH0を拒否できないことを意味するので、特定のサンプルがH0を拒否できない場合は特に心配する必要があります。しかし、私の特定のサンプルの場合、私は幸運であるように見え、私のいくらかパワーが不足しているt検定は拒否に成功したので、ベータについて気にする必要はなく、サンプルで大きな違いを示すことができるのを楽しむことができます手段。 私の解釈は正しいですか?それとも、何か重要なことを見逃していますか?

1
スチューデントのT検定で標準偏差を修正する必要がありますか?
スチューデントのT検定を使用して、T-Criticalは次のように計算されます。 t = X¯- μ0s / n√t=X¯−μ0s/nt = \frac{\bar{X} - \mu_{0}}{s / \sqrt{n}} 標準偏差の不偏推定に関するウィキペディアの記事を見ると、サンプルのサイズに基づいて測定されたサンプルの標準偏差sの補正係数c 4(n )に言及している正規分布の結果のセクションがあります。質問:c4(n )c4(n)c_4(n) (1)この補正係数は自由度によるので、スチューデントのTテーブルデータに含まれていますか? (2)(1)が「いいえ」の場合、なぜそうでないのですか?

3
分布を見つけて正規分布に変換する
1時間にイベントが発生する頻度(「1時間あたりの数」、nph)とイベントが持続する時間(「1秒あたりの秒数」、dph)を説明するデータがあります。 これは元のデータです: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, 1.05882352939726, 9.21739130425452, 27.8399999994814, 15.3750000002237, NA, 6.00000000004109, 9.71428571436649, 12.4848484848485, 16.5034965037115, 20.6666666666667, 3.49999999997453, 4.65882352938624, 4.74999999996544, 3.99999999994522, 2.8, 14.2285714286188, 11.0000000000915, NA, 2.66666666666667, 3.76470588230138, 4.70588235287673, 13.2727272728677, 2.0000000000137, 18.4444444444444, 17.5555555555556, 14.2222222222222, 2.00000000001663, 4, 8.46153846146269, 19.2000000001788, 13.9024390245481, 13, 3.00000000004366, NA, …
8 normal-distribution  data-transformation  logistic  generalized-linear-model  ridge-regression  t-test  wilcoxon-signed-rank  paired-data  naive-bayes  distributions  logistic  goodness-of-fit  time-series  eviews  ecm  panel-data  reliability  psychometrics  validity  cronbachs-alpha  self-study  random-variable  expected-value  median  regression  self-study  multiple-regression  linear-model  forecasting  prediction-interval  normal-distribution  excel  bayesian  multivariate-analysis  modeling  predictive-models  canonical-correlation  rbm  time-series  machine-learning  neural-networks  fishers-exact  factorisation-theorem  svm  prediction  linear  reinforcement-learning  cdf  probability-inequalities  ecdf  time-series  kalman-filter  state-space-models  dynamic-regression  index-decomposition  sampling  stratification  cluster-sample  survey-sampling  distributions  maximum-likelihood  gamma-distribution 

2
t検定のp値を手動で計算する:
p値を計算するこれらの2つの方法は同等である必要があります。 t.test(rats.drug,mu=1.2)$p.value 2*pt((mean(rats.drug)-1.2)*sqrt(n)/sd(rats.drug),df=n-1) 2番目の方法の問題は、より大きい値(実際には)を取得するリスクがあることです。2111222 2*pt((1.5-1.2)*sqrt(100)/.5,df=100-1) [1] 2 これはもちろん修正できます 2*pt((1.5-1.2)*sqrt(100)/.5,df=100-1,lower=F) [1] 3.245916e-08 私の質問 明らかに、t検定関数のアルゴリズムは、これらの2つのケースを区別するのに十分にインテリジェントです(サンプルの平均が与えられた平均より大きいか小さいか)。t検定関数によって行われる、p値の計算を手動で複製する簡単な方法はありますか? 現在の私の解決策は、結果の値がより大きいかどうかをチェックするifステートメントであり、この場合、lower = Fオプションを使用して同じ計算を再度実行しますが、おそらくより良い方法があります。111
8 r  t-test  p-value 

1
独立したサンプルのt検定を計算するときにブートストラップが必要なのはなぜですか?(ブートストラップt検定を正当化、解釈、および報告する方法)
2つの条件があり、2つの条件のサンプルサイズが非常に小さいとします。最初の条件で14個の観測しかなく、他の11個の観測があるとしましょう。t検定を使用して、平均差が互いに有意に異なるかどうかを検定します。 最初に、t検定の正規性の仮定について少し混乱しています。そのため、完全にブートストラップを取得できません。t検定の前提は、(A)データが正規母集団からサンプリングされている、または(B)サンプル分布がガウス特性を持っているということですか?(B)の場合、それは実際には仮定ではありませんよね?データのヒストグラムをプロットして、それが正常かどうかを確認できます。サンプルサイズが小さい場合でも、サンプル分布が正常かどうかを確認するのに十分なデータポイントがありません。 これがブートストラップの出番だと思います。ブートストラップを実行して、サンプルが正常かどうかを確認できますよね?最初、ブートストラップは常に正規分布になると思っていましたが、そうではありません(ブートストラップリサンプリングを使用して、データセットの分散の信頼区間を計算できますか? statexchange statexchange)。したがって、ブートストラップを行う理由の1つは、サンプルデータの正規性をより確実にすることです。 この時点で私は完全に混乱します。Rでt.test関数を使用してt検定を実行し、ブートストラップされたサンプルベクトルを2つの独立したサンプルとして配置した場合、t値は非常に重要になります。ブートストラップt検定を正しく行っていませんか?すべてのブートストラップが実行しているため、t値を大きくするだけなので、すべてのケースでこれが発生するのではないでしょうか。ブートストラップされたサンプルに対してt検定を実行しませんか? 最後に、ブートストラップで信頼区間を計算することと、元のサンプルで信頼区間を計算することの利点は何ですか?これらの信頼区間から、元のサンプルデータの信頼区間では何がわかりませんか? (A)ブートストラップを使用するとt値がより重要になる理由がわからない(B)独立したサンプルのt検定を実行するときにブートストラップを使用する正しい方法がわからない、(C)わからない独立したt検定の状況でのブートストラップの正当化、実行、および結果を報告する方法。

2
重複するサンプルのt検定
私は10人で協力しています。彼らは6日間グループで作業します。1週間に3日間、2週間に3日間です。毎日、すべての人がいるわけではなく、その一部がいます。毎日、私は個々のパフォーマンスを測定します。 一般的なパフォーマンスが第1週または第2週のほうが高かったかどうかを言わなければなり ません。たとえば、次のような2つのグループでt検定を行うことを計画していました。 グループ1 – 1週目のパフォーマンス 1日目:ポール、メアリー、ジョン1日目:ポール、サラ3日目:ジェシカ、サラ グループ2 – 2週目のパフォーマンス 4日目:ポール、リタ5日目:ジョン、ポール、サラ6日目:ジェシカ、リタ 質問: 2つのグループを独立していると見なして、独立したt検定を実行できますか? 一般的なパフォーマンスが第1週または第2週のほうが良かったと言える最良の方法を教えていただけませんか。 私の懸念は、毎日のさまざまな人々と毎日のさまざまなサイズのワークグループです。同じ人が別の日に、両方のグループにいるため、私も心配しています。したがって、サンプルがオーバーラップしているように見えます。

2
t検定(または順列検定)では、標本サイズの大きな違いと分散の違いが重要ですか?
私の頭の中では非常に混乱する質問があります。データがあり、男性と女性の数値スコアを比較したい。 これらの2つのグループには大きな違いがあります。男性の数は34で、女性の数は310で、分散は等しくありません。 私の知る限り、分散が等しくない場合は、ウェルチ・サッタースウェイト方程式を使用できます(分散が等しくないと仮定した独立t検定)。私の質問は、2つのサンプル間でサンプルサイズに本当に大きな違いがあるにもかかわらず、この方程式を使用できますか?または、2つのサンプル間のサンプルサイズの違いに特定の制限はありますか?

1
異なるグループの再現性(ICC)を比較する方法は?
2つのグループのICC値を計算しました。次に、ICC値を比較して、グループの再現性が異なるかどうかを判断します。文献では、人々は単に再現性を比較するためにt検定を使用しましたが、これを行う方法は私には不明確です。 たとえば、ダミーデータの場合: ID gr day behaviour 1 1 1 0.361 2 1 1 0.232 3 1 1 0.240 4 1 1 0.693 5 1 1 0.483 6 1 1 0.267 7 2 1 0.180 8 2 1 0.515 9 2 1 0.485 10 2 1 0.567 11 2 1 0.000 …

2
nが増加すると、t値は仮説検定で増加しますが、tテーブルは正反対です。どうして?
以下のための式仮説検定では、次式で与えられる。 T = ˉ X - μtttt = X¯- μσ^/ n−−√。t=バツ¯−μσ^/ん。 t=\frac{\bar{X}-\mu}{\hat \sigma/\sqrt{n}}. 場合が増加すると、T上記式に従って-value増加します。しかし、なぜdf(nの関数)が増加すると、tテーブルの臨界t値が減少するのでしょうか。んんntttttttttdfdf\text{df}んんn

3
なぜ依存が問題になるのですか?
従属観測が統計で問題になる理由に興味があります。2つの学校の平均試験の点数に差があるかどうかを知りたいとします。各学校で50の観測を収集します。これらの50の観察は、各学校の5つの異なる教室から得られ、教室内で依存関係があります。この場合、t検定の結果はどのように影響を受け、どのようにして不正確な結論につながるのでしょうか。

4
ロジスティック回帰とマンホイットニー/ t検定の選択
私は、先験的に決定された0と1の比率を持たない二分変数と、連続変数持っています。ああAbbb シナリオ1では、Iが指定する決めるとして独立変数、およびのように従属 変数。次に、マンホイットニー(分布なし)、t検定(正規分布)などの検定を使用して、をに対して検定します。ああAバツバツXbbbyyyバツバツXyyy シナリオ2では、私が指定することを決定したように従属変数、及びなどの独立 変数。次に、ロジスティック回帰を使用してをに対してテストします。ああAYYYbbbx YバツバツxバツバツxYYY と関係の方向性がわからない場合、つまりが独立変数であるかが独立変数であるかを判断できない場合、どのモデルを選択する必要がありますか?b A bああAbbbああAbbb 従属変数と独立変数のどちらがわからない場合、最初のインスタンスでt検定/マンホイットニーを一種の単変量分析として使用し、ロジスティック回帰を多変量分析として使用することは無効ですか?

1
多重代入後の平均比較
欠損値のあるデータについて、グループ間の単純な平均比較(基本的なANOVA F検定)を行う必要があります。多重補完にはR のマウスパッケージを使用していますが、プールできるのは線形モデル係数または結果のみです。R2R2R^2 各線形モデルフィットから複数のF統計をプールするために組み合わせる方法を知っている人はいますか?または、F検定の標準誤差をどのように計算できますか?

4
1つのグループにほとんどまたはまったく差異がない場合、テストで実行できますか?
基準と比較している4つのグループがあります。私のグループの1つでは、すべての参加者がすべての項目で同じように回答しました。つまり、差異はありません。 ANOVAでそれをどのように処理しますか? また、エラー条件が出ないので、テストでそれを基準と比較して実行するとどうなりますか?生徒に含めているかどうかわからない1人の参加者を含めた場合、分散は37のうちの1つの異なる観測値で完全に均一ではありませんが、実行すると、分散が小さすぎるため有意ではありません。 計算的にできることは何もないことを理解しています。私はそれを概念的にどのように扱うかを尋ねています。

4
ウェルチのt検定は、より極端な差に対してより悪いp値を与えます
以下は、4つの異なる数値セットです。 A = {95.47、87.90、99.00} B = { 79.2、75.3、66.3 } C = { 38.4、40.4、32.8} D = { 1.8、1.2、1.1 } 等しい分散を仮定せずに2サンプルのt検定を使用して、B、C、およびDをAと比較し、次のp値を取得します。 0.015827(A vs B) 0.000283(A vs C) 0.001190(A vs D) ADテストのp値がACテストよりも悪いのは奇妙だと思います。平均値の差は明らかにはるかに大きく、Dの分散はCの分散よりもはるかに低くなっています。直感的に(少なくとも私の直感では) )、これらの両方の事実により、p値が低くなるはずです。 これがt検定の望ましい動作または期待される動作であるか、それとも私の特定のデータセット(おそらく極端に低いサンプルサイズ)をさらに処理する必要があるかどうか、誰かが説明できますか?t検定は、この特定のデータセットには不適切ですか? 純粋に計算の観点から、より悪いp値の理由は自由度であると思われます。これは、AD比較では2.018、AC比較では3.566です。しかし、確かに、これらの数値を見ただけの場合、ACと比較してADのケースでは帰無仮説を棄却するためのより強力な証拠があると思いませんか? いずれにせよすべてのp値が非常に低いため、これはここでは問題ではないと示唆する人もいます。私の問題は、これら3つのテストが、私が実行している一連のテストの一部であることです。複数のテストを修正した後、AD比較ではカットされませんが、AC比較ではカットされます。これらの数値をプロットして(生物学者がよく行うようにエラーバーを含む棒グラフなど)、CがAと大幅に異なるが、Dはそうでない理由を正当化しようとしていると想像してみてください。 更新:これが本当に重要な理由 この観察が過去の研究の解釈に大きな影響を与える可能性がある理由を明確にしましょう。バイオインフォマティクスでは、t検定が大規模な小さなサンプルサイズに適用されることを確認しました(3〜5回の複製のみを使用して、数百または数千の遺伝子の異なる遺伝子発現、または細胞株に対する多くの異なる薬物の影響を考えてください) )。通常の手順は、多くのt検定(各遺伝子または薬物に対して1つ)を実行し、その後に複数の検定修正(通常はFDR)を実行することです。ウェルチのt検定の動作の上記の観察を考えると、これは、いくつかの非常に最良のケースが体系的に除外されていることを意味します。ほとんどの人は、リストの一番上にある比較の実際のデータ(最高のp値を持つデータ)を確認しますが、帰無仮説がなかったすべての比較のリストを確認する人は誰も知りません。 t拒否されました。
8 t-test 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.