サイズ1とサイズ3の2つのサンプルを比較する統計的検定はありますか?


19

エコロジープロジェクトの場合、私の研究室グループは、等量の池の水を含む4つのタンクに、酢を追加しました。酢を加える目的は、pHを下げることでした。仮説は、エロデアを持つタンクが通常のpHに速く戻るというものでした。確かにそうでした。各タンクのpHを約2週間毎日測定しました。最終的にすべてのタンクが元のpHに戻りましたが、これにかかる時間は、エロデアを備えたタンクの方がはるかに短かったです。

教授に実験計画について話したとき、コントロールと治療を比較するためにデータに対して実行できる統計的検定は存在しないと彼は言いました。これは、コントロールの複製がないため(コントロールタンクを1つだけ使用したため)、分散を計算できず、コントロールと処理のサンプル平均を比較できないためです。私の質問は、これは本当ですか?彼が何を意味するのか、私は間違いなく理解しています。たとえば、1人の男性と1人の女性の身長を考慮した場合、それぞれの人口について結論を出すことはできません。しかし、3回の治療を行い、分散は小さかった。コントロールの分散が似ていると仮定するのは理にかなっていますか?

更新:

すばらしい答えをありがとう。湿地からより多くの水とエロデアを得て、より小さなタンクで実験を再度実行することにしましたが、今回は5つのコントロールと5つの処理を行います。これを元のデータと組み合わせるつもりでしたが、タンクの開始pHが十分に異なっていたため、元の実験と同じ母集団から新しい実験をサンプリングすることを考慮するのは妥当ではないようです。

さまざまな量のエロデアを追加し、pH修復の速度(pHが元の値に戻るまでの時間として測定される)をエロデアの量と相関させることを検討しましたが、必要ではないと判断しました。私たちの目的は、pHが異なる量のElodeaにどのように反応するかを正確に予測する何らかのモデルを構築することではなく、Elodeaが正の違いをもたらすことを示すことだけです。エロデアの最適量を決定することは興味深いでしょうが、それはおそらく生き残ることができる最大量にすぎません。データに回帰曲線を当てはめようとしても、大量に追加するとコミュニティにさまざまな複雑な変更が発生するため、特に意味がありません。エロデアは死に、分解し、新しい生物が支配し始めます。


4
3つの「処理」タンクのそれぞれに同量のエロデアを追加しましたか?
GUNG -復活モニカ

2
はい、各治療に同量のエロデアを加えました。
サイモンハント

回答:


21

gungの質問に注意してください。重要です。処理は、処理グループのすべてのタンクで同じであったと仮定します。

2つのグループの分散が等しいと主張できる場合(通常は2サンプルのt検定で想定される)、テストを実行できます。確認できないどれほどひどく違反されたとしても、その仮定をする。

表明した懸念この関連する質問に対する回答であなたの状況により関連していますが、あなたがそれに対してできることはほとんどありません。

[分散が等しいと仮定するのが合理的であることについて尋ねます。私たちはあなたに答えることはできません、それはあなたが主題の専門家(すなわち生態学者)を納得させる必要があるものだと合理的な仮定でした。そのようなレベルが治療とコントロールの両方で測定された他の研究はありますか?同様のテスト(tテストまたはanova特により良い前例が見つかると思います)が行われた、または同様の仮定が行われた他の人は?適用できる一般的な推論の形式は何ですか?]

x¯y¯σ2バツ¯y¯μバツμyσ2(1/nx+1/ny)n

ny

(x¯y¯)sx1/nx+1

sxtnx1

最適な推定値を使用すると、σsxspny

編集:

このテストのシミュレートされた電力曲線は次のとおりです。ヌルでのサンプルサイズは10000で、他のポイントでは1000でした。ご覧のように、ヌルでの棄却率は0.05であり、パワーカーブは、適切なパワーを持つために母集団平均に大きな差が必要ですが、正しい形。つまり、このテストは想定されていることを実行します。

パワーカーブ

(編集終了)

ただし、サンプルサイズが非常に小さい場合、これは分布の仮定に多少影響を受けます。

異なる仮定を行う準備ができている場合、または他の母集団の量が等しいかどうかをテストする場合は、まだいくつかのテストが可能です。

したがって、すべてが失われるわけではありません...しかし、可能であれば、両方のグループで少なくともある程度の複製を作成する方が一般的には良いでしょう。


1
概説された式@Glen_bに従う必要があることに注意してください。ExcelとMinitabはどちらもこれを計算しません。
zbicyclist

10
(+1)同等のアプローチ(同じ式を使用)-したがって、この答えを正当化するためのより多くの弾薬-は、治療グループから1つの将来の値の予測間隔を計算できることです。制御値がその予測間隔内に収まらない場合、2つのグループの間に有意な証拠があります。差は、平均の差または分散の差の何らかの組み合わせである可能性がありますが、(おそらく)差があります。
whuber

3
@bdemarest興味深い考えですが、うまくいきません。値 '12'が正確に知られていることを主張します(sdを持つ分布からのランダムな観測である代わりに)σ)、式につながる バツ¯12sバツ1/nバツ -この特定のケースでは、平方根の下の値を必要な値の4分の1にして、 t本来の2倍の値。
Glen_b -Reinstateモニカ

2
@Glen_b:昨年11月にこれが変更されたかどうかはわかりませんが、R 3.0はサンプルサイズの1つがプールされたときにt検定をプールし、anovaと同じ答えを出します。
アーロン-モニカ

2
Rで試してみたい人にとっては、t.test(x=c(4.5,4.8,4.6),y=5.2, var.equal=TRUE) -これはR2.15.2とR3.0.0の両方で動作するように見えます(私が持っている唯一の2つのバージョン)。
Glen_b-モニカーの復活2013
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.