測定の不確かさを組み込んだ統計的検定

11

y1とy2と呼ばれる2つのグループの質量測定値（mg）が与えられたとします。2つのサンプルが平均の異なる母集団から抽出されたかどうかを確認するテストを実行したいと思います。たとえば、次のようなもの（Rの場合）：

y1 <- c(10.5,2.9,2.0,4.4,2.8,5.9,4.2,2.7,4.7,6.6)
y2 <- c(3.8,4.3,2.8,5.0,9.3,6.0,7.6,3.8,6.8,7.9)
t.test(y1,y2)

0.3234のp値が得られ、0.05の有意水準では、2つのグループが同じ平均の母集団から抽出されているという帰無仮説を棄却しません。今、私は各測定の不確実性を与えられています：

u1 <- c(2.3,1.7,1.7,1.7,2.0,2.2,2.1,1.7,2.3,2.2)
u2 <- c(2.4,1.8,1.6,2.3,2.5,1.8,1.9,1.5,2.3,2.3)

ここで、u1 [1]は測定値y1 [1]（など）の結合された標準不確かさです。これらの不確実性を統計的検定に組み込むにはどうすればよいですか？

hypothesis-testing

— トム
ソース

これらのペアの測定値ですか？（私はそうは思いません。）不確実性を使用して、推論を改善できる重みを導き出すことができますが、不確実性の変動は非常に小さいため、不確実性が正確であっても、それほど利益はありません。

— Glen_b-2013

これらは、実際のペアになっていないデータのサブセットです。この例は、主に質問を明確にすることを目的としています。私が本当に探しているのは、測定の不確実性を仮説検定（検定時など）に最適に組み込む方法に関する一般的なガイダンスです。測定の不確かさを使用しないと、多くの貴重な情報を無駄にしているように見えますが、この主題に関する明確なガイダンスを文献で見つけることはできませんでした。

— トム

それらを最大限に活用するには、それらを観測の確率モデルに組み込む必要があります。測定の不確かさは実際には何を表していますか？（これをハンドウェーブすることはできないので注意してください。）

— Glen_b -Reinstate Monica

1

加重分析をしたいようです。SASドキュメントの「Concepts」セクションの「Weighted Statistics Example」を参照してください。

— リック
ソース

したがって、重み付けされた平均と重み付けされた標準偏差を使用してt検定を行うだけです。ここで、u1とu1は重みです。

— トム

はい。i_th観測値の分散がVar / w_iであると想定します。ここで、w_iはi_th観測値の重みであり、Var> 0です。

— リック

1

なぜそれをシミュレートしないのですか？つまり、各観測のノイズの実現として不確実性を追加します。次に、仮説検定を繰り返します。これを約1000回行い、nullが拒否された回数を確認します。ノイズの分布を選択する必要があります。法線は1つのオプションのように見えますが、否定的な観察結果が生じる可能性があり、現実的ではありません。

— Soakley
ソース

1

それを回帰問題に変え、不確実性を重みとして使用できます。つまり、回帰の測定からグループ（1または2？）を予測します。

だが

不確実性はほぼ一定であるため、それらを使用してもあまり変化しないと思われます。

あなたは10.5で穏やかな外れ値を持っています、これは平均間の差を減らすことによって問題を複雑にします。しかし、不確実性を信じることができれば、その価値は他の何よりも疑わしいものではありません。

t検定では、対立仮説が2つのサンプルが異なる母集団から抽出されたものであることがわかりません。それが知っているすべては、特定の仮定の下で平均を比較することです。ランクベースのテストは代替手段ですが、これらのデータに測定値として関心がある場合は、目標に適していないように思われます。

— ニックコックス
ソース

ポイントを取る。質問を変更して、手段で表現しました。

— トム

0

通常の最小二乗法（たとえば、lm（y〜x））では、x値が与えられた場合、y値の周りの変動性（不確実性）を考慮に入れています。（lm（x〜））の周りで回帰を反転させると、xの周りのエラーを最小限に抑えることができます。どちらの場合も、エラーはかなり均一であると想定されています。

応答変数の各観測値の周りの分散の量がわかっており、xで順序付けしたときにその分散が一定でない場合は、重み付き最小二乗を使用することをお勧めします。1 /（分散）の係数でy値に重みを付けることができます。

xとyの両方に不確実性があり、その不確実性が2つの間で同じでないことが懸念される場合は、いずれかの軸に垂直な方向の残差（アドレスの不確実性）を単純に最小化する必要はありません。理想的には、近似された傾向線に垂直な不確実性を最小限に抑えます。これを行うには、PCA回帰を使用することができます（もあります。直交回帰、あるいは総最小二乗として知られているPCA回帰のためのRパッケージは、そこにいる以前にこのWebサイト上でこのトピックに関する記事となって、その後も他の場所で議論されていますさらに、分散の知識を利用して、この回帰の加重バージョンをまだ実行できると思います（つまり、私は間違っているかもしれません...）。

— rbatt
ソース