部分的にペアリングされたデータと部分的にペアリングされていないデータのt検定


28

調査員は、いくつかのデータセットの複合分析を作成したいと考えています。一部のデータセットには、治療AとBのペアの観測値があります。他のデータセットには、ペアになっていないAとBのデータがあります。このような部分的にペアになったデータのt検定の適応、または尤度比検定のリファレンスを探しています。私は(今のところ)等分散の正規性を仮定し、Aの母平均は各研究(およびB)でも同じであると仮定します。


2
こんにちはフランク。おそらく、モデリングの仮定をより明確にすることが役立つでしょう。通常、ペア設計を考えるとき、次のいずれかを考えます(i)固定された観測不可能なユニットレベルの効果を除去しようとする、(ii)実験ユニット全体のランダム効果の変動性を減らす、または(iii)非正規性を調整するペア間の差を取ることによる応答の評価。これにより、より良い近似が得られます。特に、nullの下での観測がすべてiid正常であるという仮定がある場合、一致したペアにすぐにメリットが見られません。
枢機

4
枢機,、私は実際にこのようなデータもたくさん持っています。完全にペアになったデータを収集しようとしましたが、技術的な問題や運が悪いため、AまたはBでの一部のサンプル測定が台無しになることがあります。2つの明らかな(ただし不満な)解決策は、1)すべての不完全なペアを破棄してペアのt検定を実行するか、2)ペアを無視してすべてのデータに対してペアのないt検定を実行することです。ポスターは、ペアリングが存在する場所を活用する方法を求めていると思います(理由1と2)。
マットクラウス

2
すべてのコメントに感謝します。一致したペアについて、被験者はAとBの両方でテストされました。ペアリングを活用する1つの方法は、AとBの平均の差にブートストラップノンパラメトリックパーセンタイル信頼区間を使用することです。これには、クラスターブートストラップを使用し、科目。ペアのデータを持たない被験者は、リサンプルで1つの観測値を保持または削除し、ペアのデータは2つのレコードを保持または削除します。これはペアリングを尊重しているようですが、見積もりには定義が必要であり、最適性についてはわかりません。
フランクハレル

1
ベイジアンアプローチは実装が簡単です。
ステファンローラン

2
Hani M. Samawi&Robert Vogel、Journal of Applied Statistics(2013):部分相関(ペア)データの2つのサンプルテストに関するメモ、dx.doi.org / 10.1080 / 02664763.2013.830285
Suresh

回答:



8

ペアのペアとペアの分散を知っている場合(通常はかなり小さい)、グループ平均の差の2つの推定値の最適な重みは、個々の分散に反比例する重みを持つことです。平均の差の推定。

[編集:分散が推定されるとき、これはグレイビル・ディール推定量と呼ばれることがわかります。かなりの数の論文がありました。こちらです

分散を推定する必要があるため、多少の困難が生じます(分散推定の結果の比率はFであり、結果の重みはベータ分布を持ち、結果の統計はやや複雑です)が、ブートストラップを検討しているため、これは心配は少ない。

通常の効率の損失がほとんどない、何らかの意味でより良い(または分散比で遊んでいるので、非正規性に対して少なくともより堅牢な)別の可能性、シフトオフの組み合わせ推定値に基づいていますペアおよび非ペアのランク検定-いずれの場合も、ペアごとのクロスサンプル差の中央値に基づくペアなしの場合、およびペアごとのペア平均差の中央値から外れたペアの場合のホッジス・レーマン推定の一種。繰り返しますが、2つの最小分散の重み付き線形結合は、分散の逆数に比例した重みを持ちます。その場合、おそらくブートストラップではなく順列(/ランダム化)に傾くでしょう-しかし、ブートストラップの実装方法によっては、同じ場所で終わる可能性があります。

どちらの場合でも、分散を強化/分散比を縮小することができます。重量に見合った適切な球場に入るのは良いことですが、通常の場合、わずかに堅牢にすることで効率をほとんど失うことはありません。---

以前に頭の中で十分に整理されていなかった追加の考え:

この問題はBehrens-Fisher問題と明確に類似していますが、さらに困難です。

重みを修正した場合は、Welch-Satterthwaite型の近似値を強打できます。問題の構造は同じです。

私たちの問題は、重みを最適化したいということです。これは、重みが固定されていないことを意味します-そして実際、統計量を最大にする傾向があります分子、分母を最小化しようとしています; 2つは独立していません)。

これは、カイ2乗近似を悪化させ、近似のdfにほぼ確実に影響を与えると予想されます。

[この問題はなんとかであれば、そこにもちょうどかもしれないあなたが状況のこれらのセットでのみペアデータ、これらの他のセットでのみ不対を使用する場合は、ほぼ同様に行うことができます」と言うでしょう親指の良いルールも判明条件と残りの部分では、この固定重量スキームは通常最適に非常に近いです」-しかし、私はそのチャンスを待って息を止めません。そのような決定規則は、それぞれの場合に間違いなく真の重要性に何らかの影響を与えるでしょうが、その効果がそれほど大きくない場合、そのような経験則は、人々が既存のレガシーソフトウェアを使用する簡単な方法を与えるので、そのような状況のユーザー向けに、そのようなルールを特定してください。]

---

編集:自己への注意-戻って、「重複サンプル」テスト、特に重複サンプルt検定の作業の詳細を記入する必要があります

---

ランダム化テストはうまくいくはずです-

  • データがペアになっている場合、ペア内のグループラベルをランダムに並べ替えます

  • データはペアになっていないが、共通の分布があると想定される場合(nullの下)、グループの割り当てを変更します。

  • w1=1/(1+v1v2)


(後で追加)

おそらく関連する論文:

Derrick、B.、Russ B.、Toher、D。、およびWhite、P.(2017)、
「ペアの観測と独立した観測の両方を含む2つのサンプルの平均の比較に関する検定統計量」、
Journal of Modern Applied Statistics Methods、5月、Vol。16、No。1、137-157。
doi:10.22237 / jmasm / 1493597280
http://digitalcommons.wayne.edu/cgi/viewcontent.cgi?article=2251&context=jmasm


1
+1。あなたの答えの最後の部分について質問があります。置換テストで使用する分散推定値(つまり、重み)-実際のサンプルで計算された実際のもの、またはその置換からのデータに基づいて各置換の重みを計算しますか?
アメーバは、モニカを復活させる

@amoebaは、特定の順列に基づいて計算のサンプルベースの性質を適切に説明します。
-Glen_b

@amoebaそれを問題に対する他のアプローチと比較する必要があります。
-Glen_b

1
ちなみに、誰かが次のデータで私に近づいたので、このスレッドに出くわしました:ペアのデータを持つ2人の被験者とペアのないデータを持つ2人の被験者2つがペアになり、残りはペアになりません)。この場合、ペアになっていないシフトの推定値の分散を推定するのに十分なデータではないため、ペアリングを無視してペアになっていないテストを行うこと以外には何も提案できませんでした...しかし、これはもちろん非常に極端な状況です。
アメーバは、

6

ここにいくつかの考えがあります。私は基本的に、この問題にはBehrens-Fisher問題と明確な類似性があるというGreg Snowの結論にたどり着きました。手を振らないように、まずいくつかの表記法を紹介し、仮説を形式化します。

  • nxipAxipBi=1,,n
  • nAnBxiAi=1,,nAxiBi=1,,nB
  • 各観測は、患者効果と治療効果の合計です。対応するランダム変数は

    • XipA=Pi+TiAXipB=Pi+TiB
    • XiA=Qi+UiAXiB=Ri+ViB

    Pi,Qi,RiN(0,σP2)Tiτ,Uiτ,ViτN(μτ,σ2)τ=A,B

    • μA=μB

Xi=XipAXipBXiN(μAμB,2σ2)

XinXiAnAXiBnB

  • XN(μAμB,2nσ2)
  • XAN(μA,1nA(σP2+σ2))
  • XBN(μB,1nB(σP2+σ2))

次の自然なステップは考慮することです

  • Y=X+XAXBN(2(μAμB),2nσ2+(1nA+1nB)(σP2+σ2))

σ2n1σP2+σ2nA1nB1(1nA+1nB)(σP2+σ2)nA+nB2Y

この時点で、Behrens Fisher問題に対して提案された解決策をプラグインして、問題の解決策を得ることができると思います。


1
数式のタイプミスを修正しました。チェックしてください!
kjetil bハルヴォルセン

5

私の最初の考えは混合効果モデルでしたが、それはすでに議論されているので、これ以上は言いません。

私のもう一つの考えは、すべての被験者についてペアのデータを測定できたかもしれないが、コスト、エラー、またはすべてのペアがないという別の理由で理論的に可能であった場合、ペアのない被験者の測定されていない効果を扱うことができるということです欠損データとして、EMアルゴリズムや多重代入のようなツールを使用します(1回の治療でのみ被験者を測定した理由が他の治療での結果に関連する場合を除き、ランダムに欠損することは妥当と思われます)。

最尤法を使用して(被験者ごとの利用可能なデータに基づいてファクタリングされた尤度を使用して)データに2変量正規分布を当てはめるだけの方が簡単な場合があり、平均と異なる平均との分布を比較する尤度比検定を実行します。

私の理論の授業から長い時間が経っているので、これらが最適性に関してどのように比較されるかわかりません。


1
グレッグ、ありがとう。私はカスタマイズされた最尤法に傾いています。
フランクハレル

4

ランダム効果が方法である可能性があるため、患者との混合モデリングが考えられます。混合モデリングでは、ペアの場合の相関構造と、ペアのない場合の部分的な欠損を考慮することができます。


2
個別に分析されたデータセットはどれもランダム効果を使用することはないため、ここでランダム効果が役立つ理由はわかりません。ただし、一般化された最小二乗法を使用して、各被験者に独自の相関構造を持たせることができます。ペアになっていない観測値の相関はゼロになります。考える価値がある。ありがとう。
フランクハレル

はい、そうです、データセットを別々に使用する場合、データセットは混合モデリングを必要としません。ただし、それらを1つの単一のデータセットに追加する場合は、アプローチを使用して相関をペアデータに組み込み、ゼロ相関を指定することで非ペアデータを同時に使用できます。
psj

1
はい; 私のポイントは、あなたが簡単に例えばRの使用(一般化最小二乗法を用いて被験者変相関構造を指定することができるよう混合モデルが過剰であってもよいことだったglsで機能nlme4。パッケージを
フランク・ハレル

3

Hani M. Samawi&Robert Vogel(Journal of Applied Statistics、2013)で提案されている方法の1つは、新しいTスコアが次のようになるように、独立サンプルと依存サンプルからのTスコアの重み付き組み合わせで構成されています

To=γ(μYμXSx2/nX+Sy2/nY)+(1γ)μDSD2/nD

Dγγ


1
T0
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.