重み付きフィッシャーの正確検定？

12

重みを考慮に入れたフィッシャーの正確検定のバリエーションを知っている人はいますか？例えば、サンプリングの重み。
したがって、通常の2x2クロステーブルの代わりに、すべてのデータポイントには、ポイントを重み付けする「質量」または「サイズ」の値があります。

サンプルデータ：

A B weight
N N 1
N N 3
Y N 1
Y N 2
N Y 6
N Y 7
Y Y 1
Y Y 2
Y Y 3
Y Y 4

フィッシャーの正確検定では、この2x2クロステーブルを使用します。

A\B  N  Y All
 N   2  2   4
 Y   2  4   6
All  4  6  10

「実際の」数のデータポイントとして重みを取得すると、次のようになります。

A\B  N  Y All
 N   4 13  17
 Y   3 10  13
All  7 23  30

しかし、それは非常に高い自信をもたらします。1つのデータポイントがN / YからN / Nに変わると、統計に非常に大きな違いが生じます。
さらに、重量に分数が含まれていると機能しません。

hypothesis-testing

— ミシェル・ド・ルイター
ソース

10

「正確な」テストとサンプリングの重みは本質的に互換性のない概念であると疑っています。サンプル調査に適した施設と正確なテストに適した施設を備えたStataをチェックインしました。サンプルの重みを持つクロスタブの8つの可能なテスト統計には、Fisherのような「正確な」テストは含まれていません。

関連するStataマニュアルエントリ（svy：tabulate twoway）では、すべての場合にデフォルトテストを使用することを推奨しています。このデフォルトの方法は、通常のピアソンのカイ二乗統計に基づいています。引用するには：

「調査設計を説明するために、統計は、2次Rao and Scott（1981、1984）補正を使用することにより、整数以外の自由度を持つF統計に変換されます」。

参照：

ラオ、JNK、AJスコット。1981.複雑なサンプル調査からのカテゴリデータの分析：双方向テーブルでの適合度と独立性のカイ2乗検定。Journal of the American Statistics Association 76：221–230。
ラオ、JNK、AJスコット。1984年。調査データから推定された細胞の割合を伴う多元分割表のカイ二乗検定について。統計12：46–60。

— ワンストップ
ソース

3

興味深い質問。重量とはどういう意味ですか？

私は、ブートストラップを実行する傾向があります...あなたの好きな統計（すなわち、フィッシャーの正確）を選び、あなたのデータでそれを計算します。次に、帰無仮説に従って各インスタンスに新しいセルを割り当て、プロセスを999回繰り返します。これにより、帰無仮説の下で検定統計量のかなり良い経験的分布が得られ、p値の簡単な計算が可能になります！

— user549
ソース

ありがとう！しかし、私は...より速く、より安定して計算するのである統計を希望

— ミシェル・ドRuiter

2

サンプルの重みに関する簡単なこと-それらは通常、サンプリング元の母集団に関する情報を組み込む方法ですが、通常は「大きなサンプル」タイプのシナリオに基づいています（通常、BLUPまたはBLUEの予測は変装しています）。したがって、サンプルの重みはおそらく重みなしよりも良くなるとは思いません。サンプルデザインが直接基づいている母集団に関する情報を使用する方が良いと思います。

$R_{1},\dots,R_{k}$ $k$ $R_{1;11},R_{1;12},R_{1;21},R_{1;22},\dots$ $\sum_{l=1}^{k}R_{l;ij}$ $R_{l;ij}$ $r_{l;ij}$ $\sum_{i,j}R_{l;ij}=R_{l}$ $(l=1,\dots,k)$

$P(D_{m})=1$ $P(D_{m})=0$ サンプルに含まれていなかった場合。ただし、通常、設計は、観察する可能性のあるデータだけでなく、より多くの情報に基づいています。ただし、重要なのは調査設計そのものではなく情報であることに注意してください。設計ベースの推論は、分析にすべての情報を組み込むためのかなり効率的な方法です。

— 確率論
ソース