1分の在庫返品の2つのサンプル平均を比較したいと思います。私はそれらがラプラス分布(すでにチェックされている)であると想定し、リターンを2つのグループに分割します。それらが大幅に異なるかどうかを確認するにはどうすればよいですか?
300を超える値であっても、QQプロットは正規分布に大きな違いがあることを示しているため、正規分布のように扱うことはできないと思います。
1分の在庫返品の2つのサンプル平均を比較したいと思います。私はそれらがラプラス分布(すでにチェックされている)であると想定し、リターンを2つのグループに分割します。それらが大幅に異なるかどうかを確認するにはどうすればよいですか?
300を超える値であっても、QQプロットは正規分布に大きな違いがあることを示しているため、正規分布のように扱うことはできないと思います。
回答:
両方のラプラス分布の分散が同じであると仮定すると、
a)尤度比検定には、次のような検定統計量が含まれます。
ログを取り、キャンセル/単純化し、を掛けます。
()
ここで、は結合されたサンプルの中央値からの平均絶対偏差であり、はサンプル中央値からの平均絶対偏差です。 τ I=MII
ウィルクスの定理によれば、これはnullの下でとして漸近的に分布するため、5%のテストではを超えた場合は拒否します。 3.84
シミュレーション実験は、テストが小さいサンプルサイズでは反保守的であることを示唆しています(拒否の確率は名目よりもいくらか高いです)が、n = 100程度までは、少なくとも妥当であるように見えます(5.3%から5.4%のオーダーになる)たとえば、名目上の5%テストではnullの下での拒否率;場合は5.25%に近いようです)。
b)が良いテスト統計になることも期待します(はサンプルの中央値と); 私がそこでエラーを起こしていない場合、あなたのような大きなサンプルでは、平均0と分散1で、nullの下でほぼ正規分布します。ここで、は平方の二乗に基づくことができます結合サンプルの平均からの絶対偏差。ただし、実際には、2つのサンプルのの サンプル加重平均に基づいて機能する傾向があるとます。〜μV=2τ2(1 τ 2m個2m個 2 I †
(編集:シミュレーションは通常の近似が適切であることを示唆していますが、分散計算は上記では正しくありません。問題は今はわかりますが、修正する必要があります。このテストの置換バージョン(項目(c)を参照)まだ大丈夫です)。
c)別の代替案は、上記の統計のいずれかに基づいて置換テストを実行することです。(ここでの答えの1つは、中央値の違いに対する置換テストを実装する方法の概要を示しています。)
d)ウィルコクソン/マンホイットニー検定はいつでも実行できます。ラプラスでt検定を使用するよりもかなり効率的です。
e)(d)ラプラスのデータよりも良いのは、ムードの中央値テストです。本では反対することがしばしば推奨されますが、ラプラスのデータを扱う場合、それは優れた力を発揮します。私は、中央値の差の漸近検定((c)で言及された検定の1つ)の順列バージョンと同様の力を持つと思います。
ここでの質問は、フィッシャーテストを使用するRの実装を示していますが、そのコードは、代わりにカイ2乗テストを使用するように適合させることができます(中程度のサンプルでも提案します)。あるいは、(関数としてではなく)そのためのサンプルコードがここにあります。
中央値検定は、ここではウィキペディアで議論されていますが、それほど深くはありません(リンクされたドイツ語の翻訳には、もう少し情報があります)。ノンパラメトリックに関するいくつかの本はそれについて論じています。