ラプラス分布の2つの平均をどのように比較できますか?


10

1分の在庫返品の2つのサンプル平均を比較したいと思います。私はそれらがラプラス分布(すでにチェックされている)であると想定し、リターンを2つのグループに分割します。それらが大幅に異なるかどうかを確認するにはどうすればよいですか?

300を超える値であっても、QQプロットは正規分布に大きな違いがあることを示しているため、正規分布のように扱うことはできないと思います。


コード/パッケージの要求はここではトピックから外れていますが、実際の統計的な質問がここに埋まっています。質問を編集して、根本的な統計上の問題を明確にすることができます。関連する統計的概念を理解すると、ソフトウェア固有の要素が自明であるか、少なくともドキュメントから簡単に取得できることがわかります。
ガン-モニカの復活

「異なる」と言うとき、平均の違いだけに関心がありますか。そうであれば、スプレッドは同じであると想定していますか?
Glen_b-2015

はい、平均が大幅に異なるかどうかを知りたいだけで、分布は同一であると思います。私は標準偏差が同一であるとは必ずしも仮定していませんが、それでも大丈夫だと思います
Rob

2
1分の在庫返品の詳細を入力してください。時間的に相関するデータの平均を比較しますか?
Michael M

2
チェックする値の数は分布を変更しないことにも注意してください。あなたは、サンプルの分布の考え方かもしれ手段で、ラプラスのための非常に近く、正常になります。n=300
Glen_b-2015

回答:


12

両方のラプラス分布の分散が同じであると仮定すると、

a)尤度比検定には、次のような検定統計量が含まれます。

L=i=1n12τ^exp(|xiμ^|τ^)i=1n112τ^1exp(|xiμ^1|τ^1)i=n1+1n12τ^2exp(|xiμ^2|τ^2)

ログを取り、キャンセル/単純化し、を掛けます。2

2l=2(nlog(τ^)n1log(τ^1)n2log(τ^2))()l=log(L)

ここで、は結合されたサンプルの中央値からの平均絶対偏差であり、はサンプル中央値からの平均絶対偏差です。 τ I=MIIτ^=mτ^i=mii

ウィルクスの定理によれば、これはnullの下でとして漸近的に分布するため、5%のテストではを超えた場合は拒否します。 3.84χ123.84

シミュレーション実験は、テストが小さいサンプルサイズでは反保守的であることを示唆しています(拒否の確率は名目よりもいくらか高いです)が、n = 100程度までは、少なくとも妥当であるように見えます(5.3%から5.4%のオーダーになる)たとえば、名目上の5%テストではnullの下での拒否率;場合は5.25%に近いようです)。n1,n2>300

b)が良いテスト統計になることも期待します(はサンプルの中央値と); 私がそこでエラーを起こしていない場合、あなたのような大きなサンプルでは、​​平均0と分散1で、nullの下でほぼ正規分布します。ここで、は平方の二乗に基づくことができます結合サンプルの平均からの絶対偏差。ただし、実際には、2つのサンプルのの サンプル加重平均に基づいて機能する傾向があるとます。μV=2τ21μ~1μ~2vμ~ τ 2m個2m個 2 Iv=2τ^2(1n1+1n2)τ^2m2mi2

(編集:シミュレーションは通常の近似が適切であることを示唆していますが、分散計算は上記では正しくありません。問題は今はわかりますが、修正する必要があります。このテストの置換バージョン(項目(c)を参照)まだ大丈夫です)。

c)別の代替案は、上記の統計のいずれかに基づいて置換テストを実行することです。(ここでの答えの1つは、中央値の違いに対する置換テストを実装する方法の概要を示しています。)

d)ウィルコクソン/マンホイットニー検定はいつでも実行できます。ラプラスでt検定を使用するよりもかなり効率的です。

e)(d)ラプラスのデータよりも良いのは、ムードの中央値テストです。本では反対することがしばしば推奨されますが、ラプラスのデータを扱う場合、それは優れた力を発揮します。私は、中央値の差の漸近検定((c)で言及された検定の1つ)の順列バージョンと同様の力を持つと思います。

ここでの質問は、フィッシャーテストを使用するRの実装を示していますが、そのコードは、代わりにカイ2乗テストを使用するように適合させることができます(中程度のサンプルでも提案します)。あるいは、(関数としてではなく)そのためのサンプルコードがここにあります

中央値検定は、ここではウィキペディア議論されていますが、それほど深くはありません(リンクされたドイツ語の翻訳には、もう少し情報があります)。ノンパラメトリックに関するいくつかの本はそれについて論じています。


まことにありがとうございます!正規分布検定の場合と同様に、平均= 0および標準偏差= 1のラプラス分位を超えた場合、使用した検定統計量を使用して拒否できますか?
Rob

申し訳ありませんが、あなたが何を求めているのか本当にわかりません。その意味を詳しく説明する必要があります。どのテスト統計を参照していますか?[(a)、(c)、または(d)に記載されているテストに固執する必要があります。これは、「」でマークされた編集として、(b)とラベル付けされた2番目の漸近的な分散で計算された分散に何か問題があるためです。明確に述べています。私はまだそのような場合を修正する必要があるが、私は...すぐにそれを取得しないことがあり
Glen_b -Reinstateモニカ

@Glen_b。有用な回答のおかげ(+1)ですが、nullモデルには2つのパラメーター(および)がありますが、別のモデルには4つあります。つまり、ますか?(サンプルサイズが小さい中程度のケースでは、とにかくシミュレーションで値を表にしています) τ χ 2 2μ^τ^χ22
P.Windridge

または、代替モデルのスケールに単一の推定値を使用しましたか?
P.Windridge

@ P.Windridgeこれは素晴らしい点です。はい、代替からnullに移行する際に2つの自由パラメーターを削減する代数式を使用しているためです(ただし、実際に記述したとき、同じスケールを想定することを考えていました)。私はそれを修正して、すべてが一貫しているようにする必要があります(そして、私が編集している間、私が編集で言及した他の問題を修正するためにχ12
やり直す必要
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.