「これらのデータポイントはすべて同じ分布からのものです。」テスト方法

ここで説明したこのトピックを見たことはありますが、具体的なものを見つけることができませんでした。繰り返しになりますが、何を検索すればよいのかよくわかりません。

順序付けられたデータの1次元セットがあります。セット内のすべてのポイントは同じ分布から引き出されると仮定します。

この仮説をどのようにテストできますか？「このデータセットの観測値は2つの異なる分布から得られる」という一般的な代替案に対してテストするのは妥当ですか？

理想的には、どのポイントが「その他」の分布からのものかを特定したいと思います。データが順序付けられているので、データを切り取るのが「有効」かどうかを何らかの方法でテストした後、切り取り点を特定することはできますか？

編集：Glen_bの答えによると、私は厳密にポジティブな単峰分布に興味があります。また、分布を仮定し、さまざまなパラメーターをテストするという特別なケースにも興味があります。

hypothesis-testing distributions mixture

— シャドウトーカー
ソース

「同じ分布」とはどういう意味ですか？ガンマの観測値は同じ分布からのものと見なされますか、それとも指数分布の合計と見なされますか？

— Metariat

+1これは、あなたが自問するのに本当に良い質問です。

— Mehrdad

限り@Metallica 各観測が指数合計である、私は、彼らが同じ分布からのものだと思います

— shadowtalker

@Mehrdad私は、学士号以上の正式な統計トレーニングを受けておらず、修士課程のいくつかの雑多なクラスもありません。あなたが私の答えの歴史を見れば、それは私が🤐線形回帰と何かについていない多くのことについて多くを知っていることは明らかだ

— shadowtalker

この質問にアプローチする1つの方法は、たとえばあるクラスの分布の有限混合を検討し、データを適切に記述するために複数の混合コンポーネントが必要かどうかを確認することです。ただし、問題は、単一の混合成分によって「帰無仮説」を説明するのに十分な柔軟性のある分布のクラスがあるかどうかです（たとえば、ガンマ分布の有限混合を使用する場合、これらは歪度または尾に関して柔軟性がない場合があります）あなたがやろうとしていることに応じて行動）、多成分混合物としての潜在的な代替を含みます。

— ビョルン

回答:

2つのシナリオを想像してください。

データポイントはすべて同じ分布から引き出されました-（16,36）で均一であったもの
データポイントは、2つの母集団の50〜50の組み合わせから取得されました。

a。人口Aは、次のような形をしています。

b。次のような形状の母集団B：

...この2つの混合物は、1の場合とまったく同じように見えます。

どうやってそれらを区別することができますか？

2つの母集団に対して選択した形状が何であれ、常に同じ形状を持つ単一の母集団分布が存在します。この議論は、一般的な場合には単純にできないことを明確に示しています。差別化する方法はありません。

人口に関する情報（仮定、事実上）を導入すると、多くの場合、先に進む方法があるかもしれませんが、一般的なケースは死んでいます。

*例えば、母集団が単峰性であり、十分に異なる手段を持っていると仮定すると、どこかに到達できる

[質問に追加された制限は、上記で説明した種類の問題の別のバージョンを回避するのに十分ではありません。正のハーフライン上。もちろん、より具体的なヌルがある場合、これは問題のはるかに少なくなります。あるいは、いくつかの混合代替案をテストする立場になるまで、代替案のクラスをさらに制限することも可能です。または、いくつかの追加の制限がnullと代替の両方に適用され、それらを区別可能にする場合があります。]

— Glen_b -Reinstate Monica
ソース

ありがとう、素晴らしい反例。それで、対立仮説を適切に制限することになりますよね？

— シャドウトーカー

@ssdecontrolはい、本質的には。（仮定が与えられた場合）代替案がヌルと区別可能である場合、有意水準よりも高い検出力のテストを希望します。

— Glen_b-モニカの復活

明らかに、テストする分布と状態仮説について話すための理論が必要です。被験者を1つ以上のグループにグループ化するものと、測定値を分解するもの。

どうやって行きますか？次の3つのオプションがあります。

あなたの主題からすでにそれを知っているなら、あなたはそれを統計的仮説の言語に翻訳するだけです
チャートをプロットしてパターンを認識し、テストする仮説になります
適合可能な分布のリストを作成し、数学的実験を行います。ここでは確率的プログラミングがキーワードです

この演習では、サンプルに1つ以上のグループが存在するか、1つだけであると結論付けることができます。またはグループがまったくありません。

— ディエゴ
ソース