「ランダムな」信頼性または信頼できる間隔を使用するのはなぜですか?


16

私は最近、自信と信頼できる間隔にランダム性を組み込んだ論文を読んでいたのですが、これが標準かどうか(そしてそうであれば、なぜそれが妥当なことなのか)疑問に思いました。表記法を設定するには、データがあり、パラメーター区間を作成することに関心があると仮定します。私は、関数を構築することによって構築される信頼/信頼区間に慣れています:θ ΘバツバツθΘ

fバツΘ{01}

間隔をます。={θΘfバツθ=1}

これは、データに依存するという意味でランダムですが、データに条件があるのは単なる間隔です。このペーパーでは、代わりに

gバツΘ[01]

また、IID一様確率変数の集合上の[0,1] 。関連する区間をI = \ {\ theta \ in \ Theta \、:\、f_ {x}(\ theta)\ geq U _ {\ theta} \}と定義します。これは、データから得られるものを超えて、補助的なランダム性に大きく依存することに注意してください。 [ 0 1 ] I = { θ Θ{うんθ}θΘ[01]={θΘfバツθうんθ}

なぜそうするのか、とても興味があります。f_ {x}のような関数からg_ {x}のfバツような関数への区間の概念を「緩和」するのは理にかなっていると思います。ある種の重み付き信頼区間です。私はそれについての参照を知りません(そして、どんなポインタも感謝します)が、それは全く自然に思えます。ただし、補助的なランダム性を追加する理由は考えられません。gバツ

これを行うための文献/理由へのポインタをいただければ幸いです!


5
(+1)これは、ランダム化された手順と呼ばれます。 これらは統計的推定およびテストフレームワークの標準的な部分であるため、説明を提供するために、ほぼすべての厳密な教科書に頼ることができます。それらを使用する追加の動機は、ゲーム理論の文献にあります。
whuber

回答ありがとうございます。このコメントを読んだ後、たとえばブートストラップがこのフレームワークに収まることを知りましたが、その状況ではランダム化の理由は明らかです(fにアクセスできず、gだけです)。私の場合、著者は明示的に計算し、THENは調べます。統計の教科書はたくさんありますが、どこにも表示されません...提案されたテキストはありますか? g xfxgバツ
QQQ

3
実際、ブートストラップはランダム化された手順ではありません。これは、ランダムサンプリングによって近似計算が実行される確定的な手順です。
whuber

回答:


4

ランダム化された手順は、理論を単純化するため、理論で使用されることがあります。典型的な統計上の問題では、実際には意味がありませんが、ゲーム理論の設定では意味があります。

実際にそれを使用するのを見ることができる唯一の理由は、それが何らかの形で計算を単純化する場合です。

理論的には、十分な原則から使用すべきではないと主張することができます。統計的結論は、データの十分な要約にのみ基づいているべきであり、ランダム化は、データの十分な要約の一部ではない無関係なランダム依存性を導入 します。うん

UPDATE  

ここで引用された以下のwhuberのコメントに答えるには、「なぜランダム化された手順は「実際に意味をなさない」のでしょうか? 、その後のデータの分析でランダム化を使用することについて、何がそんなに違う(そして非実用的または好ましくない)のでしょうか?」

さて、データを取得するための実験のランダム化は、主に因果関係の連鎖を破るために行われます。それが効果的であるかどうかは、別の議論です。分析の一部としてランダム化を使用する目的は何ですか?私が今まで見た唯一の理由は、それが数学的理論をより完全にするということです!それが行く限り、それは大丈夫です。ゲーム理論のコンテキストでは、実際の敵がいる場合、ランダム化することで彼を混乱させます。実際の意思決定のコンテキスト(売るか、売らないか)で決定を下す必要があり、データに証拠がない場合は、コインを投げることができます。しかし、問題は私たちが何を学ぶことができるかという科学的文脈においてデータから、ランダム化は場違いのようです。私はそれから本当の利点を見ることはできません!あなたが同意しない場合、生物学者または化学者を説得することができる議論がありますか?(そしてここでは、ブートストラップやMCMCの一部としてのシミュレーションについては考えていません。)


1
ランダム化された手順が「実際には意味をなさない」のはなぜですか?他の人が指摘したように、実験者にランダム化を使用して完全に喜んで構成その後にランダム化の使用について大きく異なる(及び非実用的または不快)であるので、どのような治療及び制御の無作為割付としてのそれらの実験データの分析データの?
whuber

1
@kjetil十分性の原則についての声明を完了していないかもしれないと思う、それは文の途中で切り捨てられたようだ(「統計的結論は...」)。
シルバーフィッシュ

1
うん

1
@whuber:データを取得する際のランダム化が有利である可能性があるということは、明確で原則的な議論です。(因果連鎖を壊します)。分析の一部としてランダム化を使用するための原理的な議論は何ですか?
kjetil bハルヴォルセン

1
Kjetil:それは、あなたが望んでいたものではないリスク関数(多くの場合、名目サイズとパワーの形で)を受け入れるのではなく、意図したリスク関数を達成することを可能にします。さらに、手順が「理論的に」有用である場合、実際には、実行不可能性(通常はランダム化手順では当てはまらない)以外に、実際に使用することに異議はありません。したがって、あなたの質問は頭の中で回さなければなりません:ランダム化された手順の使用に何か問題があることを示すのはあなたの負担です。自分自身に矛盾することなく、それをどのように達成しますか?
whuber

3

アイデアはテストに言及していますが、テストと信頼区間の二重性を考慮すると、同じロジックがCIに適用されます。

基本的に、ランダム化されたテストは、離散値の実験でも特定のサイズのテストが得られることを保証します。

α=0.05pH0p=0.5H1p<0.5n=10

H0k=2ppbinom(2,10,.5)k=1H0

k=2


α

まあ、私たちは統計の歴史に戻ってきたと思います。RAFisherは5%の有意水準で作業して、何らかの初期証拠がさらなる研究を必要とするかどうかを決定することを幾分arbitrarily意的に決定しました。私たちが知っているように、5%はそれ以降、多くの分野で、優れた意思決定理論的基盤が欠けているにもかかわらず、一種のゴールドスタンダードに変化しています。
クリストフハンク
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.