基準となる議論とは何ですか?なぜ受け入れられなかったのですか?


33

RAフィッシャーの晩期の貢献の1つは基準間隔と基準原理の議論でした。しかし、このアプローチは、頻度主義者やベイジアンの原理的議論ほど人気が​​ありません。基準の議論とは何ですか、なぜ受け入れられていないのですか?


4
興味深い質問。Sprott(2000)は、「基準確率は広く受け入れられていない。これは主に、その無制限の使用が矛盾を生じるという事実による。したがって、基準確率の上記の使用に関する仮定を強調することが重要である...」pp。 77.彼はまた、バーナード(1987)のようなこれらの矛盾についての参照を与えます。この論文は、フィッシャーが「光を見た」とベイジアンになったと主張するために使用されました。

3
フィッシャーが実際に彼の基準の議論を完了したことはなく、少なくともそれを一貫性のあるものにしたことはないと読んだと思いました。Dempsterによる1964年のAMSの記事は、「フィデューシャルな議論の一般的な形式は魅力的であるが、フィッシャーによって課された制限の多くは厄介または曖昧であり、おそらく置き換えられるべきであると結論付けられる」と述べています。
ウェイン

@ウェイン:デンプスターの参照は目を開くことです。ありがとう。
ジョンロス

2
私が約35年前にスタンフォード大学の大学院生だったとき(私の年齢をあげて)、「On Rereading Fisher」のセミナーコースがありました。セミナーのタイトルは、1年ほど前に公開されたそのタイトルの論文から来ました(おそらくJimmie Savageによる)。とにかく、学年のためにセミナーを受講していた各学生は、フィッシャーの論文の1つを読んで、それについて報告しなければなりませんでした。私は有名なベーレンス・フィッシャーの問題について話していました。その論文では、基準となる議論が顕著でした。論文とクラスの私の記憶は、35年前であったことははっきりしていません。
マイケルR.チェルニック

1
フィッシャーは1960年代にオーストラリアで亡くなりました。これは私が統計学者になるずっと前でした。フィッシャーは基準理論は完全だと思っていたと思います。他の統計学者はそれに穴をあけ、彼はそれを守るのに苦労したと思う。しかし、フィッシャーを読んだことがあるなら、彼は熱心であり、常に彼が正しいと確信していることを知っています(彼がそうである必要がありました)。私はバーナードの論文を見たことはないが、フィッシャーはこれまで基準推論をあきらめたことを疑い、彼がベイジアンになったことも疑っている。
マイケルR.チャーニック

回答:


16

あなたが私たちの権威を考慮しないことに驚いています。参考文献は次のとおりです。Encyclopediaof Biostatistics、Volume 2、1526ページ。「フィッシャー、ロナルド・アイルマー」というタイトルの記事。ページの最初の列の一番下から始めて、2番目の列の大部分を見て、著者のJoan Fisher Box(RA Fisherの娘)とAWF Edwardsは次のように書いています。

フィッシャーは1930年に基準の議論を導入しました[11] ....すぐに論争が起こりました。フィッシャーは、客観的な事前確率が述べられない場合に、逆確率のベイジアン引数の代替として基準引数を提案しました。

彼らはジェフリーズとネイマン(特に信頼区間に関するネイマン)との議論を議論し続けます。仮説検定と信頼区間のネイマンピアソン理論は、フィッシャーの記事の後の1930年代に登場しました。キーセンテンスが続きました。

多変量推定の場合、ピボットの一意性がないため、基準引数に関する後の問題が発生しました。

Encyclopedia of Biostatisticsの同巻には、テディサイデンフェルドによる「Fiducial Probability」というタイトルの論文pp。1510-1515があります。その記事の最後の段落から引用するには、

基準確率に関する1963年の会議で、サベージは「基準確率の目的は、ベイジアン卵を壊さずにベイジアンオムレツを作ると私が言っていることのようです」と書いています。その意味で、基準確率は不可能です。多くの偉大な知的貢献と同様に、永続的な価値があるのは、フィッシャーの基準確率に関する洞察を理解しようとすることです。(このテーマの詳細については、Edwards [4]を参照してください。)Behrens-Fisher問題に対する彼の解決策は、たとえば、ベイズの定理を使用した迷惑パラメーターの素晴らしい処理でした。この意味で、「...フィデューシャルの議論は「フィッシャーから学ぶ」[36、p.926]です。このように解釈されると、それは確かに統計的知識への価値ある追加であり続けます。

これらの最後の数文で、エドワーズは、フィッシャーの理論が信用を失っていたとしても、フィッシャーに有利な光を当てようとしていると思います。これらの百科事典の論文や他の統計論文の類似の論文、およびフィッシャーに関する伝記の記事や本を調べることで、これに関する豊富な情報を見つけることができると確信しています。

その他の参照

Box、J。Fisher(1978)。「TAフィッシャー:科学者の生活。」ワイリー、ニューヨーク、フィッシャー、RA(1930)逆確率。ケンブリッジ哲学協会の議事録。26、528-535。

Bennett、JHエディター(1990)統計的推論と分析:RA Fisherの抜粋書簡。オックスフォードのクラレンドン・プレス。

エドワーズ、AWF(1995)。基準推論と自然selectionの基本定理。バイオメトリクス51,799-809。

Savage LJ(1963)ディスカッション。国際統計研究所紀要40、925-927。

サイデンフェルト、T。(1979)。「統計的推論の哲学的問題」ライデル、ドルドレヒト。サイデンフェルト、T。(1992)。RAフィッシャーの基準議論とベイズの定理。統計科学7、358-368。

テューキー、JW(1957)。基準に関連するいくつかの例。数学統計28、687-695の年報。

ザベル、SL(1992)。RAフィッシャーと基準議論。統計科学7、369-387。

生物統計学百科事典の彼の記事でサイデンフェルドが言ったように、漁師はそれを変え続けたため、概念は理解するのが難しい

1930年の出版に続き、彼の生涯の残りの32年間、2冊の本と多数の記事を通じて、フィッシャーは(1)で捉えられたアイデアと、それを「基準逆推論」と呼ぶ推論に固執しましたフィッシャーが彼の斬新なアイデアでそのようなパズルを引き起こしたのは不思議ではありません

θxfid(θ|x)F/θF(x,θ)Xxθσθxθ

これをすべて手に入れるのに苦労しましたが、見つけるのは難しくありません。このような質問に答える必要は本当にありません。「フィデューシャル推論」というキーワードを使用したGoogle検索では、私が見つけたものすべてが表示される可能性が高くなります。

Googleで検索したところ、UNC教授のJan Hannigがそれを改善するために基準推論を一般化したことがわかりました。Google検索では、最近の多くの論文とパワーポイントのプレゼンテーションが行われます。以下のプレゼンテーションの最後の2つのスライドをコピーして貼り付けます。

おわりに

一般化された基準分布は、多くの場合、漸近的に正しい頻度分布を備えた魅力的なソリューションにつながります。

多くのシミュレーション研究は、一般化された基準解が非常に良好な小サンプル特性を持っていることを示しています。

一部の応用分野における一般化された推論の現在の人気は、コンピューターが70年前に利用可能であった場合、基準推論が拒否されなかった可能性があることを示唆しています。

引用

ザベル(1992)「フィデューシャル推論はRAフィッシャーの大きな失敗の1つです。」」

参照を追加するために、ここにHannigの2009 Statistics Sinica論文から引用した参照リストを示します。繰り返しはご容赦ください。しかし、これは役立つと思います。

バーチ、BD、アイアー、HK(1997)。混合線形モデルの分散比(または遺伝率)の正確な信頼区間。Biometrics 53、1318-1333。

バーディック、RK、ボラー、CMおよびモンゴメリー、DC(2005a)。ゲージR&R研究の設計と分析。統計と適用される確率に関するASA-SIAMシリーズ。フィラデルフィア、ペンシルバニア:産業数学および応用数学協会。

バーディック、RK、パーク、Y.-J。、モンゴメリー、DCおよびボラー、CM(2005b)。ゲージR&R研究における誤分類率の信頼区間。J.品質技術 37、294-303。

カイ、TT(2005)。離散分布における片側信頼区間。J.スタティスト。計画。推論131、63-88。

Casella、G.およびBerger、RL(2002)。統計的推論。Wadsworth and Brooks / Cole Advanced Books and Software、カリフォルニア州パシフィックグローブ、第二編。

ダニエルズ、L。、バーディック、RKおよびキロス、J。(2005)。固定演算子を使用したゲージR&Rスタディの信頼区間。J.品質技術 37、179-185。

Dawid、APおよびStone、M。(1982)。基準推論の機能モデルの基礎。アン。統計学者。10、1054-1074。GA BarnardとDAS Fraserによる議論、および著者による回答。

Dawid、AP、Stone、M。およびZidek、JV(1973)。ベイジアンおよび構造的推論における周辺化パラドックス。J.ロイ。統計学者。Soc。Ser。B 35、189-233。DJ Bartholomew、AD McLaren、DV Lindley、Bradley Efron、J.Dickey、GN Wilkinson、APDempster、DV Hinkley、MR Novick、Seymour Geisser、DAS Fraser、A.Zellnerによる議論、AP Dawid、M。Stone 、およびJV Zidek。

Dempster、AP(1966)。サンプルデータに基づいた事後分布に向けた推論の新しい方法。アン。数学。統計学者。37、355-374。

Dempster、AP(1968)。ベイジアン推論の一般化。(議論あり)。J.ロイ。統計学者。Soc。B 30、205-247。

Dempster、AP(2008)。統計学者のためのDempster-Shafer計算。International Journal of Approximate Reasoning 48、365-377。

E、L.、Hannig、J.およびIyer、HK(2008)。不平衡2成分正規混合線形モデルの分散成分の基準間隔。J.アメル。統計学者。連合 103、854-865。

エフロン、B。(1998)。21世紀のRAフィッシャー。統計学者。科学 13、95-122。コメントと著者によるリジョーンダ付き。

フィッシャー、RA(1930)。逆確率。ケンブリッジ哲学協会の議事録xxvi、528-535。

フィッシャー、RA(1933)。未知のパラメーターを参照する逆確率と基準確率の概念。ロンドン王立協会論文集139、343-348。

フィッシャー、RA(1935a)。統計的推論における基準引数。アン。優生学VI、91-98。

フィッシャー、RA(1935b)。帰納的推論のロジック。J.ロイ。統計学者。Soc。B 98、29-82。

フレーザー、DAS(1961)。基準推論について。アン。数学。統計学者。32、661-676。

フレーザー、DAS(1966)。構造的確率と一般化。Biometrika 53、1–9。

フレーザー、DAS(1968)。推論の構造。ジョン・ワイリー&サンズ、ニューヨーク-ロンドン-シドニー。

フレイザー、DAS(2006)。基準推論。経済学の新パルグレーブ辞書(S. DurlaufおよびL. Blume編)。パルグレイブマクミラン、第2版。一般化された金融推論543

ゴーシュ、JK(1994)。高次漸近性。NSF-CBMS地域会議シリーズ。Hayward:数学統計研究所。

ゴーシュ、JKおよびラマムーティ、RV(2003)。ベイジアンノンパラメトリック。統計のスプリンガーシリーズ。スプリンガー出版、ニューヨーク。

グラゴフスキー、YS(2006)。コーシー分布と正規分布の混合に対する基準信頼区間の構築。コロラド州立大学統計学部修士論文。

グランディ、PM(1956)。基準分布と事前分布:前者を後者に関連付けることができない例。J.ロイ。統計学者。Soc。Ser。B 18、217-221。

GUM(1995)。測定における不確実性の表現のガイド。国際標準化機構(ISO)、ジュネーブ、スイス。

浜田正明、ウィーラハンディS.(2000)一般化された推論による測定システムの評価。J.品質技術 32、241-253。

Hannig、J。(1996)。マルチンゲールの限界としての条件付き分布。Mgr。論文(チェコ語)、カレル大学、プラハ、チェコ共和国。

Hannig、J.、E、L.、Abdel-Karim、A。、およびIyer、HK(2006a)対数正規分布の平均の比率の同時基準一般化信頼区間。オーストラル。J.スタティスト。35、261-269。

Hannig、J.、Iyer、HKおよびPatterson、P。(2006b)基準の一般化信頼区間。J.アメル。統計学者。連合 101、254-269。

Hannig、J。およびLee、TCM(2007)。ウェーブレット回帰の一般化された基準推論。技術 コロラド州立大学

Iyer、HK and Patterson、P.(2002)。一般化された重要な量と一般化された信頼区間を構築するためのレシピ。技術 2002/10議員、コロラド州立大学統計局。

Iyer、HK、Wang、CMJおよびMathew、T.(2004)。研究所間試験における真の値のモデルと信頼区間。J.アメル。統計学者。連合 99、1060-1071。

ジェフリーズ、H。(1940)。Behrens-Fisher公式に注意してください。アン。優生学10、48-51。

ジェフリーズ、H。(1961)。確率の理論。オックスフォードのクラレンドン・プレス、第三編。

Le Cam、L. and Yang、GL(2000)。統計の漸近。統計のスプリンガーシリーズ。ニューヨーク:Springer-Verlag、第二編。

Liao、CTおよびIyer、HK(2004年)。いくつかの分散成分を持つ正規分布の許容範囲。統計学者。Sinica 14、217-229。

Lindley、DV(1958)。基準分布とベイズの定理。J.ロイ。統計学者。Soc。Ser。B 20、102-107。

McNally、RJ、Iyer、HKおよびMathew、T。(2003)。一般化されたp値に基づく個人および集団の生物学的同等性のテスト。医学の統計22、31-53。

ムード、AM、グレイビル、FAおよびボーイズ、DC(1974)。統計理論の紹介。McGraw-Hill、第三編。

Pounds、S. and Morris、SW(2003)。p値の経験的分布を近似および分割することによる、マイクロアレイ研究における偽陽性および偽陰性の発生の推定。バイオインフォマティクス19、123601242。

サロメ、D。(1998)。基準法による星座推論。博士号 論文、グローニンゲン大学。544ヤンハニグ

サール、SR、カセラ、G。およびマカロック、CE(1992)。分散コンポーネント。ジョン・ワイリー&サンズ、ニューヨーク。

スティーブンス、WL(1950)。不連続分布のパラメーターの基準限界。Biometrika 37、117-129。

ツイ、K.-W。およびWeerahandi、S.(1989)。迷惑パラメータが存在する場合の仮説の有意性検定における一般化されたp値。J.アメル。統計学者。連合 84、602-607。

ワン、CM、アイアー、HK(2005)。一般化推論を使用した測定の不確実性の伝播。Metrologia 42、145-153。

ワン、CM、アイアー、HK(2006a)。タイプAおよびタイプBの不確実性がある場合の測定量の一般化された信頼区間。測定39、856–863。ワン、CM、アイアー、HK(2006b)。基準推論を使用したベクトル測定量の不確実性分析。Metrologia 43、486-494。

Weerahandi、S.(1993)。一般化された信頼区間。J.アメル。統計学者。連合 88、899-905。

ウィエラハンディ、S。(2004)。反復測定における一般化推論。ワイリー、ホーボーケン、ニュージャージー州。

ウィルキンソン、GN(1977)。統計的推論における論争の解決について。J.ロイ。統計学者。Soc。Ser。B 39、119-171。議論あり。

ヨ、I.-K。およびジョンソン、RA(2001)。U統計の多数の一様な強い法則と、ほぼ対称性への変換への応用。統計学者。プロバブ。レット。51、63-69。

ザベル、SL(1992)。RAフィッシャーと基準議論。統計学者。科学 7、369-387。ノースカロライナ大学チャペルヒル校、チャペルヒル、ノースカロライナ州27599-3260、米国E-mail:hannig@unc.edu(2006年11月に受理、2007年12月に受理)

これを入手した記事はStatistica Sinica 19(2009)、491-544 ON GENERALIZED FIDUCIAL INFERENCE ∗ Jan Hannigノースカロライナ大学チャペルヒル校


3
有効期限まで待つ必要があります...
jbowman

2
@MichaelChernick:私は議論の説明を望んでいましたが、それは欠陥です。現在の答えは、非常に有用ではあるが完全ではないと感じています。
ジョンロス

3
@JohnRos:私の答えを追加しました。一般に、完全な答えを提供する特定の参照を誰かに与えることで十分だと思います。答えに本当に興味を持っている質問の提起者は、参考文献を見て面倒を見て、そのように学ぶべきだと思います。私たちはすべて大人であり、すべてをスプーンで食べる必要はありません。
マイケルR.チャーニック

1
下にスクロールすると、@ hbaghishaniが取得したことがわかります。
マクロ

4
@MichaelChernick、ダウン投票/アップ投票/賞金を獲得できないことについて不平を言うことによって得られるものは多くないと思います。どちらかといえば、これはおそらくユーザーが将来あなたの投稿に注意を払ったり、あなたの投稿に投票する可能性を低くするでしょう。あなたはあなたの答えにもっと努力することは明らかです(組織の改善から恩恵を受けることができたかもしれませんが)、最終的に、投票の選択は意見の問題です-本当の答えはおそらく「私はhbaghishaniの答えが好きだった」です、なぜ彼はそれを言う/説明する必要がありますか?また、上記のJohnRosのコメントをご覧ください。
マクロ

7

θM(x)L(θ|x)M(x)θL(θ|x)θM(x)=(L(θ|x)dθ)1


5

言われたことに加えて、フィッシャーとネイマンの間で、有意性検定と区間推定について論争がありました。ネイマンは信頼区間を定義し、フィッシャーは基準区間を導入しました。彼らは彼らの建設について異なった議論をしましたが、建設された間隔は通常同じでした。したがって、定義の違いは、Behrens-Fisher問題を扱うときに異なることが判明するまで、ほとんど無視されていました。フィッシャーは、基準の評価について強く主張しましたが、彼の素晴らしさと方法の強い主張にもかかわらず、欠陥があるように見えました、そして、統計コミュニティはそれが信用できないと考えるので、それは一般に議論されないか、使われません。推論に対するベイジアンおよび頻繁なアプローチが残っています。


1

ジョージア工科大学の工学部の大規模なイントロ統計で、分散が既知の母平均の信頼区間を議論するとき、ある学生が(MATLABの言語で)私に尋ねました: "区間を> norminv([alpha / 2,1-alpha / 2]、barX、sigma / sqrt(n))?」翻訳では:彼はを取ることができましたα21α2X¯σn

私は言った-もちろんはい、彼が自然に概念分布に到達したことに喜んで驚いた。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.