常連客は誰ですか?


55

我々はすでに求めてスレッドを持っていたBayesiansある人、もう1つは尋ねfrequentistsがBayesiansであれば、しかし直接尋ねるどのスレッドがなかったfrequentistsている人は?これは、@ whuber がこのスレッドへコメントとして尋ねた質問であり、回答を求めています。それらは存在しますか?たぶん、彼らは主流の統計を批判するときに責めるためにスケープゴートを必要としたベイジアンによって作られたのでしょうか?

すでに与えられた答えへのメタコメント:対照的に、ベイジアン統計は、ベイズの定理の使用(非ベイジアンも使用する)だけで定義されているわけでなく、確率の主観主義的解釈の使用についても定義されていません(素人とは呼ばないでしょう)「確率は50:50未満だと思います!」と言っています)-頻度の採用は、確率の採用された解釈に関してのみ定義できますか?また、統計確率を適用し、そのfrequentismの定義は、単に確率の解釈に集中する必要がありますか?


10
私はまだ「周波数主義者」とは何か知りたいですか?この用語は、「ベイジアン以外の人」だけでなく、頻度論の確率哲学を購読している人への明らかな参照として使用されていることを見てきました。前者の多くが存在することは知っていますが、後者の生きている指数があるかどうかはわかりません!
whuber

9
頻繁に参加してください。団結しましょう!ユナイテッドは、ゲートでベイジアンを破壊することに強くなります!
アクサカル

10
@Aksakalはそれを無限に繰り返し、私はそれを重要だと考えます;)
ティム

5
あなたがベイジアンと呼ぶ人に注意してください。DV Lindleyによれば、「経験的ベイジアンほどベイジアンに劣るものはいない」。いわゆるベイジアン法の多くのユーザーは、実際にはベイジアンではありません。高速なコンピューターとMCMCで、誰もが突然ベイジアンになりましたか?多くの人にとって、それは他の計算と同じように別の計算であり、根深い哲学ではありません。人口はばらばらに分かれており、フリークエンティストとベイジアンの間だけです。関連する教育を受けていない人はどうですか、彼らは何ですか?ベイジアン性の程度(または頻度)はありますか?曜日や分析の種類によって異なるのでしょうか?
マークL.ストーン

10
ティム、このスレッドは、関連するスレッドと同じ混乱の影響を受ける可能性があると考えています。つまり、頻度の高いベイジアン統計手法と、頻度の多いベイジアンの確率解釈があります。これらは2つの異なる問題です!どっちの質問?@fcopの答えに対するコメントで、混乱はすでに明らかです。fcopは確率の定義/解釈について説明しますが、OLSについてはあなたが言及しており、これは統計的手法についてです。
アメーバは、モニカの復活

回答:


35

いくつかの既存の答えは統計的推論について、またいくつかは確率の解釈について述べていますが、明確に区別できるものはありません。この答えの主な目的は、この区別をすることです。


「frequentism」(および「frequentist」)という言葉は、2つの異なることを指します:

  1. 1つは、「確率」の定義または解釈についての質問です。複数の解釈があり、「頻度の高い解釈」がその1つです。通訳者は、この解釈に固執する人々でしょう。

  2. もう1つは、観測データに基づくモデルパラメーターに関する統計的推論です。統計的推論にはベイジアンおよび頻度主義的アプローチがあり、頻度主義者は頻度主義的アプローチの使用を好む人々でしょう。

憶測が浮かびます。第1種の頻度主義者(P-frequentists)はほとんどいないと思いますが、第2種の頻度主義者(S-frequentists)はたくさんいます。


確率の頻繁な解釈

確率とは何かという問題は、100年以上の歴史を持つ激しい議論の対象です。それは哲学に属します。私はこの議論に精通していない人に、スタンフォード哲学百科事典の頻度論的解釈に関するセクションを含む確率解釈の記事を参照します。私が知っている別の非常に読みやすいアカウントは、この論文です:Appleby、2004、Probability is single-case or nothing-量子力学の基礎の文脈で書かれていますが、確率とは何かに焦点を当てたセクションが含まれています。

Applebyの書き込み:

頻度とは、確率ステートメントが、適切に選択されたアンサンブルに関する頻度ステートメントと同等であるという位置です。たとえば、フォンミーゼス[21、22]によると、「このコインが頭に来る確率は0.5」という文は、「トスの無限のシーケンスでは、このコインは相対周波数0.5を制限して頭に来る」という文と同等です。 。

これは理にかなっているように見えるかもしれませんが、この定義には非常に多くの哲学的問題があり、どこから始めればよいのかほとんどわかりません。明日雨が降る確率はどのくらいですか?意味のない質問です。試行の無限のシーケンスをどのように持っているのでしょうか。ポケットに入っているコインが頭に浮かぶ確率はどのくらいですか?トスの無限のシーケンスにおける頭の相対的な頻度、あなたは言いますか?しかし、無限のシーケンスが終了する前に、コインはすり減り、太陽は超新星になります。したがって、仮想の無限シーケンスについて話すべきです。これにより、参照クラスなどの議論が行われます。哲学では、それほど簡単に逃げることはできません。ところで、なぜ制限が存在するのでしょうか?

さらに、もし私のコインが最初の10億年間に50%の確率で頭に浮かんだのに、25%の確率で頭に浮かんだとしたらどうでしょう(Applebyの実験)。これは、定義によりことを意味します。しかし、今後10億年間は、を常に監視しています。そのような状況は実際には不可能だと思いますか?確かに、なぜですか?ので急激に変化することはできませんか?しかし、この文はP頻度論者にとっては無意味です。F のR Eのq個のU E N C YH E DのS1 / 2 P H E DのSP(Heads)=1/4Frequency(Heads)1/2P(Heads)

この回答を短くして、ここで停止します。参照については上記を参照してください。頑固なP頻度主義者になるのは本当に難しいと思います。

(更新:以下のコメントでは、@ mpiktasは、頻度主義者の定義が数学的に意味がないためだと主張しています。上記の私の意見は、頻度主義者の定義は哲学的に問題があるということです。)


統計への頻繁なアプローチ

いくつかのパラメーター持ち、データを観測する確率を計算できる確率モデル考えます。実験を行い、データを観察しました。について何と言えますか?θ X X θP(Xθ)θXXθ

Sは、が確率変数ではない位置です。現実世界での真の価値はそれが何であるかです。それらをとして推定しようとすることはできますが、がある間隔(たとえば、正の値)にある確率について有意義に話すことはできません。私たちにできる唯一のことは、特定の長期的な成功頻度(特定の確率)で真のを包含することに成功するように、推定値の周りに何らかの間隔を構築する手順を考え出すことです。θ θ θθθ^θθ

現在、自然科学で使用されている統計のほとんどはこのアプローチに基づいているため、今日多くのS頻度論者が存在します。

(更新:統計学の実践者とは対照的に、S頻度論者の視点を擁護する統計学の哲学者の例を探しているなら、デボラメイヨーの著作を読んでください; @NRHの答えに+1。)


更新:P周波数とS周波数の関係について

@fcopなどは、P周波数とS周波数の関係について質問します。これらの位置の1つは別の位置を意味しますか?歴史的に S周波数がP周波数のスタンスに基づいて開発されたことは間違いありません。しかし、それらは論理的にお互いを暗示していますか?

この質問に取り組む前に、次のことを言う必要があります。上記でP頻度主義者がほとんどいないと書いたとき、ほとんどすべての人がP主観的ベイジアン・ア・ラ・ド・フィネッティまたはPプロペンシスト・ア・ラ・ポッパーであることを意味しませんでした。実際、ほとんどの統計学者(またはデータ科学者、または機械学習者)は、Pなし、またはPシャットアップと計算(Merminの有名なフレーズを借用する)であると信じています。ほとんどの人は、財団の問題を無視する傾向があります。そしてそれは大丈夫です。私たちには、自由意志、知性、時間、愛の良い定義がありません。しかし、これは私たちが神経科学、AI、物理学、恋に落ちることを妨げるものではありません。

個人的には、私はS頻度論者ではありませんが、確率の基礎について一貫した見解持っていません。

対照的に、実用的な統計分析を行ったほとんどすべての人は、S-頻度論者またはS-ベイジアン(あるいは混合物)です。個人的には、値を含む論文を発表しましたが、(これまで)モデルパラメーターの事前確率と事後確率を含む論文を発表したことがないため、少なくとも実際にはS頻度論者になります。p

したがって、@ fcopが答えで言っていることにもかかわらず、P頻度論者でなくてもS頻度論者になることは明らかに可能です。

はい。いいよ しかしそれでも、P-ベイジアンはS-フリークエンシストになれますか?また、P頻度論者はSベイジアンになることができますか?

確信しているP-ベイジアンにとっては、おそらくS-周波数主義者であることは異例ですが、原則的には完全に可能です。たとえば、P-ベイジアンはについての事前情報がないと判断できるため、S周波数分析を採用できます。何故なの。すべてのS頻度論者の主張は、確率のPベイジアン解釈で確実に解釈できます。θ

確信したP頻度論者がSベイジアンであることはおそらく問題です。しかし、することは非常に問題があることを確信P-frequentist ...


2
コメントは詳細なディスカッション用ではありません。この会話はチャットに移動さました
Glen_b

13

確率論の基礎に関するコルモゴロフの研究には p.3の「実験データとの関係」というセクションあります。これは彼がそこに書いたものです:

ここに画像の説明を入力してください

ここに画像の説明を入力してください

彼は、実験を観察することで公理を差し引く方法を示しています。これはかなり頻繁に確率を解釈する方法です。

彼は、不可能なイベント(空のセット)に対する別の興味深い引用を持っています:

ここに画像の説明を入力してください

ですから、これらの議論に満足しているのであれば、あなたは頻繁に活動していることを認めなければなりません。このラベルは排他的ではありません。あなたはバイパラダイム(私は言葉を作りました)、すなわち、頻繁なものとベイジアンの両方になることができます。たとえば、本質的に確率論ではない現象に確率論的手法を適用すると、ベイジアンになります。

更新CVで以前に書いたように、コルモゴロフの理論自体は、それ自体は頻繁ではありません。頻繁なビューと同様に、ベイジアンビューと互換性があります。彼はこのキュートな脚注をセクションに置いて、哲学を控えていることを非常に明確にしました。

ここに画像の説明を入力してください


1
ほとんどの公理システムは、実世界の概念を「抽象化」または「一般化」することによって派生しています。同じことが「メトリック」の概念(軸)にも当てはまります。彼らは現実世界の概念(ユークリッド距離)を見て、メトリック空間で「軸」として使用した3つのプロパティを「発見」しました。しかし、あなたの答えは良いです(+1)、コルモゴロフは彼の公理を「空から」「発明しなかった」ことを示しています。

1
この質問に対する@mpiktasのコメントを見て、コルモゴロフ自身がその定義を与えたと言ってもらえますか?stats.stackexchange.com/questions/230415/の

2
@fcop、彼の答えを覚えています。理にかなっているように見えました。あなたは間違いなくベイズの公理を導き出すことができ、コルモゴロフはそれを本で示しています。
アクサカル

1
+1関連するスレッドにコメントを書いていたとき、私が念頭に置いていたもの(特に脚注)。@Aksakalによる最後のコメントも。
グレアムウォルシュ

1
@Aksakal:上記のコメントを参照してください:それは ''彼 ''の答えではなく、私のものでした:

8

私は、ブログのエラー統計哲学を書いているデボラ・メイヨーに言及することが適切であると信じています。

私は彼女の哲学的立場を深く理解しているとは主張しませんが、Aris Spanosの論文で説明されているエラー統計の枠組みには、古典的頻度主義統計法と見なされるものが含まれています。論文を引用するには:

エラー統計手法の傘下では、繰り返しサンプリングにおけるエラーの相対頻度に基づくエラー確率を使用するすべての標準手法を含めることができます。これは、サンプリング理論または周波数統計と呼ばれます

同じ論文のさらに下で、あなたはそれを読むことができます:

エラー統計学者の確率は、仮説の確認または信念(実際または合理的)の程度を測定するのではなく、メソッドが対立仮説を区別できる頻度とエラーの検出を容易にする方法を定量化するために発生します。


2
+ 1、Mayoのブログについて言及しました。彼女は確かに、頻繁な統計をサポートしている統計の最も声高な哲学者です。最近のインターネット上の他の暴言のほとんどは、ベイジアン統計を支持しています。
アメーバは、モニカを復活

6

nnAAAP(A)

P(A):=limn+nAn

この定義がコルモゴロフの公理を満たしていることを確認するのは難しくありません(制限を取得することは線形であるため、ベイジアン対頻度論者の議論の*数学的*根拠はありますか?も参照)。

そのような定義を与えるために、彼らはこの限界が存在することを「信じる」必要があります。したがって、フリークエンティストは、この限界の存在を信じる人々です。

2016年8月31日に編集:S周波数とP周波数の区別について

@amoebaは彼の答えでS頻度論者とP頻度論者を区別しているので、P頻度論者は私が上で定義した頻度論者のタイプであり、P頻度論者になるのは難しいと主張するので、EDITセクションを追加しました反対が真実であると主張する。

私は、すべてのS頻度論者がP頻度論者であると主張します

S周波数のセクションで、@ amoebaは「この手順は、特定の長期的な成功頻度(特定の確率)で真の包含することに成功しています」と述べています。θ

彼の回答では、彼はまた、P頻度論者は希少種であると述べています。

しかし、S頻度を定義するために使用されるこの「長期的な成功頻度」は、の解釈であるため、彼がP頻度として定義するものです。P(CI^θ)

したがって、彼の定義によれば、すべてのS-周波数はP-周波数でもあります。したがって、私は、P頻度論者がアメーバによって議論されるほど珍しくないと結論付けます。

さらにあります。@amoebaはまた、S頻度論者が未知のパラメーターを固定または非ランダムと見なしているため、「特定の値を持つの確率」について話すことはできないと主張しています。θθ

「私たちにできる唯一のことは、特定の長期成功頻度(特定の確率)で真のを包含することに成功するように、推定値の周りに何らかの間隔を構築する手順を考え出すことです 」θ

'' frequentist ''という名前の由来は何ですか?(a)'' non-random '' -ideaまたは(b) '' long-run frequency ''-idea?θ

また、アメーバの答えに対するコメントを書いている@mpiktasに聞いてもいいですか:

'' P頻度論者になるのは非常に難しい。なぜなら、そのような確率を数学的に正確に定義することは事実上不可能だから ''

S周波数を定義するためにP周波数の定義が必要な場合、どうしてP周波数よりもS周波数になりますか?


3
@Tim:なぜOLSは '' frequentist ''なのでしょうか?

2
そうだとすれば、彼らの関心の範囲は非常に限られており、統計の巨大な領域は範囲外であるため、誰が頻繁にいるのかについての議論全体はあまり意味がないようです... Bayesians。)私は何を言っていることは、これはしていないようであること、それはあまりにも狭いので定義。
ティム

2
何をBayesians(自己宣言し、または単に間奏のために彼らの"ベイジアン帽子"を身に着けている現実主義)を信じている?limn+nAn
シルバーフィッシュ

1
@Silverfishベイジアンは、希望する場合、確率としてロングラン周波数を自由に使用できます。オプションがないのはフリークエンシーのみです。主な違いは、ベイジアンはと言うかもしれませんが、推論では、1E12観測から得られるの妥当な値の分布を定義することに関心があるということです。limn+nA/npHlimn+nA/npH
ディクラン有袋類

3
正確にその理由のための確率理論の基礎、すなわち、確率の特定の解釈を与えるためには、数学的な背景が必要です。さて、戻って「頻度」の定義で確率を「再発明」したいと思います。私はこの誤解を招くと思うので、あなたの答えに投票します。これは無視して構いません。これがサイトの仕組みであり、意見の相違が常に発生する可能性があります。
mpiktas

4

本当に興味深い質問です!

確率ステートメントを理解して解釈することになると、私は頻繁にキャンプに参加しましたが、この確率を根拠とする実際の一連のiid実験の必要性についてはそれほど難しいことではありません。「確率は信念の主観的尺度である」という論文を買わない人のほとんどは、このように確率についても考えるだろうと思います。

意味は次のとおりです。割り当て通常の「公正な」コインを取得します。これを聞くと、私は誰かがこのコインを何度も投げるイメージを形成し、頭の割合は近づきます。さて、押された場合、私はまた、ヘッドの一部だと思いますどのようにコイン投げの有限シーケンスからランダムなサンプルも近づくサンプルサイズは、(独立性の仮定を)大きくなるにつれて。P(H)=0.50.50.5

他の人が述べたように、最大​​の仮定はこの制限が存在し、正しいことです(つまり、制限は)が、ランダムに選択されたサブサンプルにも同じ制限が存在するという仮定も同様に重要だと思います。それ以外の場合、解釈は無限シーケンス全体に対してのみ意味を持ちます(たとえば、平均化される強い自己相関を持つことができます)。0.5

頻度の高い人にとっては上記はかなり議論の余地があると思います。ベイジアンは、目の前の実験により焦点を当て、長期的な行動にはあまり焦点を当てません。次のトスが頭になるという信念の程度は、 ...フルストップであると述べます。P(H)=0.5

コイン投げなどの単純なケースでは、哲学的に非常に異なるものの、頻度主義者とベイジアンのアプローチは機能的に同等であることがわかります。Dikran Marsupialが指摘したように、実際、ベイジアンは、経験的にコインが尾を引くのと同じくらい頻繁に頭に来るという事実を利用している可能性があります(以前のように長い実行/大きなサンプル頻度)。

おそらく長時間の実行頻度を持つことができないものはどうですか?たとえば、北朝鮮が今後10年間に日本との戦争を開始する可能性はどのくらいですか?このような仮説をテストするために必要なサンプリング分布を実際に説明することはできないため、頻繁に訪れる人にとっては、私たちは本当に大いに取り残されています。ベイジアンは、可能性に確率分布を配置することにより、この問題に取り組むことができるでしょう。おそらく、専門家の入力を引き出すことに基づいています。

しかし、重要な疑問が浮上します。これらの信念度(または長期的な頻度の想定値)はどこから来るのでしょうか。私は心理学から議論し、これらの信念(特に実験データから遠く離れた領域で)は、可用性ヒューリスティックおよび代表性ヒューリスティックと呼ばれるものから来ていると言います。スルーがあります他人可能性が遊びに来ます。これは、信念を調整するためのデータがない場合(観測された長期実行頻度に向かって!)、ヒューリスティックに頼らなければならないからです。

上記の精神的発見的思考は、頻度主義者とベイジアンに等しく適用されます。私にとって興味深いのは、私たちの哲学に関係なく、根本的には、真実である可能性が高いと思われるものにより多くの信念を置くことです。それが真実であるため、またはそれを真実にするための経路は、それを真実ではないものにするよりも頻繁に(頻繁に:-)起こると思います。

選挙の年なので、政治的な例を見てみましょう。「テッドクルーズは今後4年以内にアサルトライフルの禁止を提案する」という声明にどのような信念を置くでしょうか。今、私たちは彼自身の声明からこれに関するいくつかのデータを持っています、そして、私たちはこの声明の真理に対する以前の信念をゼロに非常に近いものにするでしょう。しかし、なぜ?彼の以前の声明はなぜ私たちにこのように考えさせるのですか?なぜなら、イデオロギーの高い人々は、実践主義者よりも「銃に執着する」傾向があるからです。これはどこから来たのですか?心理学者によって行われた研究と非常に原則的な人々との私たち自身の経験からの可能性が高い。

言い換えれば、Cruzのような人が心を変えることができるほとんどの場合、彼らは変わらないというデータと信念があります(再び、長期にわたる、または大規模な種類の評価)。

これが私が頻繁に「コーカス」である理由です。ベイジアン哲学(かなり合理的)や方法(それらは素晴らしい!)が嫌いではありませんが、強力な大規模なサンプルの裏付けに欠ける信念を持っている理由を深く掘り下げると、何らかの種類に依存していることがわかります結果を(暗黙的に)集計できる、または特定のサブプロセスで長期的な確率を呼び出すことができる精神モデルの例(たとえば、共和党がX%の銃規制に反対する投票)は、私の信念を何らかの方法で重み付けする。

もちろん、これは本当に本当の頻度ではありません。私は、手紙に対する確率のフォン・ミーセス風の解釈に同意する多くの人々がいることを疑います。ただし、ベイジアンとフリークエンティストの確率の間の基本的な互換性を示していると思います。どちらも、可用性または因果関係に沿った頻度に関する「パチンコ」原理と呼ばれるものに関する内部のヒューリスティックに訴えています。

したがって、おそらく「可用性」と呼んで、一連のイベントの結果として発生するイベントを想像できる頻度に基づいて確率を割り当てることを示す必要があります(もちろん厳密/モデリングを伴う)。大量のデータがある場合、素晴らしい。もしそうでなければ、仮説を一連のイベントに分解し、私が持っているデータ(必要に応じて逸話的または「常識」)を使用して、そのようなイベントが発生する頻度を評価します。

長い質問、すごい質問、すみません!


1
あなたは、確率に対する主観主義的アプローチについて非常に単純化しすぎています。私は心理学がデータの扱い方に役割を果たしていることに同意しますが、頻度主義的なアプローチでも主観的に偏った分析を行うことができます。一部のベイジアンは、ベイジアンの場合、少なくともあなたは主観的な信念を無視するのではなく、明確にすることを主張します。
ティム

1
@Tim私は、頻度主義者がより客観的であると言っていませんでした(頻度主義者の主要な仮定についての私の最初の部分を参照してください)。また、私が指摘していたのは、または何かを実現するために何回発生する必要があるか(およびその可能性)。

1
@Timこれは、ベイジアン主義と頻度主義それ自体についての投稿ではないので、私は彼らに当然のことを言ったとは思わない...それは多くのページスペースを取るだろう!基本的に、確率について考えるとき、私たちは全員、精神的な発見的手法に頼っています。これらの発見的手法により、ある種のイベントが「より多くの方法で」発生するか、「因果関係ネットワークで他の人よりアクセスしやすい」と考えるようになります。

1
@ティムOK ...ベイジアン主義の(簡潔な)議論から私の主なスピルに移行する時期を明確にするためにいくつかの言語を追加しました。

4

以下のよう@amoebaは気づいた、私たちはのfrequentist定義してい確率とfrequentist 統計を。(すでにによって気づいたように私が今まで見てきたすべてのソースはfrequentist推論が無数にランダムに与えられた割合の上限として、それを理解する確率のfrequentist定義、つまり引き分けに基づいていると言う@fcop@Aksakalはコルモゴロフを引用します)

P(A)=limnnAn

したがって、基本的に、繰り返しサンプリングできる母集団の概念があります。同じ考え方が頻繁な推論に使用されます。Jerzy Neymanのような古典的な論文をいくつか読んで、頻度統計の理論的基礎を追跡しました。1937年にネイマンは書いた

ia)統計学者は人口に関係しており、何らかの理由で網羅的に研究することはできません。この母集団からサンプルを引き出すことのみが可能で、これを詳細に調査し、母集団特性を記述する特定の定数の値に関する意見を形成するために使用できます。たとえば、人口などを形成する個人が所有する特定のキャラクターの平均を近似的に計算することが望ましい場合があります (ibπ π ππππ
)あるいは、統計学者は、明らかに同一の条件下で繰り返された場合、さまざまな結果が得られる特定の実験に関心があるかもしれません。このような実験はランダム実験と呼ばれます[...]
両方のケースで、統計学者が直面する問題は推定の問題です。この問題は、推定値と呼ばれる結果を得るために観測データに対してどの算術演算を実行するかを決定することにあります。推定値は、母集団 、(ia)のように、または(ib)のようなランダム実験のように。[...]で (iaπ
)調査対象の母集団からサンプルを引き出す統計学者について話します。

別の論文(Neyman、1977)で、彼は、データで提供された証拠が、研究された現象の繰り返される性質を観察することによって検証される必要があることに気付きました。

通常、推測されたモデルの「検証」または「検証」は、以前に経験的に研究されていない状況での頻繁な結果のいくつかを推測し、その後、その結果が予測と一致しているかどうかを確認する適切な実験を実行することにあります。非常に一般的に、検証の最初の試みは否定的です。実験のさまざまな結果の観測された頻度は、モデルと一致しません。しかし、幸運な場合には合理的な合意があり、少なくとも何らかの一般的な方法で、現象を「理解」したことに満足を感じます。後になって、常に新しい経験的発見が現れ、元のモデルの不十分さを示し、その放棄または修正を要求します。これが科学の歴史です!

さらに別の論文で、Neyman and Pearson(1933)は、固定母集団から抽出されたランダムなサンプルについて書いています

一般的な統計実践では、観察された事実が「サンプル」として説明され、仮説がサンプルが描かれた「人口」、サンプルの特性、または基準と呼ばれるものに関するものである場合仮説のテストに使用されますが、多くの場合、幸福な直観によって修正されるようです。

この文脈での頻繁な統計は、証拠が収集される科学的推論を定式化し、新しいサンプルが引き出されて最初の発見を検証し、さらに証拠を蓄積するにつれて知識の状態が結晶化します。再び、Neyman(1977)によって記述されているように、プロセスは次のステップを取ります

i)自然に発達するように、興味深いと判断されたイベントの明らかに安定した長期相対頻度(または略して「頻度」)の経験的確立。
ii)「偶発メカニズム」を推測して検証し、その繰り返し動作により観測された周波数が生成されます。これは「頻度論的確率論」の問題です。場合によっては、このステップには「モデルの作成」というラベルが付けられます。当然、推測されたチャンスのメカニズムは仮説に基づいています。
iii)「成功」の最高の「尺度」を確保するために、観察に対する行動(または「決定」)を調整する規則を推定するために、調査された現象の仮説的チャンスメカニズムを使用します。[... 「私たちの行動を調整する規則」の問題は、数学、特に数学的統計の問題です。

頻繁な研究者は、データのランダムな性質と固定母集団からの繰り返しの描画を念頭に置いて研究を計画し、それに基づいて方法設計し、それを使用して結果を検証します(Neyman and Pearson、1933)、

それぞれの仮説が真であるか偽であるかを知ることを望むことなく、私たちはそれらに関する行動を支配するルールを検索するかもしれません。それに従って、長い経験の中で、私たちはあまり頻繁に間違ってはならないことを保証します。

これは、繰り返しサンプリングの原理に関連しています(Cox and Hinkley、1974):

(ii)強力な繰り返しサンプリングの原則強力な繰り返しサンプリングの原則に
よれば、統計的手順は、同じ条件下での仮想的な繰り返しでの動作によって評価されます。これには2つのファセットがあります。不確実性の尺度は、長期にわたる繰り返しの仮説的な頻度として解釈されます。最適性の基準は、仮説の繰り返しにおける敏感な行動の観点から定式化されます。
これに対する議論は、計算する量の物理的意味を保証し、分析と「真の」状態を表すと見なされる基礎となるモデルとの密接な関係を保証することです。

(iii)弱い繰り返しサンプリングの原理
弱いサンプリング繰り返しの原理は、いくつかの可能なパラメータ値について、ほとんどの場合、仮想的な繰り返しで誤解を招く結論を与える手順に従うべきではないことを要求します。

対照的に、最尤法を使用する場合、所有しているサンプルに関心があり、ベイジアンの場合、サンプル事前分布に基づいて推論を行い、新しいデータが表示されると、ベイジアン更新を実行できます。どちらの場合も、繰り返しサンプリングのアイデアは重要ではありません。Frequentistsのみ、彼らは(で気づいたとして持っているデータに依存している@WBT)が、例えば、リコール(それはランダムなものであり、それは集団から繰り返しサンプリングのプロセスの一部として考えることであることを念頭に置いて、どのように自信間隔が定義されています)。

頻繁なケースでは、サンプリングを繰り返すという考え方により、不確実性を(統計で)定量化し、現実の出来事を確率の観点から解釈することができます。


サイドノートとして、Neyman(Lehmann、1988)もPearson(Mayo、1992)も、私たちが想像できるほど純粋な頻度主義者ではなかったことに注意してください。たとえば、Neyman(1977)は、ポイント推定に経験的ベイジアンおよび最尤法を使用することを提案しています。一方(Mayo、1992)、

ピアソン(1955)のフィッシャー(および彼の研究の他の場所)への応答では、ピアソンは科学的文脈において、低長期エラー確率の理論的根拠の両方を拒否している[...]

したがって、建国の父の間でさえ純粋な頻繁主義者を見つけることは難しいようです。


ネイマン、J、およびピアソン、ES(1933)。統計的仮説の最も効率的なテストの問題について。王立協会の哲学的取引A:数理、物理、工学科学。231(694–706):289–337。

ネイマン、J。(1937)。古典的確率理論に基づく統計的推定理論の概要。フィル トランス R. Soc。ロンド。A. 236:333–380。

ネイマン、J。(1977)。頻度の確率と頻度の統計。合成、36(1)、97-131。

メイヨー、DG(1992)。ピアソンは、ネイマン・ピアソンの統計学の哲学を拒否しましたか?合成、90(2)、233-262。

Cox、DRおよびHinkley、DV(1974)。理論統計。チャップマンとホール。

リーマン、E。(1988)。Jerzy Neyman、 1894-1981。テクニカルレポートNo.155。カリフォルニア州立大学統計学部。


1
+1(数日前)。これを書いてくれてありがとう、ここにはいくつかの良い引用があり、参考文献のリストは非常に便利です。順番に、私は今、いくつかの場所で私の答えを更新しましたが、ほとんどの場合、最後に、P周波数とS周波数の関係をわかりやすいように明確にしました。ここであなたが主張しているように、歴史的にS-freqはP-freqのアイデアの上に構築されたことに確かに同意しますが、それらは必ずしも互いに伴うとは思いません。
アメーバは、モニカーを復活させる

4

この質問と現在の非常に実用的な重要性の問題であるPrecision Medicine とを結び付けた答えを提供します。同時に、質問されたとおりに文字通り答えます。

頻繁な人とは、[1](私を強調する)などのことを言う人のことです。

次の10年以内のイベントの10%のリスクは、それが生成された個人にとって何を意味しますか?考えられていることに反して、このリスクレベルは個人のリスクではありません。なぜなら、個々の状況では確率は意味がないからです。

したがって、頻繁な専門家は、「確率」を、個々の患者のような特異な文脈では意味を持たないように解釈します。[1] に対する私のPubMed Commonsのコメントは、個々の患者のケアに適用される確率のような概念の類似性を回復するために、その頻繁な著者が受けなければならないゆがみを調べています。彼らがこれをどのように、そしてなぜ行うかを観察することは、誰が頻度主義者であるかに関して非常に有益であるとわかるかもしれません。また、JAMAのレターセクション[2,3] のほとんど照明の後続の交換は、確率の頻繁な概念の制限を明示的に認識し、それらを直接攻撃することの重要性について有益です。など。(多くのCVユーザーが[1]がペイウォールの背後にあることに気付くかもしれません。)

L.ジョナサンコーエンによる優れた読みやすい本[4] は、OPの質問に興味がある人の努力を報います。注目すべきことに、コーエンの本は奇妙なことに「確率は個々の文脈では意味がない」という主張に関連して[1]によって引用されましたが、コーエンはこの見解を次のようにはっきりと非難します[4、p49]:

また、すべての重要な確率が実際に一般的であり、特異ではないと主張することは、周波数理論家に開かれていません。自分の子供の虫垂切除の成功確率を計算できることは、しばしば非常に重要に思えます...


1]スナイダーマンAD、ダゴスティーノSr RB、ペンシナMJ。「予測分析の時代における医師の役割。」JAMA 314、no。1(2015年7月7日):25–26。doi:10.1001 / jama.2015.6177。PubMed

2]ヴァンカルスターB、シュタイアーバーグEW、およびハレルFH。「個人のリスク予測。」JAMA 314、no。17(2015年11月3日):1875〜1875。doi:10.1001 / jama.2015.12215 全文

3]スナイダーマンAD、ダゴスティーノSr RB、およびペンシナMJ。「個人のリスク予測—回答。」JAMA 314、no。17(2015年11月3日):1875–76。doi:10.1001 / jama.2015.12221。全文

4]コーエン、L。ジョナサン。帰納と確率の哲学の紹介。オックスフォード:ニューヨーク:Clarendon Press; オックスフォード大学出版局、1989年。スキャンされたページ46-53および81-83へのリンク


1
2]オンラインで利用可能です:lirias.kuleuven.be/bitstream/123456789/513795/1/...
ティム

「リスクは、病気や出来事の発生を「信じる」または「賭ける準備をする」主観的なレベルと考えることができ、2は将来の1回限りの出来事に賭けるのと同じです」スポーツのゲームで」。ご意見をお寄せいただきありがとうございます。
ティム

2
良い答えのように見えますが、私は少し混乱しています。理論的には、無限の回数実行される可能性のある手順(実験)に頻繁に関心があると思います。彼らが次のコイントスについて予測できないということではなく、彼らの懸念/保証がプロセスに集中しているというだけです。確かに、彼らは「米国は今年のワールドカップで優勝する」ということについては何も言えないが、子供の虫垂切除については何も言えないと言うだろう。子供はそうではありません。
ウェイン

@Tim、[2]と[3]の両方を含むリンクに感謝します。それに応じて回答のテキストを更新しました。
デビッドC.ノリス

2
@ウェイン、アメーバの答えは、「確率の頻度ビュー」に通常関連付けられている統計手順その頻度ビュー自体との違いにより、あなたのコメントに答えることをお勧めします。人々は頻繁な統計的手順を使用するかもしれませんが、基準または主観的な方法で結果の確率を解釈して使用するかもしれません。これが正しいことを確認するには、P値を「帰無仮説が真である確率」として解釈する際の永続的なエラーを調べるだけです。
デビッドC.ノリス

3

XKCDCC-BY-NC 2.5に基づく)の「Frequentists vs. Bayesians」 、クリックして議論します:

「探偵! もしベイジアン統計学者が彼に尋ねたらどうでしょう-[ロール] '私はラビリンスガードではなくニュートリノ検出器です。 真剣に、あなたの脳は倒れましたか?」 [ロール] '...はい。'

ここに示されている頻度主義哲学の一般的なポイントは、物事がどうあるべきかについての事前に考えられた概念でその推定プロセスを「汚染する」ことなく、観察されたデータのみに基づいて(「純粋に」)イベントの相対的な可能性について結論を出すという信念ですあってはなりません。確率推定値を提示する際に、経験的尤度の計算をサポートするために利用可能な観測がある場合、頻度論者はイベントの尤度に関する事前の信念を考慮しません。頻度の高い人は、アクションまたは結論のしきい値を決定するときに、この背景情報を考慮する必要があります。

以下のようDikran有袋類は簡潔に書いた以下のコメント、ヌル儀式「漫画は(おそらく意図せずに)なり、貴重なポイントは、科学が実際に、より複雑であり、我々は単に適用できないということです『』事前の知識について考えなくて。」

別の例として、Facebookでどのようなトピックが「傾向がある」かを判断/宣言しようとすると、頻繁にFacebookがシフトしているより純粋なアルゴリズムのカウント方法を従業員が歓迎する可能性が高くなります。どのトピックが「重要」であると考えているかについての独自の背景の視点。


10
-1。私はXKCDが大好きですが、コメントなしでは、このスレッドで誤解を招く恐れがあるだけです。そして、この漫画に関連する問題が何であるかを正確に説明するには、かなりのコメントが必要です。適切な議論を提供する場合、私は下票を削除します。
アメーバは、モニカーを復活させる

4
頻出主義者のアプローチが事前に決められた概念を持たないことは真実ではありません。それらは統計的有意性の閾値にエンコードされます。ISTRは、実験の性質に応じて、これについてFisherからの良い引用があります。これは漫画の常連客の問題であり、問​​題に関する「事前知識」を考慮していないため、適切な値を設定していないだけです(太陽が新星に行く可能性は極めて低い)。それに応じてテストを調整しました。常に 95%を使用することは、非常に批判的な「ヌルの儀式」の一部です。α
ディクランマースピアル

4
「ヌルの儀式」は、頻繁な統計の不適切な適用ですが、それ自体が頻度主義の問題ではありません。
ディクランマースピアル

2
@Dikranあなたのコメントは(間違って)「Frequentist」と「NHSTのユーザー」を同一視しているようです。それは私が心配していた種類の混乱です。
whuber

3
FWIW @luchonacho XKCD漫画の議論はここにありstats.stackexchange.com/questions/43339/...漫画は(おそらく意図せずに)なり、貴重なポイントは、科学が実際に、より複雑であり、我々は単に「ヌルを適用することができないということです事前の知識を考えずに儀式」。
ディクラン有袋類

3

(発言、質問とサイトにのみ接線的に関連します。)

確率は、個々の物事の客観的な状態に関するものです。物事には意図はなく、宇宙からステータスを受け取ります。モノでは、イベント(ステータスを与える)は常に発生します。イベントは、実際にはまだ発生していなくても、すでに達成されています。

ここでも、確率、と実際のイベント-まだ発生していないか持つ、重要ではありません- である [とは対照的に、既に存在意義決してありませんが]。そして、それ自体はすでに不要で不必要です。事実は破棄されるべきであり、その無効化は「イベントが発生する可能性が高い」と呼ばれるものです。物についての事実は、それ自体でその原始的な説得力のない側面、または事実の可能性(実際に発生した事実でさえ、不信のピンプリックによってそれを認識します)負います。私たちは必然的にある程度前心理的に「退屈」しています。したがって、数字が必要な場合、事実性の部分的な否定を定量化することだけが残っています。定量化する1つの方法は、カウントすることです。もう1つは計量することです。頻繁な人は、彼の前にある一連の試行を実行または想像します。彼は、イベントが実際に起こるかどうかを見るために顔をひっくり返します。彼は数えます。ベイジアンは、彼をふるいにかける一連の心理的動機を考慮し、彼はそれをスクリーニングします。彼は物としてそれらを量ります。両方の男性は、チャージ/言い訳ゲームで忙しいです。基本的に、それらの間に大きな違いはありません。

可能性は、私の世界の可能性についてです。可能性は常に私のものです(雨の可能性は傘を取るか、濡れるのを選ぶ私の問題です)、そして物体(私は可能または可能性があると私が考えているもの)ではなく、私のための全世界に関係しています。可能性は常に50/50であり、常に説得力を持っています。物事自体には意図がなく、可能性もありません。これらの可能性を、「確率論的決定論」の確率と混同しないでください。確率が人間の意味で「主観的」になることはありません。


注意深く見る読者は、@ amoebaが考えていると言っているこのスレッドの明るい答えを、マスクされた掘り出し物であると感じるかもしれません"there are almost no frequentists of the [probability definition] kind (P-frequentists)"。逆になっている可能性があります:ベイズ確率定義者は異なるクラスとして存在しません。なぜなら、私が認めたように、ベイジアンは現実の変化を頻繁に行う人と同じように-一連の事実として考えているからです。これらの事実だけが実験ではなく、「真実」と「議論」のより早い回想です。しかし、そのような形式の知識は事実であり、数えられるか、重さを量るだけです。それが立てる確率主観的、つまり人間の期待がない限り、予測的(「ベイジアン」)として合成されません。(可能性)干渉するシーンに入ります。そして、@ amoebaは「コインがすり減り、太陽が超新星になる」と想像するとき、心配そうにそれを入れます。


0

ああ、私は何年もの間フリークエンシーをしており、
耳でデータを演奏することに全時間を費やしましたが、
今では素晴らしい店でベイズと一緒に戻っています、
そして私はこれ以上フリークエンシーを演奏することはありません。

それは、決していやだ、いやいや、これ以上、
私は頻繁に演奏するだろう、決してない、これ以上ない!

私は以前コンサルティングをしていた研究室に入りました。
私にいくつかのデータを与え、「私たちのためにそれを」
と言った、私は少し笑顔で「ノーウェイ、ホセ」と言った、
P値と明白なだけで和解しないでください!

コーラス

私は光を当てる必要があるのはあなたの前だと言った、
そして研究者の目は喜んで大きく開いた、と
彼は言った、「私の前の見解は他のものと同じくらい良い、
そして確かにベイズ因子が最もうまくいくものだ!」

コーラス

私は先生に戻って、私がやったことを告白し、
彼らの放dig息子
を許してくれるように頼みます、しかし、彼らが私を許したとき、以前のように、
私はこれ以上頻繁に演奏することはありません!

コーラス

そして、それはいや、いや、決していや、いや
、これ以上ない、私は頻繁に演奏する、いや、いや、これ以上ない!

出典:AEラフテリー、ベイズソングブックで、で、BPカーリンが編集 http://www.biostat.umn.edu/。「Wild Rover」の伝統的な民toに合わせて歌われる。Open University M347数学統計、ユニット9で引用。


2
これはここに投稿する必要があります:stats.stackexchange.com/questions/1337/statistics-jokes
ティム

@Timと-1に同意します。これが現在の議論にどのように追加されるかわかりません。
アメーバは、モニカを復活させる
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.