素粒子物理学で証拠を受け入れるための「


33

ニュースレポートによると、CERN は明日、ヒッグス粒子が5つの証拠で実験的に検出されたことを発表すると発表しています。その記事によると:σ

5は、CMSおよびATLAS検出器が見ているデータがランダムノイズではない99.99994%の可能性に相当します。5は、何かが科学的な「発見」と正式にラベル付けされるために必要な確実性です。σσσ

これは、超厳格ではありませんが、物理学者は、統計的な手法を「仮説検定」の設定標準を使用することを言っているようだにに、その対応(2がテイル)?それとも他の意味がありますか?0.0000006 Z = 5α0.0000006z=5

もちろん、科学の多くでは、アルファを0.05に設定することは日常的に行われています。これは "two- "の証拠に相当しますが、それが呼ばれたことは聞いたことがないです。アルファのより厳密な定義が標準である他のフィールド(粒子物理学以外)はありますか?5ルールが粒子物理学でどのように受け入れられたのかについてのリファレンスを知っている人はいますか?σσσ

更新:簡単な理由でこの質問をしています。私の本の直観的生物統計学(ほとんどの統計の本のように)には、通常の「P <0.05」ルールがいかにarbitrary 意的であるかを説明するセクションがあります。私は科学的分野のこの例を追加したいと思います。そこでは、はるかに(ずっと!)小さい値が必要と考えられています。しかし、例が実際にはより複雑で、ベイジアンメソッドを使用している場合(以下のコメントが示唆するように)、それはまったく適切ではないか、より多くの説明が必要になります。α


2
「シックスシグマ」のことを聞いたことがありますか?
ダニエルRヒックス

品質管理では、ダニエルが彼の質問/発言で示唆しているように、6シグマが考慮されます。これらの棄却確率はすべて、正規分布からのサンプリングを前提としているため、他の分布ではテール確率が大きくなる可能性があります。5または6シグマのような極端な値を使用することは、特別な状況でのみ有用です。実際には、データのサンプルサイズと変動性により、2または3シグマを超える推論が実行不可能になります。
マイケルR.チャーニック

1
基本的に、ほとんどの素粒子物理学者は、パラメータを計算するときにベイジアンの考え方に慣れているので、実際には「データと事前確率が与えられれば、ヒッグスの信号がゼロではないことを確信している」ということは確かに異なります「信号がランダムノイズである可能性は0.01パーセント」にすぎません(システマティクスから生じる非ランダムな変動もあります!)。[1]:physics.stackexchange.com/questions/8752/…–X
ネスター

3
@ネストル:私は現在ヒッグス記者会見の生放送を見ていますが、ベイジアンの解釈について言及している人はいません。「p値」と「有意水準」が使用されますが、恐ろしく誤って通知されたベイジアンのみが、それらを信号がランダムノイズである確率として解釈します。OPの質問の引用のテキストは、p値が実際に何であるかを誤って解釈しているだけだと思います。
MånsT

1
ところで私はこの問題について私のブログにブログ投稿をしました:randomastronomy.wordpress.com
ネストール

回答:


13

統計のほとんどのアプリケーションでは、「すべてのモデルが間違っているが、一部は有用である」という古い栗があります。この場合、単純なモデルを使用して信じられないほど複雑なプロセスを説明しているため、特定のレベルでのみモデルが実行されると予想されます。

物理学は非常に異なるため、統計モデルから開発された直感はそれほど適切ではありません。物理学、特に基本的な物理法則に直接対処する素粒子物理学では、モデルは実際に現実の正確な記述であると想定されています。モデルが予測するものからの逸脱は、モデルの制限ではなく、実験ノイズによって完全に説明する必要があります。これは、モデルが適切で正確であり、実験装置が理解している場合、統計的有意性非常に高く、したがって設定される高いバーであるべきであることを意味します。

もう1つの理由は歴史的なもので、粒子物理学のコミュニティは過去に低い発見レベルの「発見」によって後から撤回されて燃え上がってきたため、現在は一般的により慎重になっています。


1
物理学では、アルファが非常に低い標準的な統計的仮説検定を使用していることに同意しますか(この場合、とにかく)。または、Nestorが上記のコメントで述べたように、彼らはある種のベイジアンアプローチを使用していますか?
ハーベイモトゥルスキー

2
ATLASに携わっている私が知っている人々の何人かと話すことからの私の理解は、分析はすべて非常にベイジアンであるということです。しかし、彼らは低レベルの人(つまり、実際に仕事をする人)です。チェーンの上の話者の一部が解釈をより良く把握していても、私は驚かないでしょう。そうは言っても、LHCの結果の表示は非常に貧弱で、他の人が指摘しているように、実際には非常にベイジアンとして出会ったわけではありません。
Bogdanovist

2
特に素粒子物理学は数十億のイベントも扱っていると常に思っていたので、バーを非常に高く設定する必要があります。
ウェイン

11

歴史と起源

ロバート・Dカズンズによる1とトンマーゾDorigo 2、の起源5つのσの 60年代の初期の素粒子物理学の作業における閾値原点嘘散乱実験の数々のヒストグラムを調べたときに、いくつかの新たに発見された粒子を示している可能性があり、ピーク/バンプで検索しました。しきい値は、行われている複数の比較を考慮するための大まかな規則です。125σ

どちらの著者は、ローゼンフェルドから1968年の記事を参照してください3のためのいくつかの中間子とバリオンから遠いがあるかどうかを問い、取り扱わ、4 σの測定効果。この記事は、公開されたクレームの数が統計的に予想される変動の数に対応すると主張することにより、質問に否定的に答えました。記事はの使用促進し、この引数サポートするいくつかの計算と一緒に5 σのレベルを:34σ5σ

ローゼンフェルドは:私たちはこれまでアウトマススペクトルバンプが報告されている調査にに行く前に」 Kππ3/2πρ私たちは、最初に私が欲しい1968年でどのような需要に意義の閾値を決定する必要があります実験家は、おそらく注意しなければならないが、お見せすることがあること3σ効果-を、理論家とphenomenologistsは効果が到達するまで待つ方が良いだろう>4σ。」

論文の後半(強調は私のものです)

4σ3σ5σ

TommasoはRosenfeldの記事から始まったことを述べることに注意しているようです

Tommaso:「ただし、この記事は1968年に書かれたものですが、発見クレームの5つの標準偏差という厳密な基準は70年代と80年代に採用されていませんでした。たとえば、5シグマ基準などは使用されていません1984年にルビアとファンデルメアがノーベル物理学賞を受賞したWボゾンとZボソンの発見に対して。

5σ4

シュナイダーは:「よく、95%または99%の『信頼のレベルは、』明らかに矛盾したデータのために引用されているが、2つまたは3統計シグマにこの金額。私が教えられた5個のシグマよりも何かを信じることはないと思う場合はその、それについては、とてつもなく厳しい要件です--- 99.9999%の信頼レベルのようなものですが、もちろん、シグマの実際のサイズはほとんど知られていないので、このような制限が使用されます。 「制御したり、知らない。」

4σ5σ5

フランクリン:2003年までに、「の観測」の5つの標準偏差基準が有効になったようです。

...

BaBarコラボレーションのメンバーは、この頃、フィジカルレビューレターの編集者によって5シグマ基準がガイドラインとして発行されたことを思い出します。


現代の使用

5σ67

Z=55σ2.87×107

5σ

  • 5σ3σ4σ

  • 5σ

  • σσσ6σ

  • 5σ

5σ8912


その他の分野

他の多くの科学分野が同様のしきい値を持たないか、どういうわけかこの問題に対処しないことに注意するのは興味深いことです。.05または.01の有意性を与えた実験を拡張することは非常にコストがかかる(または不可能)人間との実験の場合、これは少し理にかなっていると思います。

1011


  1. カズンズ、RD(2017)。ジェフリーズ–リンドリーのパラドックスと高エネルギー物理学における発見基準。合成、194(2)、395-432。arxivリンク

  2. ドリゴ・T.(2013)science20.comからのDefinitelying The Five-Sigma Criterion、2019-03-07

  3. ローゼンフェルド、AH(1968)。遠い中間子やバリオンはありますか?ウェブソース:奨学金

  4. Burbidge、G.、Roberts、M.、Schneider、S.、Sharp、N.、&Tifft、W.(1990、November)。パネルディスカッション:Redshiftに関連する問題。NASA Conference Publication(Vol。3098、p。462)で。harvard.eduのコピーへのリンク

  5. フランクリン、A。(2013)。変化する標準:20世紀の素粒子物理学の実験。ピッツバーグ大学出版局。

  6. 5シグマとはどういう意味ですか?physics.orgから2019-03-07

  7. Beringer、J.、Arguin、JF、Barnett、RM、Copic、K.、Dahl、O.、Groom、DE、...&Yao、WM(2012)。素粒子物理学のレビュー。フィジカルレビューD-粒子、フィールズ、重力と宇宙論、86(1)、010001.(セクション36.2.2。有意性検定、394ページ、リンクaps.org

  8. ライオンズ、L。(2013)。5シグマの重要性の発見。arXivプレプリントarXiv:1310.1284。arxivリンク

  9. ライオンズ、L。(2014)。新しい物理学の検索における統計的問題。arXiv preprint arxiv link

  10. ベイカー、M。(2015)。心理学研究の半分以上が再現性テストに失敗しています。自然ニュース。nature.comから2019-03-07

  11. Horton、R.(2015)。オフライン:薬の5シグマとは?The Lancet、385(9976)、1380. from thelancet.com 2019-03-07


4

物理学の理由とはまったく異なる理由で、仮説のテストに従事するとき、はるかに厳密なアルファを持つ他のフィールドがあります。特に、「GWAS」(ゲノムワイド関連研究)を使用して疾患のさまざまな遺伝子マーカーを調べる場合、遺伝疫学がその中に含まれます。

GWASの研究は、複数の仮説のテストにおける大規模な演習であるため、最先端の分析手法はすべて、0.05よりもはるかに厳密なアルファに基づいて構築されています。ゲノミクス研究に続いて行われる他のそのような「候補スクリーニング」研究技術は、おそらく同じことをするでしょう。


2
α

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.