ジョージ・ボックス、ガリット・シュムエリと科学的方法について?


16

(この質問はPhilosophy SEにより適しているように思われるかもしれません。統計学者がBoxとShmueliの発言についての私の誤解を明確にすることを望んでいます。したがって、ここに投稿します)。

(ARIMAの名声の)ジョージボックスは次のように述べています。

「すべてのモデルは間違っていますが、一部は有用です。」

Galit Shmueliは有名な論文「説明するか予測する」で次のように主張しています(そして彼女に同意する他の人を引用しています)。

説明と予測は同じではなく、一部のモデルは予測が上手ではありませんが、上手く説明できます。

原則に対するこれらは何らかの形で矛盾していると感じます。

モデルがうまく予測できない場合、それは有用ですか?

さらに重要なことは、モデルが十分に説明している場合(ただし、必ずしも十分に予測できるとは限らない場合)、何らかの方法で真でなければなりません(つまり、間違っていない)。それでは、Boxの「すべてのモデルが間違っている」とどのようにメッシュするのでしょうか。

最後に、モデルがうまく説明しているが、うまく予測できない場合、それはどのように科学的ですか?ほとんどの科学的境界基準(検証主義、改ざん主義など)は、科学的記述に予測力が必要であること、または口語的であることを意味します。将来の結果を予測する必要があります。

私の質問:

  • Boxの声明とShmueliのアイデアは本当に矛盾していますか、それとも何かが欠けていますか。たとえば、予測力のないモデルはまだ有用でしょうか。
  • ボックスとShmueliの文がある場合ではない矛盾し、それはモデルが間違っているために何を意味するのでしょうし、うまく予測できないが、それでも説明力を持っていますか?別の言い方をすれば、正確さと予測能力の両方を奪うと、モデルには何が残りますか?

モデルに説明力があるが予測力がない場合、どのような実証的検証が可能ですか?Shmueliは、説明にAICを使用し、予測にBICを使用するなどのことを言及していますが、それが問題をどのように解決するかわかりません。予測モデルでは、AIC、またはBIC、またはR2またはL1正則化などを使用できますが、最終的にはサンプルテストと実稼働環境でのパフォーマンスがモデルの品質を決定します。しかし、うまく説明できるモデルについては、どのような損失関数がモデルを本当に評価できるのかわかりません。科学哲学には、過少決定の概念がありますこれはここで適切と思われます:与えられたデータセットについて、データに適合するようにいつでも何らかの分布(または分布の混合)と損失関数Lを賢明に選択できます(したがって、それを説明すると主張できます)。また、閾値は、そのLモデルが適切にデータを任意で説明することを主張する人のための下でなければならない(種類p値などから、なぜそれはp<0.05としないp<0.1又はp<0.01?)。

  • 上記に基づいて、どのように説明するモデルを客観的に検証できますか?


3
彼女のためにこれまで通り私は、Shmueliを覚えることができるよう十分に説明する一方で、機能的なフォーム権を取得するための手段を(それはその関数形式のパラメータに来るとき、おそらく巨大な推定imprecissionを持っている)だけでなく予測するバイアス・分散トレードオフを得るための手段を正しい(推定精度を高めるために、関数形式で妥協する)。また、ここで哲学的なタグが役に立つかもしれません。
リチャードハーディ

1
「または」が排他的である必要はないと思います。単純さと統一は、等しい予測値の理論の論争の余地のない選択基準であり、もしそうなら、それらの精度を犠牲にすることは多くの文脈で正当化されるでしょう。Boxのモットーは科学の異なる見方を反映しており、例えば、ヴァンフラッセンの科学的イメージ(およびカントに戻る)で進歩しました。大まかな妥当性は多くのタスクに十分な場合があり、「1つの正しいモデル」は素朴な考えかもしれません。
6:14のConifold

2
@Conifold実際、Richard Levinsの複雑な因果システムのループ分析(統計的方法ではなく、統計的予測に直接関連するアプリケーションもあります)は、モデルのリアリズム(変数とそれらの間の関係)と一般性を優先して、ほぼすべての精度を犠牲にします(同じ因果構造を共有するすべての変数に対するモデルの分析結果の適用可能性)。Levins、R.(1966)を参照してください。人口生物学におけるモデル構築の戦略アメリカの科学者、54(4)、421–431。
アレクシス

(+1。私はまだここに答えを投稿する時間を見つけたいと思っています...)
amoebaは

回答:


9

「すべてのモデルは間違っていますが、一部のモデルは有用です」というジョージボックスの簡潔な引用から始めましょう。この声明は、「実証主義」の方法論的アプローチのカプセル化であり、これは科学において非常に影響力のある哲学的アプローチです。このアプローチは、フリードマンの古典的な方法論的エッセイ(1966)で(経済理論の文脈で)詳細に説明されています。そのエッセイでは、フリードマンは、有用な科学理論は必ず現実の単純化を構成するため、その仮定は常に現実からある程度逸脱しなければならず、現実から実質的に逸脱することさえあると主張しています。世界の複雑さを管理可能な一連の原則に減らし、現実についての予測を正確に行い、現実について新しいテスト可能な仮説を生成すること。したがって、フリードマンは、すべてのモデルが現実を単純化する(したがって、逸脱する)仮定を含む限り「すべてのモデルが間違っている」と主張しますが、現実について有用な予測を行うための単純なフレームワークを提供する限り、「一部は有用です」と主張します。

今、Box(1976)(彼が最初に「すべてのモデルが間違っている」と述べている論文を読むと、彼はフリードマンを引用しておらず、方法論的実証主義についても言及していないことがわかります。それにもかかわらず、科学的方法とその特徴に関する彼の説明は、フリードマンによって開発されたものに極めて近い。特に、両方の著者は、科学理論が観察された事実に対してテストできる現実についての予測を行い、予測の誤差が理論の修正の基礎として使用できることを強調します。

次に、ShmueliでGalit Shmueliが議論した二分法(2001)について説明します。この論文では、Shmueliは観察された結果の因果的説明と予測を比較し、これらが異なる活動であると主張します。具体的には、彼女は、因果関係は測定可能な結果に直接現れない基礎となる構造に基づいているため、「測定可能なデータは基礎となる構造の正確な表現ではない」と主張します。したがって、彼女は、結果の測定可能な反事実上の違いに現れない、観察不可能な根本的な因果関係について推論することを含む統計分析の側面が​​あると主張します。

私が何かを誤解していない限り、この考えは、Boxの引用で表されているように、BoxとFriedmanの実証主義的な見解と緊張していると言ってもいいと思います。実証主義者の視点は、本質的に、測定可能な結果に現れるものを超える容認できる形而上学的な「構築物」は存在しないと言っています。ポジティブ主義は、観測可能なデータと、このデータに基づいて構築された概念の検討に限定されます。先験的な考慮を除外する形而上学的概念。したがって、実証主義者は、因果関係の概念は実際に測定可能な結果の観点から定義されている範囲でのみ有効であると主張するだろう---それがこれとは異なるものとして定義される範囲で(シュムエリがそれを扱うように)、これは形而上学的推測とみなされ、科学的言説では容認できないものとして扱われます。

だから私はあなたが正しいと思う---これらの2つのアプローチは本質的に矛盾している。Boxが使用する実証主義的アプローチは、有効な科学的概念は現実の兆候に完全に根ざしていると主張しますが、Shmueliが使用する代替的アプローチは、重要な科学的概念(説明したい)実際に測定可能な結果に関連付けて「運用」されている場合は、完全に表現されます。


丁度!!!シュムエリは、科学的陳述が何であるかについてのほとんどの実証主義者(および偽造主義者)の定義と矛盾しているようであり、彼女の意図が本当にそのような大胆な哲学的陳述をすることなのか疑問に思っていますか?または、統計学者としての彼女が、彼女の声明がどれほど大胆であることを知らないのか?
スカンダーH.-モニカの復職


1
実証主義とプラグマティズムは反現実主義的特徴を共有しているが、Boxのアプローチは後者であり、実証主義は少なくとも1960年代後半から科学に影響を与えていない。これが、Boxがフリードマンや他の実証主義者に言及していない理由です。プラグマティズムは、観測可能なデータに限定されることはなく、先験的な概念や形而上学的な構成に問題はありません。それは単に「現実」に近づいているとは見なしていないため、一意に「正しい」機能を目指しているため、複数で、タスクに依存し、修正可能です。因果関係はそのような構造であるため、BoxとShmueliの間に矛盾はありません。
21:37のConifold

Boxがプラグマティストであったかどうかにかかわらず、彼がここで与える特定の引用は、私の見解では、プラグマティズムよりも実証主義を助長するものです。後者の哲学は形而上学の多元的な見方をしている。それは現実を概念化する複数の一貫した方法があり、これらすべてが現実の有用な概念化であるという意味で「真実」であると考える。したがって、実証主義は「すべてのモデルが間違っているが、いくつかは有用である」と言うだろうが、プラグマティズムの格言は「多くのモデルが正しいので、有用だから」に近いだろう。
モニカを

真の有用性の識別は、プラグマティズムについての民俗的な誤解にすぎません。すべてのモデルが間違っているのは、「正しい」ことは、対応するものがあることを示唆しているためであり、実用主義者はそれを否定しているからです。そして、「モデルは目的を果たす限り正しい」という寛容の原則は、論理的実証主義の父であるカーナップによるものです。
08のConifold

4

モデルは、物事を説明するために使用される場合、現実を単純化したものです。単純化は、「何らかの便利な方法で間違っている」ことの単なる別の言葉です。たとえば、数値3.1415926535898を3.14に丸めるとエラーになりますが、このエラーにより、人間はその数値の最も重要な部分に集中できます。これは、モデルが説明に使用される方法であり、いくつかの問題に関する洞察を提供しますが、必然的に他の多くのものか​​ら抽象化する必要があります。主に予測を重視する場合は、可能な限りこれらの何千ものものを含めますが、トレードオフを説明することは異なります。


1
π

1
なかむら 「エレガントで直感的なグラフ」が工学的応用、または新しい理論の開発を促進する限り、その価値は純粋に主観的または非科学的ではなく、実用的です。統一、説明力、シンプルさ、一貫性は、美観ではなく認識論的価値として広く認められています。ローレンツのエーテル理論と特別な相対性理論の間の選択は、まさにそのような考察に基づいてなされた、それらは予測的に同等である。
コニフォールド

3

予測には優れているが、何も説明していないモデルの例は、Wikipediaの記事「すべてのモデルが間違っています」に記載されています。例は、重力のニュートンのモデルです。ニュートンのモデルは、ほとんどの場合、経験的観測と区別できない予測を提供します。しかし、このモデルは非常に信じがたいものです。それは、任意の大きな距離にわたって瞬時に作用できる力を仮定しているためです。

ニュートンのモデルは、アインシュタインの一般相対性理論で与えられたモデルに取って代わられました。一般相対性理論では、重力は有限の速度(光の速度)で空間を移動します。

ニュートンのモデルは、一般相対論モデルの単純化ではありません。それを説明するために、木から落ちてくるリンゴを考えてみましょう。一般相対性理論によると、地球はリンゴに力を加えることなくリンゴは落下します。(リンゴが落ちる主な理由は、地球が時間をゆがめるため、木の根元近くの時計が木の上の時計より遅くなるためです。)したがって、ウィキペディアの記事にあるように、ニュートンのモデルは完全に説明から間違っています視点。

Shmueli [2010]の論文は、モデルには予測と説明という2つの目的があると仮定しています。実際、いくつかの著者は、3つの目的があると述べています(例えば、Konishi&Kitagawa [ Information Criteria and Statistical Modeling、2008:§1.1]およびFriendly&Meyer [ Discrete Data Analysis、2016:§11.6]を参照)。3つの目的は、3種類の論理的推論に対応しています。

  • 予測(控除に対応);
  • パラメータ推定(誘導に対応);
  • 構造の説明(a致に対応)。

ニュートンの重力のモデルは「何も説明しない」と言うのは、率直に言って馬鹿げている。-1。
アメーバは、モニカを

アメーバ、ニュートンのモデルは、一般相対性理論が正確であるという仮定の下で、重力がどのように働くかについて何も説明しません。リンゴが落ちた場合、ニュートンのモデルは地球がリンゴに力を及ぼし、その仮説は完全に間違っていると仮定します。私の答えをさらに検討するようお願いします。それでも理解できない場合は、不明な点を教えてください。
SolidPhase

あなたの言うことは非常に明確ですが、私は強く反対します。
アメーバは、モニカを

アメーバ、私はあなたが同意しない理由を説明するようお願いします。あなたには理由がありますか?(回答に余分な文を追加したことに注意してください。)
SolidPhase

ありがとう。あなたが言及した参考文献を調べます。説明しなくてもモデルがどのように予測できるかを理解しています。私が得ていないのは反対の方向です:モデルは予測せずにどのように説明できますか?ニュートン対アインシュタインの例は、すべてをさらに混乱させます。アインシュタインの理論がニュートンの理論に取って代わった理由は、それがより良く予測されたためです。別の方法で見てください:競合する説明モデルがある場合、どの予測モデルが最も予測力があるかをテストしない限り、どのように評価できますか?
スカンダーH.-モニカを

1

私は統計学の学部生なので、自分を専門家とは呼びませんが、ここに私の2セントを示します。

モデルは自分自身を説明しません。人間はそれらを解釈します。線形モデルは、決定方法に近いため、ニューラルネットワークやランダムフォレストよりも理解しやすいです。実際、ANNは人間の脳を模倣しますが、一連の行列乗算を実行して明日どのレストランに行くかを決めません。代わりに、重要度によって心のいくつかの要因に重みを付けます。これは基本的に線形の組み合わせです。

「説明力」は、モデルが人間の直感とうまく調和するかどうかを測定します。一方、「予測力」は、モデルが関心のあるプロセスの根底にあるメカニズムとどれだけうまく整合するかを測定します。それらの間の矛盾は、本質的には、世界が何であるかと、私たちがそれを知覚/理解する方法との間のギャップです。これが、「予測が下手なのに、一部のモデルは説明が上手くできる」理由を説明してくれることを願っています。

イアン・スチュワートはかつて、「私たちの脳が私たちがそれらを理解するのに十分に単純だったなら、私たちは不可能だったほど単純だろう」と言った。残念ながら、私たちの小さな人間の脳は、実際には宇宙や、株式市場(多くの脳を含む:)と比べて非常に単純です。これまでは、すべてのモデルは人間の脳の産物であるため、多かれ少なかれ不正確でなければならず、それがBoxの「すべてのモデルが間違っている」ことにつながります。一方、モデルは有用であるために技術的に正確である必要はありません。たとえば、ニュートンの運動の法則はアインシュタインによって反証されていますが、オブジェクトがとてつもなく大きくも高速でもない場合に有用です。

あなたの質問に対処するために、私は正直に、BoxとShmueliのポイントの間の非互換性を見ることはできません。「説明力」と「予測力」は二項特性であると考えているようですが、それらはスペクトルの両端に位置すると思います。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.