すべてのモデルは役に立ちませんか?正確なモデルは可能ですか?または有用ですか?


45

この質問は、1か月以上にわたって私の頭の中で悩まされてきました。Amstat Newsの 2015年2月号には、バークレー教授Mark van der Laanによる不正確なモデルの使用をforる記事が掲載されています。彼は、モデルを使用することで、統計は科学ではなく芸術になると述べています。彼によると、いつでも「正確なモデル」を使用でき、そうしないと「厳密性の欠如...データサイエンスにおける私たちの表現が取り残されてしまうのではないか」と心配しています。

私たちは疎外される危険にさらされていることに同意しますが、脅威は通常、おおよその方法を使用していないが、実際にはその方法がはるかに少ないと主張する人(ファンデルラーン教授のように聞こえます)慎重に適用された統計モデルよりも厳密です。

Van der Laan教授は、Boxのよく使われる引用を繰り返している人々に対して「すべてのモデルは間違っているが、一部は有用である」と軽ratherしていると言ってもいいと思います。基本的に、私がそれを読んだとき、彼はすべてのモデルが間違っていて、すべてが役に立たないと言っています。今、私はバークレーの教授に反対するだろうか?一方、私たちの分野の本当の巨人の一人の意見をそれほど軽んじて却下するのは誰ですか?

詳述すると、ファンデルラーン博士は、「すべてのモデルが間違っていると述べるのは完全にナンセンスです。たとえば、仮定を行わない統計モデルは常に正しい」と述べています。「しかし、多くの場合、私たちはそれよりもはるかに優れた結果を得ることができます。データは、独立した同一の実験の結果であることがわかります。非常に狭いランダムサンプリングまたは制御された実験設定を除いて、どのようにそれを知ることができるかわかりません。著者は、「機械学習/データ適応推定の最新技術、因果推論、打ち切りデータ、効率性、経験的経験のすべてを統合する、目標最尤学習と目標最小損失ベース学習の研究を指摘しています。正式な統計的推論を提供しながら、プロセス理論。」n

私が同意する声明もいくつかあります。彼は、私たちの仕事、統計学者としての役割、そして科学協力者を真剣に受け止める必要があると言います。聞いて聞いて!科学的な質問に答えることが適切かどうか、またはデータに適合するかどうかを慎重に検討せずに、人々が日常的にロジスティック回帰モデルなどを使用する場合、それは確かに悪いニュースです。そして、私はこのフォーラムに投稿された質問でそのような虐待の多くを見ています。しかし、パラメトリックなモデルであっても、不正確なモデルの効果的で価値のある使用法も見ています。そして、彼の言うこととは反対に、私はめったに「別のロジスティック回帰モデルによって死に退屈する」ことはありません。これが私の素朴さだと思います。

だからここに私の質問があります:

  1. まったく仮定を行わないモデルを使用して、どのような有用な統計的推論を行うことができますか?
  2. 対象の最尤法を使用した重要な実際のデータを使用したケーススタディはありますか?これらの方法は広く使用され、受け入れられていますか?
  3. すべての不正確なモデルは本当に役に立たないのですか?
  4. あなたが些細な場合以外の正確なモデルを持っていることを知ることは可能ですか?
  5. これがあまりにも意見に基づいているため、トピックから外れている場合、どこで議論できますか?ファン・デル・ラーン博士の記事は間違いなく議論が必要だからです。

13
仮定のないモデルはほとんど役に立たないと思いますが、van der Laanはそれを認めずに確実に仮定を立てています。私たちは確かに多くのことを知らないので、彼の「データはn個の独立した同一の実験の結果であることを知っているかもしれない」は実際には仮定であり、少なくとも部分的にそうです。それらが同一で独立していると考える正当な理由があるかもしれませんが、実際には、実際にはそうではないことが非常にしばしばわかります)。
-Glen_b

19
前提のないモデルは、データマトリックスの複製にすぎません。それは真実ですが、無駄な努力の重複でもあります。そのようなモデルはモデルではないと主張することもできます。モデルの定義の1つは、それが現実の単純化であるということです。したがって、単純化しないモデルは、定義ではモデルではありません。この単純化には目的があります。何が起こっているかを実質的に理解するのに役立ちます。メインストーリーを提供します。どうして物事が起こるのかを理解することを気にせず、予測したいだけなら、そのメインストーリーは無関係です。ただし、クリスタルボールを作成する以上のことをしたい人もいます。
Maarten Buis

8
仮定のないモデルはモデルではありません。モデルは仮定の集まりです。また、@ Glen_bが言うように、iidの仮定はかなり強く、「真」である例を考えることはできません。コインを繰り返し反転させる場合でも、相関関係があります(Diaconisの研究を参照)。私は記事をざっと読みましたが、近視眼的のようです。
P.ウィンドリッジ

11
火星への飛行に関する著者の最初の例は偽物です。ニュートン力学(宇宙ミッションの多くの側面に依存している)は間違ったモデルですが、私たちはそれに頼っており、有用です。
P.ウィンドリッジ

6
はい、ニュートン力学はジョージ・ボックスのポイントの良い例です。
Glen_b

回答:


15

引用された記事は、統計学者は「科学チームの本質的な部分ではなく、科学者は使用される方法に自然に疑問を抱いている」という懸念に基づいているようです。科学的な結果が発表されました。」@rvlによって提起された質問に対する私のコメントは、過去数年間にわたってベンチ研究から翻訳/臨床研究に移行するにつれて、ますます複雑な統計問題に取り組むことを余儀なくされた非統計学の生物学者の視点から来ています。質問5は、このページの複数の回答によって明確に回答されています。そこから逆順で行きます。

4)「正確なモデル」が存在するかどうかは、実際には問題ではありません。たとえ存在したとしても、研究を行う余裕はおそらくないからです。議論の文脈の中で、この問題を考えてみましょう:私たちは本当に含める必要がありますか「関連するすべての予測因子を?」私たちは「すべての関連予測因子」を識別することができたとしても、まだ組み込むために自由度を提供するのに十分なデータを収集するという問題があるだろうそれらはすべてモデルに確実に組み込まれます。レトロスペクティブ研究や集団研究はもちろん、制御された実験研究では十分に困難です。たぶん、ある種の「ビッグデータ」ではそれほど問題ではないかもしれませんが、それは私と同僚のためです。@Aksakalがそのページで答えを出したので、「それについて賢く」する必要が常にあります。

van der Laan教授に公平を期して、引用された記事では、少なくともリンクからオンラインで現在入手可能なバージョンでは、「正確」という言葉を使用していません。彼は「現実的な」モデルについて話しています。それは重要な違いです。

それから再び、van der Laan教授は「統計学は今や科学ではなく芸術である」と不平を言っています。彼が協力者と協力することを提案する方法を考えてみましょう。

...データ、統計学者としてのアイデンティティ、および科学協力者を真剣に受け止める必要があります。データがどのように生成されたかについて、可能な限り学ぶ必要があります。現実的な統計モデルを作成したら、研究者が関心のある科学的な質問に対する答えを最もよく表すものを、協力者から抽出する必要があります。これは大変な作業です。それは難しい。統計理論の合理的な理解が必要です。それは立派な学術企業です!

これらの科学的原理を実際の問題に適用するには、あらゆる科学的企業での仕事と同様に、かなりの「芸術」が必要と思われます。私は、非常に成功した科学者を何人か知っていました。私の経験では、違いは科学的目標を追求する「技術」にあるようです。結果は科学かもしれませんが、そのプロセスはもっと何かです。

3)繰り返しますが、問題の一部は用語です。「正確な」モデルと、van der Laan教授が求める「現実的な」モデルには大きな違いがあります。彼の主張は、多くの標準統計モデルが「信頼できない」結果を生成するのに十分に非現実的であるということです。特に、「正直な統計モデルで定義された推定量の推定量は、パラメトリックモデルに基づいて合理的に推定することはできません。」これらはテストの問題であり、意見ではありません。

彼の作品は、正確なモデルが常に可能であるとは限らないことを明確に認識しています。結果変数が欠落しているコンテキストでのターゲット最尤推定量(TMLE)に関するこの原稿を検討してください。それは、無作為に結果が欠落しているという仮定に基づいており、実際にはテストできない可能性があります。これは、「すべての関連する予測変数」を含めるのが難しいことの別の例です。ただし、TMLEの長所は、このコンテキストでターゲットパラメーターを推定するためのデータにおける適切なサポートの「陽性の仮定」の評価に役立つように見えることです。目標は、データの現実的なモデルに可能な限り近づけることです。

2)TMLEは以前に相互検証で議論されています。私は、実際のデータでの広範な使用を認識していません。Google Scholarは今日、最初のレポートと思われるものについて258件の引用を示しましたが、一見したところ、大規模な実世界のデータセットには何もなかったようです。関連するRパッケージの統計ソフトウェアの記事のジャーナルはわずか27 Googleニュースの引用今日を示しています。ただし、これはTMLEの価値についての証拠と見なされるべきではありません。関心のある実際の「推定値」の信頼できる不偏の推定値を取得することに焦点を当てています。これは、標準の統計モデルから導出されるプラグイン推定値の問題であることが多く、潜在的に価値があるようです。

1)「仮定を行わない統計モデルは常に真実である」という声明は、ストローマン、トートロジーとして意図されているようです。データはデータです。宇宙の法則が日々一貫していると思います。TMLEメソッドには、おそらく探索空間の凸性に関する仮定が含まれており、上記のように、特定のコンテキストでの適用には追加の仮定が必要になる場合があります。

ファン・デル・ラーン教授でさえ、いくつかの仮定が必要であることに同意するでしょう。私の感覚では、彼は仮定の数を最小限に抑え、非現実的なものを避けたいと思っています。彼が主張するように、それが本当にパラメトリックモデルをあきらめることを必要とするかどうかは、重要な問題です。


とてもいい答えです。本Targeted Learningは、さらに学ぶための良い場所です。理論に加えて、いくつかの事例研究が含まれています。
NRH

12

ポイントを逃したかもしれませんが、少し後退しなければならないと思います。

彼のポイントは、それ以上の知識がなくても簡単にアクセスできるツールの悪用だと思います。これは、単純なt検定にも当てはまります。アルゴリズムにデータを入力し、p <0.05を得て、論文が正しいと考えます。完全に間違っています。もちろん、あなたはあなたのデータについてもっと知る必要があります。

さらに後退:正確なモデル(ここでは物理学者)のようなものはありません。しかし、私たちの測定値に非常によく同意する人もいます。唯一の正確なことは数学です。それは現実やそれのモデルと関係ありません。他のすべて(および現実のすべてのモデル)は「間違っている」(頻繁に引用されているように)。

しかし、「間違っている」とはどういう意味ですか?自分で判断する:

現在のすべてのハイテク(コンピューター、ロケット、放射能など)は、これらの誤ったモデルに基づいています。「間違った」モデルでの「間違った」シミュレーションによって計算されることもあります。
->「間違った」の代わりに「有用な」ことにもっと焦点を合わせます;)

あなたの質問により明確に:

  1. わからない、ごめんなさい!
  2. はい。一例:粒子物理学では、特定の粒子(電子、陽子など)を検出する必要があります。すべての粒子は検出器(およびデータ)に特徴的なトレースを残しますが、同じ粒子であっても(その性質により)変化します。現在、ほとんどの人はこの目標を達成するために機械学習を使用しています(これは非常に単純化されましたが、これに非常によく似ています)。手作業で行う場合と比較して、効率が20%から50%向上しています
  3. 誰も本当にこれを主張していません!間違った結論を下さないでください!(a:すべてのモデルは不正確で、b:一部は有用です。混乱しないでください)
  4. 正確なモデルとしては何もありません(数学を除き実際には統計上ではありません。正確に直線上に点を持ち、それを通る線を「当てはめる」ことが正確な場合があります... 。
  5. わからない:)しかし、私見では、これは「すべての子供が使うことができるからではなく、誰もが使うべきだから」と考えており、盲目的に使いすぎないでください。

私はあなたのポイントを検討しますが、(3)と(4)では、van der Laanの記事と私の質問をご覧になることをお勧めします。 「正確なモデル」を繰り返し参照します。はい、そうです、誰かが実際に言ったと思います。モデルについてのあなたの言うことと、メソッドの機械的応用に、私はほぼ同意します。だから私はあなたが後退することを求めているのは私だとは思わない。
rvl

はい、すべてに。そして、ほとんどの場合、私は彼に確かに後退することを意味しました;)私が言及しなかったのは、理論(数学)モデルを構築するために、もちろん「正確な」モデルが必要だと思います。したがって、より優れたモデルと統計ツールを「発明」するには、決定論的(または正確な)モデルをベースとして必要です。生地をターゲットにした学習でさえ、この意味で「不正確」である必要はないと思います。
Mayou36

6

econでは、「データ生成プロセス」を理解することについて多くのことが言われています。「正確な」モデルが正確に何を意味するのかわかりませんが、econでは「正しく指定された」モデルと同じかもしれません。

確かに、モデルを試す前に、できる限りデータを生成したプロセスについて知りたいですか?困難は、a)実際のDGPについての手がかりが得られない可能性があり、b)実際のDGPをモデル化および推定するのが難しかったとしても(多くの理由で)

そのため、問題を簡素化し、推定要件を減らすための仮定を立てます。あなたの仮定が正確かどうかを知ることができますか?あなたはそれらを支持する証拠を得ることができますが、IMOはいくつかの場合に本当に確信するのは難しいです。

確立された理論と実用性の両方の観点から、これらすべてをフィルタリングする必要があります。理論と一致する仮定を立て、その仮定がより良い推定パフォーマンス(効率、精度、一貫性など)を買ってくれるなら、たとえそれがモデルを「不正確」にしたとしても、私はそれを避ける理由を見つけません。

率直に言って、この記事は、データを扱う人たちに、モデリングプロセス全体についてより深く考えるよう促すことを目的としていると思います。van der Laan が彼の作品で推測をしていることは明らかです。ではこの例、実際には、ラーンデア・バンは、正確なモデルのための任意の懸念を捨てているようだ、と代わりにパフォーマンスを最大化するための手順のミッシュ・マッシュを使用しています。これは、問題を理解するという困難な作業からの逃避として人々がそれを使用することを防ぐことを意図して、彼がBoxの引用を上げたと私をより確信させます。

それに直面しましょう、世界は統計モデルの誤用と乱用に満ちています。人々は、知っている方法を盲目的に適用し、さらに悪いことに、結果を最も望ましい方法で解釈する人もいます。この記事は注意することをお勧めしますが、極端に取り上げるべきではないと思います。

あなたの質問に対する上記の意味:

  1. この投稿で、モデルを一連の仮定として定義した他の人に同意します。その定義では、仮定のないモデルは実際にはモデルではありません。 探索的データ分析(つまり、モデルフリー)でさえ仮定が必要です。 たとえば、ほとんどの人はデータが正しく測定されていると考えています。
  2. 私はTMLE自体は知りませんが、経済学では、観察されていない反事実的なサンプルに対する因果効果について推論するという同じ基本哲学を使用する記事がたくさんあります。ただし、これらの場合、治療を受けることはモデル内の他の変数から独立していないため(TMLEとは異なります)、エコノミストはモデリングを広範囲に使用します。以下のような構造モデルのためのいくつかのケーススタディ、があります。この1著者は彼らのモデルを実装するために会社を説得し、良い結果を発見しました。
  3. すべてのモデルは不正確だと思いますが、繰り返しますが、この用語は少し曖昧です。IMO、これはBoxの引用の核心です。Boxの理解をこのように言い直します:「どのモデルも現実の本質を正確にキャプチャすることはできませんが、一部のモデルは関心のある変数をキャプチャするので、その意味でそれらを使用するかもしれません。」
  4. 上記でこれを取り上げました。要するに、私はそうは思わない。
  5. よく分かりません。ここが好きです。

5

ポイント3に対処するための答えは、明らかに、ノーです。ほぼすべての人間の企業は、ある時点で単純化されたモデルに基づいています。料理、建築、対人関係はすべて、何らかのデータ+仮定に基づいて行動する人間を伴います。誰も利用したくないモデルを構築したことはありません。そうでないと断言することは、怠慢です。

不正確なモデルが役に立たない場合、なぜ役に立たないのか、役に立たないことが判明したモデルに依存する場合に何が起こるのかを尋ねると、はるかに興味深く、啓発的で便利です。アカデミアであろうと産業界であろうと、どの研究者もその質問を慎重かつ頻繁に行わなければなりません。

質問に一般的に答えられるとは思いませんが、エラー伝播の原則が答えを知らせてくれます。不正確なモデルは、予測した動作が実世界の動作を反映できない場合に故障します。システムを介してエラーがどのように伝播するかを理解することは、システムのモデリングにどれだけの精度が必要かを理解するのに役立ちます。

たとえば、剛体球は通常、野球の悪いモデルではありません。しかし、キャッチャーのミットを設計している場合、このモデルは失敗し、間違ったものを設計することになります。野球の物理学についての単純化された仮定は、野球ミットシステムを通じて広まり、間違った結論を導きます。


5

1)仮定をまったく行わないモデルを使用して、どのような有用な統計的推論を行うことができますか?

モデルは定義上、観察対象の一般化であり、観察対象のイベントを説明および推定できる特定の因果要因によってキャプチャできます。これらのすべての一般化アルゴリズムには、ある種の根本的な前提があると考えられます。仮定がまったくない場合、モデルの残りの部分はわかりません。元のデータがあり、モデルは残っていないと思います。

2)対象の最尤法を使用した重要な実際のデータを使用したケーススタディはありますか?これらの方法は広く使用され、受け入れられていますか?

知りません。最尤法は常に使用されます。Logitモデルは、これらのモデルと他の多くのモデルに基づいています。これらは、残差の二乗和の減少に焦点を当てる標準的なOLSとは大きく異なりません。目標とされる最尤法が何であるかはわかりません。そして、従来の最尤法との違い。

3)すべての不正確なモデルは本当に役に立たないのですか?

絶対違う。不正確なモデルは非常に便利です。まず、現象の理解または説明に役立ちます。それは何かのためにカウントする必要があります。第二に、推定値を取り巻く不確実性を捕捉するために、関連する信頼区間で降下推定と予測を提供する場合があります。それはあなたが勉強していることに関する多くの情報を提供することができます。

「不正確」の問題は、par約と過剰適合の間の緊張の問題も提起します。「不正確」な5つの変数を持つ単純なモデルを作成できますが、従属変数の全体的な傾向を把握して説明するのは非常に優れています。最初の変数よりも「正確」な10個の変数を持つより複雑なモデルを作成できます(調整されたR平方が大きく、標準誤差が小さいなど)。ただし、この2番目の複雑なモデルは、Hold Outサンプルを使用してテストすると実際にクラッシュする可能性があります。そして、そのような場合、「不正確な」モデルは実際にホールドアウトサンプルではるかに優れたパフォーマンスを発揮します。これは文字通り計量経済学で常に起こり、私は他の多くの社会科学で疑っています。「正確な」モデルに注意してください。

4)些細な場合以外の正確なモデルがあることを知ることは可能ですか?

正確なモデルがあることを知ることはできません。しかし、あなたがかなり良いモデルを持っていることを知ることは可能です。情報基準の尺度(AIC、BIC、SIC)は、さまざまなモデルの相対的なパフォーマンスを比較およびベンチマークできる多くの情報を提供します。また、LINKテストもその点で役立ちます。

5)これがあまりにも意見に基づいているため、トピックから外れている場合、どこで議論できますか?ファン・デル・ラーン博士の記事は間違いなく議論が必要だからです。

これは、この問題を議論する他の場所と同様に適切なフォーラムだと思います。これは私たちのほとんどにとって非常に興味深い問題です。


5

(記事には「正確なモデル」というフレーズは表示されません(上記の引用))

1)仮定をまったく行わないモデルを使用して、どのような有用な統計的推論を行うことができますか?

どこかから始めなければなりません。 それがあなたが持っているすべて(何もない)なら、それは出発点になります。

2)対象の最尤法を使用した重要な実際のデータを使用したケーススタディはありますか?これらの方法は広く使用され、受け入れられていますか?

2番目の質問に答えるために、arxiv.orgの論文の​​93/1143281(〜.008%)でTargeted Maximum Likelihoodが判明しました。そのため、おそらく(推定なしで)その推定値は適切ではありません

3)すべての不正確なモデルは本当に役に立たないのですか?

いいえ 。モデルの1つの側面のみに関心がある場合があります。その側面は非常に良く、残りは非常に不正確です。

4)些細な場合以外の正確なモデルがあることを知ることは可能ですか?

最良のモデルでは、モデルで最高のあなたの質問に答えます。それは何かを省くことを意味するかもしれません。可能な限り回避したいのは、想定違反です。

5)ハッピーアワー。そして、飲み物はブートするのが安いです!

「正確」という言葉の使用は少し不安になります。統計学者のような話ではありません。不正確?変化?Gdに感謝します!だから私たちは皆ここにいます。「すべてのモデルが間違っている...」というフレーズは大丈夫ですが、適切な会社でのみだと思います。統計学者はそれが何を意味するかを理解していますが、他の人はほとんどしていません。


「正確なモデル」というフレーズについての良い点。彼は、特に記事の文脈と調子を考えると、同等の「真の」モデルと「実際の」モデルについて語っていますが、あなたは正しいと思います。
SQLServerSteve

私の悪い。私は彼を正しく引用すべきだった。
-rvl

真のモデルまたは実際のモデルを達成しようとすると、演習のポイントが失われると感じています。彼が本当に議論しようとしているのは悪いモデルだと思う。
マンデータ

ええ、この記事には多くの良い点がありますが、「すべてのモデルが間違っていると述べるのは完全にナンセンスです」という極端なコメントが散在しています。そうでないと言うのはナンセンスです。彼は間違いなく極端なポジションを賭けています。Rvlはこれを持ち出し、彼を呼ぶのに完全に正しかったです(Rylの引用を気にしないでください、重要なことはあなたが意味を正しく捉えたことです)。
SQLServerSteve

4

この記事は、正直だが政治的な記事、誠実な論争のように思えます。そのため、科学的なナンセンスな情熱的なパッセージが多く含まれていますが、それでも重要な問題についての有益な会話や審議をかき立てるのに効果的かもしれません。

ここには多くの良い答えがありますので、Laan教授が確かに彼の作品で「正確なモデル」を一切使用していないことを示すために、記事からいくつかの行を引用させてください。モデル」は、実際のデータ生成メカニズムと同等の概念ですか?)

引用符(太字で強調)

「いったん現実的な統計モデルを提示したら、研究者が関心のある科学的質問に対する答えを最もよく表すものは何であるかを協力者から抽出する必要があります。

コメント:「現実的」は、火星が地球から来ているのと同じように「正確」から削除されています。どちらも太陽の周りを回っているので、目的によっては、どちらの惑星を選択するかは重要ではありません。他の目的のために、それは重要です。また、「最高」は相対的な概念です。「正確」ではありません。

正直な統計モデルで定義された推定量の推定量は、パラメトリックモデルに基づいて合理的に推定することはできません...

コメント:誠実さは確かに最高のポリシーですが、「正確」であるとは限りません。また、「正確なモデル」を使用する場合、「賢明な推定」は非常に希薄な結果であると思われます。

これらの困難な推定問題をできる限り解決しなければならないことに応えて、一般的な統計的アプローチを開発しました...

コメント: OK。私たちは「できる限りのことをしています」。ほとんど全員が自分のことを考えているので。しかし、「できる限り」は「正確」ではありません。


2

George F. Klirのファジーセットに関する本で説明されている不確実性管理の非常に有用な原則に照らして、哲学の別の方向からこれにアプローチします。ファン・デル・ラーンの正確さを伝えることはできませんが、彼の目標が論理的に不可能な理由について、いくぶん網羅的なケースを提供できます。それは他のフィールドを参照する長い議論を必要とするので、私と一緒に耐えてください。

Klirと彼の共著者は、不確実性を非特異性などのいくつかのサブタイプに分けています(つまり、未知の代替セットがある場合、ハートレー関数などの手段で処理されます)。定義の不正確さ(つまり、ファジーセットでモデル化および定量化された「ファジーネス」)。争いまたは不和の証拠(デンプスターシェーファー証拠理論で扱われます); 加えて、確率論、可能性論、および測定の不確実性。目標は、エラーを最小限に抑えながら、関連する証拠を取得するための適切な範囲を持つことです 統計手法のツールボックス全体を、クッキーカッターのように、さまざまな方法で不確実性を分割する代替手段として見ています。信頼区間とp値は1つの方法で不確実性を隔離しますが、シャノンのエントロピーのような測定は別の角度からそれを切り詰めます。彼らができること ただし、完全に排除することはできません。ファン・デル・ラーンが説明しているような「正確なモデル」を実現するには、これらのタイプの不確実性をすべてゼロに減らして、分割する余地がないようにする必要があります。真に「正確な」モデルは、確率、可能性の値が常に1で、非特異性スコアが0で、用語、値の範囲、または測定スケールの定義に不確実性はありません。証拠の代替ソースに不一致はありません。このようなモデルによって行われる予測は、常に100%正確です。予測モデルは本質的に不確実性を将来に分けますが、先送りするものはありません。不確実性の観点には、いくつかの重要な意味があります。ファン・デル・ラーンのようなものは、これらのタイプの不確実性をすべてゼロに減らす必要があります。そうすれば、分割する余地はもうありません。真に「正確な」モデルは、確率、可能性の値が常に1で、非特異性スコアが0で、用語、値の範囲、または測定スケールの定義に不確実性はありません。証拠の代替ソースに不一致はありません。このようなモデルによって行われる予測は、常に100%正確です。予測モデルは本質的に不確実性を将来に分けますが、先送りするものはありません。不確実性の観点には、いくつかの重要な意味があります。ファン・デル・ラーンのようなものは、これらのタイプの不確実性をすべてゼロに減らす必要があります。そうすれば、分割する余地はもうありません。真に「正確な」モデルは、確率、可能性の値が常に1で、非特異性スコアが0で、用語、値の範囲、または測定スケールの定義に不確実性はありません。証拠の代替ソースに不一致はありません。このようなモデルによって行われる予測は、常に100%正確です。予測モデルは本質的に不確実性を将来に分けますが、先送りするものはありません。不確実性の観点には、いくつかの重要な意味があります。真に「正確な」モデルは、確率、可能性の値が常に1で、非特異性スコアが0で、用語、値の範囲、または測定スケールの定義に不確実性はありません。証拠の代替ソースに不一致はありません。このようなモデルによって行われる予測は、常に100%正確です。予測モデルは本質的に不確実性を将来に分けますが、先送りするものはありません。不確実性の観点には、いくつかの重要な意味があります。真に「正確な」モデルは、確率、可能性の値が常に1で、非特異性スコアが0で、用語、値の範囲、または測定スケールの定義に不確実性はありません。証拠の代替ソースに不一致はありません。このようなモデルによって行われる予測は、常に100%正確です。予測モデルは本質的に不確実性を将来に分けますが、先送りするものはありません。不確実性の観点には、いくつかの重要な意味があります。このようなモデルによって行われる予測は、常に100%正確です。予測モデルは本質的に不確実性を将来に分けますが、先送りするものはありません。不確実性の観点には、いくつかの重要な意味があります。このようなモデルによって行われる予測は、常に100%正確です。予測モデルは本質的に不確実性を将来に分けますが、先送りするものはありません。不確実性の観点には、いくつかの重要な意味があります。

•この高い秩序は、物理的に信じられないだけでなく、実際には論理的に不可能です。明らかに、誤りのある物理的な科学機器を使用して有限の観測値を収集することによって、無限の程度で完全に連続した測定スケールを達成することはできません。測定スケールに関しては常に不確実性があります。同様に、実験で使用する定義そのものを取り巻く曖昧さが常にあります。将来も本質的に不確実であるため、「正確な」モデルのおそらく完全な予測は、他の方法で証明されるまで不完全として扱わなければなりません。

さらに悪いことに、プロセスのある時点で100%エラーのない測定技術はなく、また、宇宙で競合する可能性のある情報をすべて網羅するほど包括的にすることもできません。さらに、可能性のある交絡変数の排除と完全な条件付き独立性は、調査対象のプロセスに影響を与える他のすべての物理プロセス、およびこれらの二次プロセスに影響を与えるプロセスなどを調査せずに徹底的に証明することはできません。

•正確性は、純粋な論理とそのサブセットである数学でのみ可能です。これは、こうした不確実性の原因のような現実世界の懸念から抽象化が切り離されているからです。たとえば、純粋な演ductive論理により、2 + 2 = 4であり、他の答えが100%間違っていることを証明できます。また、常に4になるという完全に正確な予測を行うこともできます。この種の精度は、抽象化を処理している統計でのみ可能です。統計は、実世界に適用すると非常に役立ちますが、統計を有効にすると、少なくともある程度の避けられない不確実性が注入され、不正確になります。それは避けられないジレンマです。

•さらに、Peter Chuはリンクしている記事rvlのコメントセクションに追加の制限を設けています。彼は私ができる以上にそれを置きます:

「NP困難問題のこの解の表面は、通常、多くの局所的な最適値に満ちており、ほとんどの場合、問題を解決することは計算上実行不可能です。せいぜい、この複雑な目的関数の広大なソリューション空間で適切なローカル最適ソリューションを見つけるためです。」

•これらすべては、科学自体が完全に正確ではないことを意味しますが、van der Laanは彼の記事でこのように述べているようです。抽象プロセスとしての科学的方法は正確に定義できますが、普遍的で完全な正確な測定が不可能であることは、不確実性のない正確なモデルを作成できないことを意味します。科学は素晴らしいツールですが、限界があります。

•そこから悪化する:宇宙のすべての構成クォークとグルーオンに作用するすべての力を正確に測定できたとしても、いくつかの不確実性が残っています。第1に、このような完全なモデルによって行われる予測は、5次方程式と高次多項式の複数の解が存在するため、依然として不確実です。第二に、古典的な質問「これはすべて夢か幻覚かもしれない」に具体化された極端な懐疑主義が現実を反映していないことを完全に確信することはできません-この場合、私たちのモデルはすべて最悪の形で実際に間違っています。これは基本的に、現象主義、理想主義、独身主義のような哲学の元の認識論的定式化のより極端な存在論的解釈と同等です。

1909年の正統派の正統派GKチェスタートンは、これらの哲学の極端なバージョンは確かに判断できるが、彼らが信者を精神的制度に追い込むかどうかによって判断できると指摘した。たとえば、存在論的独身論は、実際には統合失調症のマーカーであり、そのいとこも同様です。この世界で達成できる最善のことは、合理的な疑念を排除することです。正確なモデル、網羅的でエラーのない測定の仮想世界であっても、この不安定な種類の不合理な疑念を厳密に排除することはできません。ファン・デル・ラーンが不当な疑いを取り除くことを目指しているなら、彼は火で遊んでいます。完全に把握することで、私たちにできる限りの善が指をすり抜けます。私たちは無限の世界に存在する有限の生き物です。つまり、van der Laanが主張する完全かつ完全に特定の知識は、私たちの手に負えないものです。この種の確実性に到達する唯一の方法は、その世界から、私たちが「純粋数学」と呼ぶ完全に抽象的な世界のより狭い範囲に後退することです。ただし、これは、純粋数学への後退が不確実性を解消する解決策であることを意味するものではありません。これは本質的にルートヴィヒ・ヴィットゲンシュタイン(1889-1951)の後継者たちが取ったアプローチでした。過剰な専門化と有用性よりも正確さの強調。その過程で、彼らは哲学の規律を、定義とへそをじっと見つめるという泥沼に分解することで破壊し、それによって他の学界とは無関係にした。これにより、20世紀初頭まで学問的議論の最前線にあった規律全体が本質的に殺され、メディアの注目を集め、指導者の何人かは有名になりました。彼らは世界についての完璧で洗練された説明を把握し、GKCが述べた精神病患者と同じように、指をすり抜けました。また、以下で説明するように、すでに自分の主張を反証しているファン・デル・ラーンの把握から外れます。あまりにも正確なモデルの追求は、単に不可能ではありません。自己敗北の強迫観念に連れて行かれると、それは危険でありえます。そのような純度の追求は、めったに終わりません。猛烈に手をこすり、感染した傷を負った生殖嫌悪者と同じくらいしばしば自滅的です。それ' 太陽から火を盗もうとするイカロスを連想させる:有限の存在として、私たちは物事の有限の理解しかできない。チェスタートンも正統派の言葉で述べているように、「天を頭に入れようとするのは論理学者です。そして、彼の頭が分裂するのです」。

上記に照らして、rvlによってリストされた特定の質問のいくつかに取り組んでみましょう。

1)仮定を一切持たないモデルは、a)自身の仮定を認識していないか、b)測定誤差、考えられるすべての交絡変数の説明、完全に連続した測定スケール、好む。

2)最尤推定(MLE)に関しては私はまだ初心者なので、ターゲット尤度のメカニズムについてコメントすることはできません。ただし、明白なことを指摘する場合を除きます。 。正確なモデルを導き出すためには、不確実性を完全に排除する必要があります。

3)もちろんありません。すべてのモデルはある程度の不確実性を保持しているため不正確であるため(実際の物理測定から離婚した純粋な数学の場合を除く)、人類はこれまでに技術的な進歩を遂げることができませんでした。すべて。不正確なモデルが常に役に立たない場合は、インターネットと呼ばれるこの驚くべき技術の偉業ではなく、洞窟でこの会話をすることになります。これらはすべて不正確なモデリングによって可能になりました。

皮肉なことに、ファンデルラーン自身のモデルは不正確さの主な例です。彼自身の記事では、正確なモデルを目指して、統計分野をどのように管理すべきかという種類のモデルをスケッチしています。この「モデル」に付けられた数字はまだありません。ほとんどのモデルが彼の視界にどれだけ不正確または役に立たないかの測定も、彼のビジョンからどれだけ離れているかの定量化もありませんが、私はそれらのテストを考案できると思います。しかし、現状では、彼のモデルは不正確です。役に立たない場合は、彼の主張が間違っていることを意味します。それが有用である場合、不正確なモデルは有用ではないという彼の主な点を無効にします。いずれにせよ、彼は彼自身の議論に反論します。

4)おそらくそうではありません。なぜなら、そもそも正確なモデルを導き出せないのと同じ理由で、モデルをテストするための完全な情報を持てないからです。定義上、正確なモデルには完全な予測可能性が必要ですが、最初の100回のテストで100%の正確さが得られたとしても、101回目のテストはそうではありません。次に、無限の測定スケールの問題があります。その後、他の不確実性のすべての原因になります。これにより、アイボリータワーモデルのアイボリータワーの評価が汚染されます。

5)この問題に対処するために、私はしばしば物議を醸すはるかに大きな哲学的問題のより広い文脈にそれを置かなければならなかったので、意見を得ることなくこれを議論することは可能だとは思わない(それ自体が別のものであることに注意してください)不確実性の原因)しかし、あなたは正しいです、この記事は返信に値します。彼が他のトピックで言っていることの多くは、ビッグデータに関連する統計を作成する必要性など、正しい軌道に乗っていますが、修正すべきいくつかの非現実的な過激さが混在しています。


1
「哲学の規律を破壊した」これらの「ウィットゲンシュタインの後継者」は誰ですか?戦後の分析哲学の傾向-後のウィットゲンシュタイン、オースティン、クイン、ケニー、グッドマン、ルイス、デビッドソン、ローティを考える-は、論理的実証主義、形而上学のリハビリテーション、および科学からの退却の教義の拒否のようです。(ニーチェとロヨラに関するローティのコメントは、チェスタートンの主張に同意したかもしれないことを示唆している。)なぜキム・カーダシアンがサウル・クリプケではなく一流の名前であるかについては、20世紀初頭から他の傾向が働いていると思われる。
Scortchi -復活モニカ

これらの戦後の改革者は、20年代/ 30年代に規律が後退した後(何世紀にもわたる衰退の後、極端な論理的実証主義者が単に加速しただけである)、それが決して回復しなかったという理由で、彼らの分野の外では不明です。損傷はすでに行われていました。1950年代までに、他の学問分野はリーダーシップの哲学をもはや見ていなかったため、それ以降、しばしば、それを率直な軽cornで扱いました。イメージは哲学の現実を反映していないかもしれませんが、汚染はまだ残っています。
SQLServerSteve

時間があれば、来週のチャットでこれについて議論したいと思います。このスレッドで接線を外したくはありませんが、私たちの位置はそれほど離れていないと思います。私はあなたが完全に正しいと思います、カーダシアンなどにつながった運動は20世紀初頭から進行中です-まさに哲学の規律が食になった時(それが価値があるかどうか;私はそれを高く評価します実用的であり、それがまだ高く評価されていたことを願っています)。
SQLServerSteve

コメントは詳細なディスカッション用ではありません。この会話はチャットに移動さました
スコルチ-モニカの復職
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.