節約は本当にゴールドスタンダードである必要がありますか?


31

ちょっとした考え:

控えめなモデルは常にモデル選択のデフォルトの対象でしたが、このアプローチはどの程度古くなっていますか?私たちのpar約傾向が、アバチとスライドのルール(または、もっと真剣に、非近代的なコンピューター)の時代の遺物であることに興味があります。今日の計算能力により、予測能力がさらに向上し、ますます複雑化するモデルを構築できます。この計算能力の上限の増加の結果として、私たちは本当に単純さに引き寄せられる必要があるのでしょうか?

確かに、より単純なモデルは理解と解釈が容易ですが、変数の数が増え、予測機能に重点が置かれるようになりつつあるデータセットが増え続ける時代には、これはもはや達成できず、必要もありません。

考え?


4
リチャード・ハミングに謝罪:モデリングの目的は洞察力であり、数字ではありません。複雑なモデルは洞察を妨げます。
エリックタワーズ

12
過度に単純化されたモデルは、洞察をさらに妨げます。
フランクハレル

6
アプリケーションに依存する場合があります。物理学では、par約の議論には強い基盤があると思います。ただし、多くのアプリケーションには、排除できない多くの小さな効果があります(たとえば、政治的選好のモデルを検討してください)。多くの労働者は、変数を削除するよりも、正則化(収縮または多くのアプリケーションで差異の収縮、またはその両方につながる方法など)を使用する方が理にかなっていると示唆しています。他のものは、いくつかの選択といくつかの縮小に傾いています(たとえば、LASSOは両方を行います)。
Glen_b -Reinstateモニカ

3
控えめなモデルは、モデル選択の「後継者」ではありません。それ以外の場合は、常にサンプル平均ですべてをモデル化し、それを1日と呼びます。
シャドウトーカー

1
また、いくつかの参考資料Mease and Wyner(2008)は、AdaBoostのより豊かな学習者を推奨していますが、これは少し直感的ではありません。その一連の研究における未解決の問題は、par約的な基本学習者が実際にs約的なアンサンブルにつながるかどうかです。
シャドウトーカー

回答:


25

@Mattの元の答えは、par約の利点の1つを説明するのに非常に役立ちますが、実際にあなたの質問に答えるとは思いません。現実には、節約は金本位ではありません。今ではなく、かつてない。節約に関連する「ゴールドスタンダード」は一般化エラーです。過剰適合しないモデルを開発したいと思います。それは、サンプル内の予測と同じように(または、解釈可能であるか、最小限のエラーで)サンプル内と同じくらい便利です。(上記の理由により)節約は実際には一般化エラーの非常に優れたプロキシですが、決して唯一のものではありません。

実際、相互検証、ブートストラップ、またはトレーニング/テストセットを使用する理由を考えてください。目標は、一般化の精度が高いモデルを作成することです。多くの場合、サンプルパフォーマンスからこれらの方法を推定する方法は、必ずしも複雑ではないが常にそうではないモデルを選択することになります。極端な例として、オラクルが私たちに真であるが非常に複雑なモデルと貧弱でありながらpar約的なモデルを手渡していると想像してください。節約が本当に私たちの目標だった場合、2つ目を選択しますが、実際には、1つ目は、できれば学びたいことです。残念ながら、最後の文は多くの場合、「できれば」キッカーです。


「元の答え」はどれですか?
mattdm

:) けっこうだ。マットのコメント。
ニックティーム

22

コンピューティング要件だけでなく、一般化パフォーマンスのためにも、節約的なモデルが望ましいです。サンプル空間を完全かつ正確にカバーする無限のデータの理想を達成することは不可能です。つまり、非par約モデルは、サンプル母集団のノイズや特異性を過剰適合させ、モデル化する可​​能性があります。

数百万の変数でモデルを構築することは確かに可能ですが、システムをモデル化するために出力に影響を与えない変数を使用することになります。トレーニングデータセットで優れた予測パフォーマンスを達成できますが、これらの無関係な変数は、目に見えないテストセットでのパフォーマンスを低下させる可能性が高くなります。

出力変数が本当に100万個の入力変数の結果である場合十分なデータがある場合にのみ、それらをすべて予測モデルに入れることをお勧めします。このサイズのモデルを正確に構築するには、少なくとも数百万のデータポイントが必要です。多くの実世界のシステムでは、このサイズのデータ​​セットが利用できないだけであり、さらに、出力は比較的少数の変数によって大部分が決定されるため、Par約モデルは素晴らしいです。


5
+1。この問題について詳しく説明しているThe Elements of Statistics Learning(Webで無料で入手可能)を読むことをお勧めします
S. Kolassa-モニカの復職

3
一方、数百万の変数があり、オブジェクトがほとんどない場合、純粋に偶然にいくつかの変数が真の相互作用の結果を説明するのに優れている可能性があります。そのような場合、節約ベースのモデリングは、総当たり的なアプローチよりも過剰適合の影響を受けやすくなります。

@CagdasOzgencたとえば、大きなランダム部分空間アンサンブル。

なげなわアプローチのようなものがここに適用できると思います。
森林生態学者

17

以前の回答は重要なポイントを作るのに良い仕事をしていると思います:

  • Par約モデルの方が一般化特性が優れている傾向があります。
  • Par約は真のゴールドスタンダードではなく、単なる考慮事項です。

私は日々の仕事の経験から出てくるいくつかのコメントを追加したいと思います。

予測精度の議論の一般化はもちろん強力ですが、その焦点には学問的に偏っています。一般に、統計モデルを作成するとき、経済は予測性能が完全に支配的な考慮事項であるほどではありません。非常に多くの場合、特定のアプリケーションにとって有用なモデルがどのように見えるかについて、大きな外部制約があります。

  • モデルは、既存のフレームワークまたはシステム内で実装可能でなければなりません。
  • モデルは理解可能でなければなりません非技術的なエンティティによって。
  • モデルは効率的でなければなりません計算。
  • モデルは文書化可能でなければなりません
  • モデルは規制上の制約に合格する必要があります

実際のアプリケーションドメインでは、これらの考慮事項のすべてではないにしても多くが予測パフォーマンスのではなく後であり、モデルの形式とパラメーターの最適化はこれらの要望によって制約されています。これらの各制約は、科学者をthe約に偏らせます。

多くのドメインで、これらの制約が徐々に解除されているのは事実かもしれません。しかし、それらを無視するのは、純粋に一般化エラーを最小限に抑えることに焦点を当てているのは、実に幸運な科学者です。

これは初めての科学者にとって非常にイライラする可能性があります(学校から離れたばかりです)しかし、結局のところ、受け入れられない製品を生産するために一生懸命働くことは無駄であり、それはあなたの科学的誇りに刺されるよりも悪いと感じます。


2
節約は考慮されません。健全な推論手順は、データを同等にうまく説明している場合、非par約モデルよりもpar約モデルをランク付けする必要があります。そうでない場合、モデルの圧縮されたコード長とモデルによってエンコードされたデータの合計は最小になりません。はい、それはゴールドスタンダードです。
カグダスオズゲンク

3
Par約は「ゴールドスタンダード」ではありません!その声明はばかげています。もしそれが本当だったら、なぜ無条件の平均以外に適合しないモデルを常に構築しないのでしょうか?バイアスと分散は、テストセットまたはさらに良いことに完全に新しい観測のいずれかを参照してトレードオフし、フィールド、組織、および法律の制約内で行います。時々、あなたは素朴な予測をするのに十分な情報しか持っていません。複雑さを加えるのに十分な場合もあります。
ブラッシュ平衡

1
@BrashEquilibrium Cagdasが言っていることは、同様に予測的なモデルの選択を考えると、最もone約的なモデルを選択すべきだと思います。
マシュードゥルーリー

1
あ。それは別のことです。はい、その場合、最もpar約的なモデルを選択します。私はまだそれが「ゴールドスタンダード」であるpar約に等しいとは思わない。
不均衡の均衡

1
@MatthewDrury Brash、カグダス。面白い。おそらく、節約は金本位制の1つのコンポーネントにすぎません。これはおそらく包囲するという概念に基づいていると思われます(またはそうすべきです)。このアイデアの良い説明は、エール大学の次の天体物理学の講義で提供されています:oyc.yale.edu/astronomy/astr-160/lecture-11。7:04以降。このアイデアは、David HendryとGrayham Mizonによる計量経済学/予測に関する文献にも取り上げられています。彼らは、包含は進歩的な研究戦略の一部であり、そのpar約は単一の側面であると主張しています。
グレアムウォルシュ

14

これは非常に良い質問だと思います。私の意見では、節約は過大評価されています。自然がpar約することはめったにないので、正確な予測モデルまたは記述モデルがそうであると必ずしも期待するべきではありません。解釈可能性の問題に関して、単に理解できるという理由だけで現実に適度にのみ適合する単純なモデルを選択した場合、正確に何を理解していますか?より複雑なモデルの方が予測力が優れていると仮定すると、とにかく実際の事実に近いように見えます。


8
@dsaxtonと言った。par約に対する大きな誤解があり、特徴選択がいかに不安定であるかについての過小評価があります。事前仕様に起因する場合、Par約は便利です。データdrから生じるほとんどのpar約は誤解を招くものであり、間違っているためにのみ理解されます。
フランクハレル

2
@FrankHarrell「間違っているからしか理解できない」ということについて詳しく説明してください。これは、私が理解したことを確認したい興味深い点です。
gui11aume

8
これは極端な例ですが、人種プロファイリングに携わる人々は、単一の機能(肌の色など)で、誰かがどのような価値を持っているかを理解していると考えています。彼らへの答えは簡単です。単純化しすぎて間違った判断をしているため、彼らはそれを理解するだけです。Par約は通常幻想です(ニュートン力学と他のいくつかの領域を除く)。
フランクハレル

1
「自然はめったにpar約されません」:自然が特にnature約されない1つのポイントは個人です(典型的なサンプルサイズとは対照的です!)。Evolutionは、世代ごとに新しい個人のまったく新しい母集団を使用します。これは、元の検索スペースの非常に小さい部分です)、非常に小さいデータセットから少なくとも何かを取得する方法です。
cbeleitesは、モニカをサポートします

2

節約は黄金の始まりではありません。モデリングの側面です。モデリングと特に予測はスクリプト化できません。つまり、モデラーにスクリプトを渡して従うことはできません。むしろ、モデリングプロセスの基礎となる原則を定義します。したがって、節約はこれらの原則の1つであり、その適用をスクリプト化することはできません(繰り返します!)。モデラーは、モデルを選択するときに複雑さを考慮します。

計算力はこれとはほとんど関係ありません。あなたが業界にいるなら、あなたのモデルはあなたがそれらを呼ぶ誰でも、ビジネスの人々、製品の人々によって消費されます。あなたは彼らにあなたのモデルを説明しなければなりませ。控えめなモデルを持つことは、この点で役立ちます。

たとえば、製品の売上を予測しています。セールスの推進要因は何か、どのように機能するかを説明できる必要があります。これらは、ビジネスが運営する概念と相関関係に関連している必要があります理解し、受け入れなければなりません。複雑なモデルでは、モデルの結果を解釈したり、差異を実績と関連付けることは非常に困難です。モデルをビジネスに説明できない場合、それによって評価されません。

予測にとって特に重要なもう1つのこと。モデルがN個の外生変数に依存しているとします。つまり、従属変数を予測するには、まずこれらの変数の予測を取得する必要があります。Nを小さくすると、生活が楽になります。そのため、単純なモデルを使用する方が簡単です。


あなたは予測について言及していますが、あなたの答えのほとんどは説明的なモデリングにのみ適用されるようです。
-rolando2

@ rolando2のように聞こえますが、これは私のドメインでは単純にユーザーに予測を渡すことができないためです。予報を説明し、ドライバーなどにリンクする必要があります。天気予報を取得するとき、通常は予報者に、50%の確率で雨が降ると思う正確な理由を説明するよう依頼することはありません。私の場合、私はそれをしなければならないだけでなく、消費者が結果を理解する方法でそれを行います。それは、彼らが毎日扱うビジネスドライバーに結果をリンクすることによってです。だからこそ、節約はそれ自体で価値がある
-Aksakal

1

おそらく、昨日セレンディピティによってのみ発見された概念である赤池情報量基準のレビューがあるでしょう。AICは、基本的なOccamのカミソリ、またはpar約アプローチではなく、現在の観測の最良の説明であるモデルとパラメーターの数を特定しようとします。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.