外挿の何が問題になっていますか?


68

外挿が悪い考えであった理由についての学部生の聴聞会として統計コースに座っていたことを覚えています。さらに、これについてコメントするオンラインのさまざまな情報源があります。ここにもそれについての言及があります

誰かが外挿が悪い考えである理由を理解するのを助けることができますか?もしそうなら、どのように予測手法が統計的に無効ではないのですか?


3
@Firebug Mark Twainはそれについて何か言いたいことがありました。関連する文章は、stats.stackexchange.com / a / 24649/919で私の回答の終わり近くに引用されています
whuber

1
@whuberそれは、今それを考えている外挿ではないようです。たとえば、アルゴリズムを適切にトレーニングおよび検証して、機能への1週間のデータを予測します。正しいリサンプリング(および調整するハイパーパラメーターがある場合は調整)を実行すると、それが間違っている場合はわかりません。応答があり、応答の信頼性も知っている必要があります。現在、1週間ごとにアルゴリズムをトレーニングする場合、1年先を正確に予測することは期待できません。混乱の可能性があるため申し訳ありません。
Firebug

7
@Firebug謝罪する必要はありません。あなたの発言には有用な明確な情報が含まれています。私がそれらを読んだとき、彼らは「外挿」が予測設定で複数の解釈を持つことができることを示唆しています。1つは、時間の「外挿」を伴うことです。しかし、標準の時系列モデル、特に時間が明示的な共変量ではないモデルを見ると、以前の値に関して将来の値を予測します。これらの以前の値が過去の以前の値の範囲内にある場合、モデルはまったく外挿を実行しません!そこには、見かけ上のパラドックスの解決があるかもしれません。
whuber


2
私はそれが表示されるように義務付けXKCDのためにかかった時間でがっかり
ダンカンXシンプソン

回答:


89

回帰モデルはしばしば外挿に使用されます。つまり、モデルの適合に使用される予測変数の値の範囲外にある入力に対する応答を予測します。外挿に関連する危険性を次の図に示します。 「真の」値が減少する、上方に続く外挿線を示すグラフ

回帰モデルは「構築によって」補間モデルであり、適切に正当化されない限り、外挿には使用しないでください。


1
これは外挿に対する恐ろしい例です。直線回帰線は、曲線の真の関数よりもはるかにデータポイントに適合します。
horaceT

9
「直線の回帰直線は、曲線の真の関数よりもはるかにデータポイントに適合します」このステートメントはfalseです。真の回帰関数のRSSは、単純な回帰線のRSSよりも小さい
Kostia

ポイントが取られ、あなたは正しいかもしれません。しかし、一連のポイントから判断すると、真の機能を推測する方法はありません。
horaceT

27
まさに。そして、これが外挿が悪い考えかもしれない理由です。
コスティア

「回帰モデルは「構築によって」補間モデルです」->補間でまったく同じ問題が発生する可能性があります(発生する可能性が低い場合でも)
Metariat

88

このxkcdコミックはすべてを説明しています。

xkcd comic

Cueball(棒を持った男)が持っているデータポイントを使用して、彼は女性が来月下旬までに「四ダース」の夫を持つと推定し、この推定を使用してウェディングケーキをまとめて購入するという結論に至りました。

編集3:「彼は十分なデータポイントを持っていません」と言っている人のために、別のxkcdコミックがあります:

xkcd comic

ここでは、「サステナブル」という言葉の経時的な使用が半ログプロットに示され、データポイントを外挿すると、「サステナブル」という言葉が将来どのくらいの頻度で発生するかについての不合理な推定値が得られます。

編集2:「過去のデータポイントもすべて必要です」と言う人のために、さらに別のxkcdコミック: xkcd comic

ここには、過去のすべてのデータポイントがありますが、Google Earthの解像度を正確に予測することはできません。これも半対数グラフであることに注意してください。

編集:時々、最も強い相関関係(この場合はr = .9979)でさえ、単に間違っているだけです。


他の裏付けとなる証拠なしで外挿する場合、相関に違反することは因果関係を意味しません。統計の世界における別の大きな罪。

あなたはYとXを推定した場合は、しかし、あなたがいることを確認する必要があります正確に(あなたの要件を満たすのに十分な)でXを予測できるだけ Y.ほとんどの場合、インパクトXよりも、複数の要因があります

ナッシム・ニコラス・タレブの言葉で説明している別の答えへのリンクを共有したいと思います。


14
xkcdには、発生する可能性のあるあらゆる数学/統計の問題について冗談がありますよね?
アンデルビグリ

24
この考え方は、「昨夜は0.5人の夫がいた」という補間に対する議論としても使用できます。
JiK

3
@JiKあなたが知っているのは、彼女が今1つ持っており、2日前に彼女がいなかったということです、それは悪い推定ではありません
;

9
持続可能な持続可能な持続可能な持続可能な持続可能な持続可能な持続可能な持続可能な。 en.wikipedia.org/wiki/...
Meniローゼンフェルド

1
もっとxkcd、人々!
noɥʇʎԀʎzɐɹƆ

24

「予測は非常に困難です。特に未来に関するものである場合」。引用は何らかの形で多くの人々に起因します。次の「外挿」は「既知の範囲外の予測」に制限し、1次元の設定では、既知の過去から未知の未来への外挿を制限します。

だから外挿の何が問題なのか。まず、過去をモデル化するのは簡単ではありません。第二に、過去のモデルを将来に使用できるかどうかを知ることは困難です。両方の主張の背後には、因果関係やエルゴード性、説明変数の十分性など、ケースに大きく依存する深い質問があります。間違っているのは、多くの追加情報がなくても、異なるコンテキストでうまく機能する単一の外挿スキームを選択するのが難しいことです。

バツ

アンスコム・カルテット

ただし、予測はある程度拡張できます。他の答えに加えて、いくつかの成分は実用的な外挿に役立ちます。

  1. npfpnpn
  2. 複数の外挿モデルを使用して、それらを組み合わせたり、最適なモデルを選択たりできます(Combining予測、J。Scott Armstrong、2001)。最近、それらの最適な組み合わせについて多くの研究が行われています(必要に応じて参考資料を提供します)。

最近、リアルタイム環境でのシミュレーションサブシステムの通信の値を外挿するプロジェクトに参加しています。この領域の教義は、外挿が不安定を引き起こす可能性があるということでした。実際に、上記の2つの成分を組み合わせると非常に効率的であり、顕著な不安定性がない(まだ正式な証拠がなく、現在検討中である)ことに気付きました。また、外挿は、非常に低い計算負荷で、単純な多項式で機能しました。ほとんどの操作は事前に計算され、ルックアップテーブルに格納されています。

最後に、外挿が面白い描画を示唆しているように、以下は線形回帰の逆効果です。

愛と線形回帰を楽しむ


+1いい答え。このウェブサイトによると、ボーアが言った可能性は低いようです。珍しいが一般的なデンマークのことわざである可能性が高いようです。
usεr11852は回復モニック言う

@usεr11852彼は「これまで言ったことはありませんか?」私が「帰属」と言った理由は、もっと慎重にすべきでしょうか?
ローランデュバル

2
私が言ったことはありません、これまでの部分を。私がこのコメントをしたのは、デンマークのことわざである可能性が非常に高いと思われるため、特定の(非常に象徴的な)デーンに起因すると言われているためです。原作者は明日の漁獲についてコメントする無名の漁師かもしれません!ここの小さな男を応援しています!:D
usεr11852は回復モニック語る

2
過去の引用の凡例をモデル化することも非常に困難です。
ローランデュバル

3
確かに、この質問では両方の単語を使用しています。全体の要点は、「予測」を「外挿」の一形態と見なす必要があるかどうかです。導入コメントによると、外挿は過去を使用して「未来をモデル化する」と定義するようです。それぞれの明確で明確な定義を提供するまで、あなたの答えは誤解される可能性があります。
whuberの

17

モデルの適合は「良い」かもしれませんが、データの範囲を超える外挿は懐疑的に扱われなければなりません。その理由は、多くの場合、外挿は(残念ながらやむを得ないことですが)観測されたサポートを超えるデータの動作に関するテスト不可能な仮定に依存しているためです。

バツoあなたはt

追加の注意点は、多くのノンパラメトリック推定手法では、ネイティブに外挿ができないことです。この問題は、スプラインスムージングの場合に特に顕著であり、適合スプラインを固定するノットがなくなります。

外挿は悪とはほど遠いことを強調させてください。たとえば、統計で広く使用されている数値手法(たとえば、エイトケンのデルタ2乗プロセスリチャードソンの外挿)は、観測されたデータに対して分析された関数の基になる動作が関数のサポート全体で安定しているという考えに基づいた外挿スキームです。


ε2

15

他の答えとは反対に、外挿が無意味な方法で使用されない限り、外挿には何の問題もありません。まず、外挿が次のとおりであることに注意してください。

元の観測範囲を超えて、変数の値を別の変数との関係に基づいて推定するプロセス。

...したがって、それは非常に広義の用語であり、単純な線形外挿から線形回帰、多項式回帰、またはそのような定義に適合するいくつかの高度な時系列予測方法に至るまで、さまざまな方法があります。実際、外挿、予測、予測は密接に関連しています。統計では、しばしば作る予測と予測を。これはまたあなたが参照するリンクが言っていることです:

統計の1日目から、外挿は大したことではありませんが、それがまさに予測です。

多くの外挿法予測の作成に使用され、さらに、いくつかの単純な方法は小さなサンプルで非常にうまく機能することが多いため、複雑な方法よりも優先される可能性があります。問題は、他の回答で気づかれたように、外挿法を不適切に使用した場合です。

たとえば、多くの研究は、西洋諸国では性的開始の年齢が時間とともに減少することを示しています。米国の最初の性交の年齢について下のプロットを見てください。最初の性交の年齢を予測するために盲目的に線形回帰を使用した場合、数年でゼロ未満になると予測します(最初の結婚と死後のある時点で起こる最初の出生に応じて)...ただし、 1年先の予測、線形回帰はトレンドのかなり正確な短期予測につながると思います。

ここに画像の説明を入力してください

(ソースguttmacher.org

すべてのモデルが間違っていて、正確な予測をすることができないため、外挿も間違っています。他の数学/統計ツールとして、おおよその予測を行うことができます。それらがどの程度正確であるかは、問題に適した方法を使用して、データの品質、モデルの定義中に行った仮定、およびその他の多くの要因に依存します。しかし、これはそのような方法を使用できないという意味ではありません。私たちはできますが、それらの制限について覚えておく必要があり、特定の問題の品質評価する必要があります。


4
回帰に使用するデータが1980年代初頭に終了すると、おそらく、その日付の外挿がどれくらいの期間機能するかを簡単にテストできます。
gerrit

@gerrit私は同意しますが、残念ながら適切なデータを見つけることができませんでした。しかし、誰かが私にそれを指し示すことができれば、そのような比較のために私の答えを更新させていただきます。
ティム

この場合、最初の性の年齢が過去数年で急上昇したことを考えると、外挿は失敗します。(しかし、このデータは、明らかなはずの理由により、常に誕生年より数十年遅れています。)
デビッド・マンハイム

13

Nassim Talebによる例(Bertrand Russellによる以前の例の改作)は非常に気に入っています。

毎日給餌される七面鳥を考えてみましょう。政治家が言うように、一つ一つの給餌は、人類の友好的な人々が「その最善の利益を探して」毎日給餌することが人生の一般的なルールであるという鳥の信念を固めます。感謝祭の前の水曜日の午後、七面鳥に予期しないことが起こります。それは信念の改訂を招きます。

いくつかの数学的類似物は次のとおりです。

  • 関数の最初のいくつかのテイラー係数の知識は、後続の係数が推定パターンに従うことを常に保証するわけではありません。

  • 微分方程式の初期条件の知識は、その漸近的な挙動の知識を常に保証するものではありません(例えば、いわゆる「バタフライ効果」にゆがめられるローレンツの方程式)

これに関する素晴らしいMOスレッドがあります。


3
…そしてもちろん、タレブは道徳的な教訓を指摘しなければなりません「七面鳥にならないでください」!この文脈では、不注意な外挿者にならないでください。hub慢の罪に屈しないでください。
JMは統計学者ではない

@uoɥʇʎPʎzɐɹC、私はそれを求めていませんでしたが、ありがとう!
JMは統計家ではありません

相互検証された評判を実際に使用しないでください-そして誰もあなたの答えを見なかったし、それは本当に良かったです。楽しい!
noɥʇʎԀʎzɐɹƆ

12

必要に応じて、次のストーリーを検討してください。

統計コースに座っていたことも覚えています。教授は、外挿は悪い考えだと言っていました。それから次のクラスで、彼はそれが再び悪い考えだと言った。実際、彼は二度言った。

私は学期の残りは病気でしたが、多くの資料を見逃すことはできなかったと確信していました。 。

奇妙なことに、私は試験で非常に高いスコアをつけませんでした。


6
質問は、「外挿の何が問題になっていますか?」と尋ねます。外挿が悪い考えである理由を与える答えを探しています。
ロバートロング

8
@RobertLong:それは実際には一種のメタ/ジョークの回答であり、xkcd.com / 605にかなり似ています -回答よりもコメントとしても良いかもしれません。
ニールスレーター

@NeilSlater:あなたは:) ...答えとしてあなたのコメントを掲載している必要があります
usεr11852が復活モニック言う

@RobertLong:これはそういう答えです。それは単にたとえ話の形をしています。
アインポクルム-モニカの復活

2
モデルが指数関数的であることは明らかではありません。
gerrit

6

問題は単なる統計的なものではなく、認識論的でもあります。外挿は、自然について学ぶ方法の1つで、帰納法の一種です。摂氏0〜20度の温度範囲で材料の電気伝導度のデータがあるとします。摂氏40度の伝導度についてはどうでしょうか。

これは、少量のサンプルの推測と密接に関係しています。少量のサンプルで行われた測定から、母集団全体について何が言えるでしょうか。これは、ギネスとしてゴセットによって開始されました、スチューデントのt分布を考え出しました。彼の前では、統計学者は、サンプルサイズが常に大きくなる可能性があると仮定して、小さなサンプルについて悩むことはありませんでした。彼はギネスにいて、ビールのサンプルを処理して、出荷するビールのバッチ全体をどうするかを決定しなければなりませんでした。

そのため、実際の(ビジネス)、エンジニアリング、および科学では、常に何らかの方法で外挿する必要があります。小さなサンプルを大きなサンプルに外挿したり、入力条件の限られた範囲から、加速器で起こっていることから、数十億マイル離れたブラックホールに起こったことなど、より幅広い条件にしたりすることができます。 、外挿推定値と実際の測定値との間の不一致を調査することによって実際に学習します。多くの場合、不一致が大きいか一貫しているときに新しい現象が見つかります。

したがって、外挿に問題はないと言います。毎日やらなければならないことです。難しいだけです。


4

外挿自体は必ずしも悪ではありませんが、内挿で到達するよりも不合理な結論に導くプロセスです。

  • サンプリングされた領域からかなり離れた値を調べるために、しばしば外挿が行われます。0から10までの100個の値をサンプリングし、わずか11に外挿すると、新しいポイントは、どの補間よりも10倍遠くなります。これは、変数が(質的に)手に負えなくなるほどのスペースがあることを意味します。意図的にマイナーな外挿のみを選択したことに注意してください。それははるかに悪化する可能性があります
  • 外挿は、外挿を行うことを目的としたカーブフィットで行う必要があります。たとえば、多くの多項式近似は外挿には非常に貧弱です。なぜなら、サンプリングされた範囲でうまく機能する項は、離れると爆発する可能性があるからです。良い外挿は、サンプリングされた領域の外側で何が起こるかについての「良い推測」に依存します。それは私に...をもたらします
  • 相転移が存在するため、外挿を使用するのは非常に難しい場合がよくあります。外挿したい多くのプロセスには、サンプリングされた領域で十分に露出されない明らかに非線形の特性があります。音速の周りの航空学は素晴らしい例です。低速での多くの外挿は、空中の情報転送の速度に到達してそれを超えるとばらばらになります。これは、ポリシー自体がポリシーの成功に影響を与える可能性があるソフトサイエンスでも頻繁に発生します。ケインズ経済学では、さまざまなインフレ水準での経済の振る舞いを推定し、可能な限り最良の結果を予測しました。残念ながら、二次的な影響があり、結果は経済的繁栄ではなく、米国が見た最高のインフレ率の一部でした。
  • 外挿が好きな人。一般的に言えば、人々はクリスタルボールを覗き込んで未来を語ってほしいと本当に望んでいます。彼らは、それが持っているすべての情報であるという理由だけで、驚くほど悪い外挿を受け入れます。これにより、外挿自体が悪くなることはありませんが、それを使用するときに考慮する必要があることは間違いありません。

究極の外挿については、マンハッタンプロジェクトを検討してください。そこで物理学者は、実物を構築する前に非常に小規模なテストを行うことを余儀なくされました。彼らは単にテストに浪費するのに十分なウランを持っていませんでした。彼らは最善を尽くし、頭がよかった。しかし、最終テストが行​​われたとき、各科学者は、爆発したときの爆風からの距離を決定することが決定されました。すべての科学者が彼らが彼らのテストからかなり遠い外挿していることを知っていたので、どれくらい遠くが「安全」であるかに関して意見の実質的な違いがありました。彼らが核爆弾で大気に火をつけるかもしれないという些細な考慮すらありませんでした。問題はまた、かなりの外挿で解決されました!


3

ここでたくさんの良い答えがあります。私は問題の核となるものを試してみて合成したいだけです。推定サンプルを生み出したデータ生成プロセスを超えて外挿するのは危険です。これは「構造変化」と呼ばれることもあります。

予測には前提があります。主なものは、データ生成プロセスが(有意な差が生じない限り)サンプルを生成したプロセスと同じであるということです(モデルで明示的に変更を考慮するrhs変数を除く) 。構造的な変更が発生した場合(つまり、タレブの例の感謝祭)、すべての賭けはオフになります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.