補間の統計的正当化とは何ですか?


16

2つのポイント(次の図:黒丸)があり、それらの間の3番目のポイント(クロス)の値を検索するとします。実際、実験結果である黒点に基づいて推定します。最も単純な場合は、線を引き、値を見つけることです(つまり、線形補間)。たとえば、両側に茶色のポイントなどのサポートポイントがある場合、それらの恩恵を受けて、非線形曲線(緑色の曲線)に適合することを好みます。

問題は、赤十字を解決策としてマークする統計的推論は何ですか?なぜ他の十字架(例:黄色の十字架)が、彼らがいるはずの答えではないのですか?どのような推論または(?)によって赤いものを受け入れるように促されますか?

この非常に単純な質問に対する回答に基づいて、元の質問を作成します。

ここに画像の説明を入力してください


7
これは非常によく提起された興味深い質問です。時系列には固有の方向性があるため、時系列補間と他の補間形式(スプライン補間や空間補間など)を区別したい場合があります。
whuber

1
私の感謝は、この非常にやる気を起こさせるコメントに行きます。
開発者

回答:


14

ノンパラメトリックなもの(通常、関係する曲線の滑らかさを仮定するもの)でさえ、あらゆる形式の関数近似には仮定が含まれ、したがって信頼の飛躍が伴います。

線形補間の古代の解決策は、持っているデータがきめ細かく「十分に」(ちょうど十分に近い円を見れば、同様に平らに見える-ちょうどコロンブスに聞いてください)「実行できる」ものですコンピュータ時代の前(これは多くの現代のスプラインソリューションには当てはまりません)。関数は2つのポイント間で「同じ(つまり線形)に続く」という信念を仮定することは理にかなっていますが、これには先験的な理由はありません(手元の概念に関する知識がなければ)。

3つ(またはそれ以上)の非共線ポイントがある場合(上記の茶色のポイントを追加する場合など)にすぐに明らかになります。各ポイント間の線形補間は、それらの各ポイントにすぐに鋭いコーナーが含まれることが一般的に望ましくありません。それは他のオプションが飛び込むところです。

ただし、さらにドメインの知識がなければ、1つのソリューションが他のソリューションより優れていることを確実に述べる方法はありません(このため、他のポイントの値が何であるかを知る必要があり、関数をフィッティングする目的に反します)最初の場所)。

明るい面で、そしておそらくあなたの質問により関連性がある、「規則性条件」(読み:仮定:関数が滑らかであることがわかっている場合)、線形補間と他の一般的なソリューションの両方が「合理的」であることが証明できます近似。それでも:それは仮定を必要とし、これらのために、通常統計がありません。


これは良い答えであり、答えとしてマークされる私の候補です。そのような共通の選択には統計的な正当性がないことを理解しましたよね?
開発者

確かに、私は誰もいないと信じています。
ニックサブベ

2
一部の文献(有名なデータセットのサンプルを補間するための競争を含む)は、この応答を部分的に検証していますが、完全には検証していません。「規則性条件」なしで、データのみの統計分析を通じて、データの空間相関について多くを学ぶことができます。必要なのは、(1)エルゴード仮説および(ほとんどの場合)(2)ある種の定常性の仮定とともに、確率過程の1つの実現のサンプルとしてのデータのモデルです。このフレームワークでは、補間は期待値の予測になりますが、微分不可能な曲線でさえ許可されます。
whuber

1
@whuber:私はここで快適地帯から抜け出しましたが、あなたのコメントの「規則性条件」の後のすべてはかなり堅実な量の仮定のように見えます(定常性は規則性条件に等しいでしょう、いいえ?)。実際には、サンプルのサイズが関数型の不規則性に関して大きいかどうかに依存すると思います...これが当てはまらない論文または同類の参考文献を提供できますか?
ニックサブベ

2
仮定なしでは何もできない、ニック!ただし、規則性(関数の滑らかさなど)は必要ありません。少なくとも関数がサンプリングされるスケールで、データから推定できます (定常性は、滑らかさよりもはるかに穏やかな仮定です。)大きなサンプルが必要であることは正しいですが、30〜50個の適切に選択されたサンプルの場所でも2Dで多くを学習できます。文献は膨大です。たとえば、数学地質学のほとんどの問題はこれに当てられています。厳密な紹介については、Cressieの空間統計を
whuber

0

最適な直線(たとえば、y = 0.4554x + 0.7525)の線形方程式を計算できますが、これはラベル付き軸がある場合にのみ機能します。しかし、これは他のポイントとの関係で最適なものだけを正確に答えるわけではありません。


しかし、回帰は補間ではありません。
Scortchi -復活モニカ

1
@Scortchi回帰は補間として理解できると思います。ただし、解決策として回帰を提案しても質問に答えることはできません。これはどのような種類の補間が正当化できるのを説明するように求めます(そして、それを正当化するために必要な仮定を暗黙的に説明するように誘います)。
whuber

@whuber:ありがとう。少なくともプロトタイプとして、補間をドットの結合-stats.stackexchange.com/a/33662/17230として考えていました
Scortchi -復活モニカ

@Scortchiそのスレッドは、主にテーブル内の補間の数学的概念に対応しています。その質問へのコメントで、私は微妙に異なる補間の従来の統計的理解を指摘しました。回帰は両方の世界で機能します:回帰関数は、(テーブルでサンプリングされる明確に定義された関数の)数学的補間と統計的補間の両方の役割を果たすことができます。そのプロセスから導出された有限数の値)。
whuber

1
nn
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.