高次のスプライン補間


8

次数が3を超えるスプライン補間(3次スプラインを超えるものすべて)には非常に高い補間エラーがあるため、予測はほとんどひどいことに気付きました。私は、3次スプライン(3次)が最適であり、それ以上のものは悪い考えであることを簡単に示す、さまざまな講義ノート、スライド、およびYouTubeビデオに出くわしました。しかしながら、これらの情報源は、なぜこれが事実であるかについて決して言及しません。

誰もがこれが事実である理由を私に説明できますか、おそらくこれを説明するジャーナル/会議論文へのタイトル/リンクを与えたり、多分証拠を与えることさえできます。


1
私はこの過剰適合現象を参照する必要がありますが、これについて言及している学術文献は見つかりません。あなたは多分私が使用できる記事/本/論文を知っていますか?
goocreations 2013年

回答:


10

それが常に真であるとは限らないので、そのような証明はありません。これは経験則です。なぜなら、高次のスプラインの方が3次のスプラインよりも優れているという状況(実際には無限の状況)が発生する可能性があることを保証するためです。特定の状況での最適なスプラインの順序は、モデル化しようとしているシステムとまったく同じです。順序が同じでデータポイントにエラーがない場合(もちろん、理論上の問題を除いて、ケースがまったくない場合)、システムを完全にモデル化できるはずです。

3次スプラインよりも高くしないことを推奨する理由は、過剰適合が本当に悪いためです。過剰適合はエラーを大幅に拡大する可能性がありますが、「適合不足」(モデリングしているシステムの次数よりも低い次数のスプライン法を選択する)は、それほど悪くない、または時には有益なローパスフィルタリングを導入します。


+1。表現しているモデルよりも低い次数の近似を選択することは、「疑似」ローパスフィルタリングではないことに注意してください。これ、それ自体がローパスフィルタリングの一種です。
Tarin Ziyaee 2013年

@ user4619その通りです。私が通常FIRおよびIIRフィルターについて考えるという意味では、それはローパスフィルターリングではないことを意味しましたが、それはローパスフィルターリングであり、簡単に特徴付けることができないだけです。回答を編集しました。
ジム・クレイ

3

大まかな概要は次のとおりです(これは正しい場合と正しくない場合があります)。スプラインは多項式補間です。つまり、隣接するサポートポイント間の曲線のすべてのセクションは多項式です。次数Nの多項式は、N + 1の係数(自由度)を持つため、セクションごとに4つの境界条件を満たすことができます。境界条件の選択により、補間のタイプが決まります。サポートポイントに正確に当たって連続的な1次および2次導関数を作成しているスプラインの場合。

高次のスプラインでは、高次の導関数を連続的にすることもできますが、より急な遷移で多くの高周波成分が追加される傾向があり、多くの場合、「リンギング」または過度の振動が発生します。元の「スプライン」という言葉は、人々が「機械的」補間を行うために使用した柔軟な定規に由来しています。ルーラーの力学を分析することで、3次スプラインがその動作に一致することを実際に示すことができると思います。

ほとんどの場合と同様に、それはアプリケーションと何をしたいかによって異なります。3次スプラインの興味深い代替手段は、単調性を保証し、補間がサポートポイントの外側で変動しないことを確認できるエルミート補間です。MATLABヘルプ関数から

Tips

spline constructs  in almost the same way pchip constructs . However, spline chooses the slopes at the  differently, namely to make even  continuous. This has the following effects:

   - spline produces a smoother result, i.e.  is continuous.    
   - spline produces a more accurate result if the data consists of values of a smooth function.    
   - pchip has no overshoots and less oscillation if the data are not smooth.    
   - pchip is less expensive to set up.
   - The two are equally expensive to evaluate.

2

スプラインにはいくつかの種類があり、目標が矛盾しています。

  • 入力データポイントの近くに行きます
  • 滑らかな曲線と波打つ

いくつかのデータポイントについては、正確に内挿したい場合があります。しかし、数千のポイント、またはノイズのある12のポイントの場合、正確に補間すると小刻みに動きます。ほとんどのスプラインフィッタには、近似の近似度と全体的な滑らかさのトレードオフのパラメータがあります。以下は、データ=ライン+ノイズの次数1のスプライン(区分的に線形、ドットを接続)のプロットです。データを正確にジグザグにフィッティングすると、最大平滑化により直線が得られます。

ここに画像の説明を入力してください 入力データとその間の新しいポイントに応じて、さまざまなジョブにスプラインがあります:数十/数百万のポイント、ノイズの多い、散在/グリッド上、1d 2d 3d ...たとえば、3dの通常のグリッドでは、程度のスプライン d 見ます d+1各クエリポイントの近傍:1(最も近い近傍)、8(トリリニア)、27、64 ... 64の余裕がありますか?64必要ですか?場合によります。

(非常に簡単に言うと、Bスプラインは滑らかで、
Catmull-Romスプラインは補間します。たとえば、映画のフレーム
。1/ 3 B + 2/3 CRのような混合は、その間に便利です。)

多項式次数はウィグリネスにどのように影響しますか?ルンゲの現象を参照してください。

1d 2d 3dのオーバーシュートについて... math.stackexchangeでこの質問を参照してください 。
線形を超えるスプラインを使用した外挿の危険性については、SOでこれを参照してください。

stackoverflow.com/questions/tagged/splineもご覧ください 。


-1

これを見る別の方法は、最も興味深い画像とデータセットがある程度「滑らか」であることに気づくことです。たとえば、ガウスノイズの補間は、高次のスプラインでより適切に機能します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.