補間の意味を簡単に説明してください。回帰の概念とどのように関連していますか?
補間は、テーブルの行間を読み取る技術であり、初等数学では、この用語は通常、関数の与えられた値または表値のセットから関数の中間値を計算するプロセスを示します。
2番目の質問には答えられません。助けてください
補間の意味を簡単に説明してください。回帰の概念とどのように関連していますか?
補間は、テーブルの行間を読み取る技術であり、初等数学では、この用語は通常、関数の与えられた値または表値のセットから関数の中間値を計算するプロセスを示します。
2番目の質問には答えられません。助けてください
回答:
補間と回帰の主な違いは、それらが解決する問題の定義です。
与えられたあなたが補間したときに、データポイント、あなたが指定したとおりにそのポイントの値を持っているいくつかの定義済みの形式である機能を探してください。これは、与えられたペアがを満たす事前に定義された形式のを探すことを意味します。最も一般的には、は多項式、スプライン(特定のポイント間の間隔の低次多項式)に選択されると思います。
回帰を行うとき、通常はエラーの二乗和であるコストを最小化する関数を探します。関数が与えられたポイントで正確な値を持っている必要はなく、ちょうど良い近似が必要です。一般に、見つかった関数はどのデータポイントでもを満たさない可能性がありますが、コスト関数、つまりが最小になります与えられた形式のすべての機能の可能性。
補間の代わりに近似値のみを使用する理由の良い例は、株式市場の価格です。あなたは、いくつかの中で値段を取ることができ時間の最近の単位、および次の時間単位での価格のいくつかの予測を得るためにそれらを補間してみてください。これはかなり悪い考えです。価格間の関係を多項式で正確に表現できると考える理由がないためです。しかし、価格にはある程度の「勾配」があり、少なくとも局所的に線形関数が適切な近似となる可能性があるため、線形回帰がトリックを行う可能性があります(ヒント:それほど簡単ではありませんが、この場合、補間は間違いなくより良いアイデアです)。
これまでの2つの回答では、線形補間と線形回帰(または一般的な補間と多項式回帰)の関係について説明しました。しかし、重要な関係は、回帰モデルを適合させると、それを使用して特定のデータポイント間を補間できることです。
簡単な例と視覚化により、これがかなり早く実現することを願っています。
次のデータがあるとします。
X Y
1 6
10 15
20 25
30 35
40 45
50 55
Xへの応答としてYをモデル化するために回帰を使用できます。Rを使用します。
lm(y ~ x)
結果は、5の切片と1のxの係数です。つまり、任意のYは、X + 5として与えられたXに対して計算できることを意味します。
X軸に沿って任意の場所に移動し、フィット線まで線を引き、Y軸まで線を引いた場合、値ポイントを提供したかどうかに関係なく、値を取得できることに注意してください。 Y.回帰は、基礎となる関係を推定することにより、データのない領域を平滑化します。
次のように補間し、回帰ワット基本的な相違点bは/です:補間:ポイント(例:10データポイント)のnが存在すると仮定し、補間に私たちは収まるすべてのデータ点を通る曲線を(つまり、ここでは10個のデータ・ポイント)は、Aと多項式の次数(no.of data points -1;すなわち、ここでは9)。回帰のように、すべてのデータポイントではなく、それらのセットのみが曲線近似に必要です。
一般に、次数が3を超える場合、補間と回帰の次数は(1,2または3)になり、より多くの振動が曲線に表示されます。
回帰は、最適なラインを見つけるプロセスです[1]。補間は、使用している値がデータの範囲内にある場合、最適なラインを使用して、ある変数の値を別の変数の値から推定するプロセスです。範囲外の場合は、Extrapolation [1]を使用しています。
[1] http://mathhelpforum.com/advanced-applied-math/182558-interpolation-vs-regression.html
補間またはスプラインフィッティングを使用すると、サイズが大きい数値データ(元のデータの各ペア間で補間された)が得られ、プロットすると滑らかな曲線の効果が生成されます。実際には、元のデータの各ペアの間に異なる多項式が適合しているため、補間後の曲線全体は区分的に連続した曲線になり、各断片は異なる多項式で形成されます。
元の数値データのパラメトリック表現を探している場合は、回帰を実行する必要があります。スプラインに高次の多項式を当てはめることもできます。いずれにせよ、表現は近似になります。また、近似の精度を確認することもできます。
回帰と補間の両方を使用して、別の変数(X)の特定の値に対する変数(Y)の値を予測します。回帰では、独立変数(X)の特定の値について、従属変数(Y)の任意の値を予測できますが、表の値の範囲外であっても、補間の場合は、従属変数の値のみを予測できます(Y)与えられたXの値の範囲内にある独立変数(X)の値。
補間は、x = aとx = bの間の多数の点を補間多項式に正確に適合させるプロセスです。補間を使用すると、回帰手法よりも高い精度で、ドメインx = [a、b]のyの近似値(または欠損値)を見つけることができます。
一方、回帰は、最小の二乗誤差でポイントを通過するか、ポイントの近くを通過する曲線に多くのポイントを適合させるプロセスです。回帰は、x = [a、b]領域のyの値を補間ほど正確に近似しませんが、回帰はx =(-infinity、a)とx =(の間の領域のyの値の補間よりも優れた予測を提供しますb、+∞)。
要約すると、補間により、既知のx範囲のドメイン内でyの値の精度が向上し、回帰により、既知のx範囲以下およびそれ以上のドメインでyの予測が向上します。