回答:
データからモデルを構築する方法と、モデルの構築後にモデルの精度を定量化する方法はわかりにくいと思います。
モデルを作成する場合(おそらく、線形回帰ではないでしょうか?)、線とデータポイント間の「合計」ユークリッド距離を最小化する最小二乗誤差法を通常使用します。理論的には、この線の係数は微積分を使用して見つけることができますが、実際には、アルゴリズムはより速い勾配降下を実行します。
モデルを取得したら、そのパフォーマンスを評価します。したがって、回帰の場合、平均して実際のデータポイント(またはテストセットデータがある場合はテストセットデータ)に対するモデルの「距離」を評価するメトリックを計算するとよいでしょう。MSEは、あなたが使いたいと思う良い見積もりです!
要約すると、LSEはモデルを構築する方法であり、MSEはモデルのパフォーマンスを評価するメトリックであることを覚えておいてください。
MSE(平均二乗誤差)は二乗誤差の平均、つまり推定量と推定量の差です。MMSE(最小平均二乗誤差)は、MSEを最小化する推定量です。したがって、LSEとMMSEはどちらも推定量であるため、比較できます。LSEとMSEは、Anilが指摘しているように比較できません。理論的には、MMSEとLSEの間にはいくつかの重要な違いがあります。
MMSEはプロセスのすべての実現に最適であり、LSEは特定のデータ自体に最適です。これは、MMSEがアンサンブル平均(期待値)を使用するのに対し、LSEは時間平均を使用するためです。
実際の意味は次のとおりです。1. MMSEの場合、データの2次統計特性(相互相関と自己相関)を知る必要がありますが、LSEの場合はデータのみが必要です。自己相関と相互相関は計算コストが高く、正確な計算には多くのデータポイント/実験が必要です。2. MMSE係数はプロセスに最適であるため、プロセスのすべてのデータセットに最適であり、LSEは特定のデータセットにのみ最適です。データセットが変更された場合、LSE係数は最適のままではありません。
また、プロセスがエルゴードで、データポイントの数が無限に近づくと、MMSEはLSEに近づきます。