モデルはデータに適合していますか、またはデータはモデルに適合していますか?


20

モデルをデータに適合させることとデータをモデルに適合させることの間に概念的または手順上の違いはありますか?最初の文言の例はhttps://courses.washington.edu/matlab1/ModelFitting.htmlに、2番目の例はhttps://reference.wolfram.com/applications/eda/FittingDataToLinearModelsByLeast-SquaresTechniques.htmlにあります。


7
+1 2番目のリンクには感心しませんが、楽しかったです。
ラコニック

多くのモデルは現在のデータに適合しますが、通常、データは最適な 1つのモデルに適合します
Agnius Vasiliauskas

回答:


35

リンクしたWolframソース以外のほとんどすべてのソースまたは個人は、プロセスをモデルをデータに適合せることを指します。モデルは動的オブジェクトであり、データは静的(別名固定および定数)であるため、これは理にかなっています。

それを強調するために、私はこれに対するラリー・ワッサーマンのアプローチが好きです。彼の話では、統計モデルは分布の集合です。たとえば、すべての正規分布のコレクション:

{普通μσμσRσ>0}

または、すべてのポアソン分布のセット:

{ポアソンλλRλ>0}

データへの分布のあてはめは、統計モデルとデータのセット(データは固定)を組み合わせたアルゴリズムであり、データを「最適」に反映するものとしてモデルから分布の1つを選択します。

モデルは変化するものです(ある種):可能性のコレクション全体から単一の最良の選択へと折りたたんでいます。データは単なるデータです。何も起こりません。


16

Raschモデリングの分野では、データをモデルに合わせるのが一般的です。モデルは正しいと見なされ、それに適合するデータを見つけることはアナリストの仕事です。Wikipediaの記事ラッシュには、どのように、なぜについての詳細が含まれています。

しかし、一般的に統計ではモデルをデータに適合させることができるため、モデルを変更することはできますが、データを選択または変更するのは悪い形式であると感じているという点に同意します。


7

通常、観察されたデータはモデルが可変である間は固定されているため(たとえば、パラメーターが推定されるため)、データに適合するように作成されたのはモデルであり、その逆ではありません。(通常、どちらかの表現を言うとき、人々はこのケースを意味します。)

データをモデルに適合させると人々が言うとき、私は自分がデータに対して何をしたのを理解しようとしていることに気付きますか?

[今、データを変換している場合、それは間違いなく「データをモデルに適合させる」ことになりますが、人々はこのケースではほとんどそれを言いません。]


5
外れ値を削除することも(おそらく)「モデルにデータを適合させる」ことになります。
フェデリコポロニ

1
フレージングは​​、「フィッティング(モデルへのデータ)」と考えている場合に意味があります。つまり、あなたはフィッティングのプロセスを行っており、そのフィッティングのプロセスはデータから始まり、それをモデルに変換します。「(X)をYにフィッティングする」解析と比較すると、これはあまり一般的ではなく正確な解釈であることに同意しますが、誰かが論理的にそれを言う理由についての根拠としてそこに出しました。
RM

1
@FedericoPoloni外れ値は通常、後で使用するモデルとは無関係に定義されます。したがって、フィッティングデータと呼びたいとしても、それはモデルではなく、他のものになります。
BartoszKP

1
+1。「データ」と呼ばれる理由があります-これは与えられたものです。単語のラテン語の起源を参照してください:latindictionary.wikidot.com/verb
Christoph

2

通常、データは「実世界」に対応していると仮定し、変更を加えることは「実世界」のモデリングから離れることを意味します。たとえば、外れ値を削除する際は注意が必要です。たとえそれが計算をより良くしても、外れ値はまだデータの一部であるからです。

モデルをテストしたり、ブートストラップまたはその他のリサンプリング手法を使用して推定器のプロパティを推定する場合、推定モデルと元のデータを使用して新しいデータシミュレートできます。これにより、モデルが正しいと仮定され、元のデータは変更されません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.