基礎となる分布を常に想定しているわけではないため、この定義は完全には当てはまりません。では、実際にモデルとは何でしょうか?指定されたハイパーパラメーターを持つGBMをモデルと見なすことはできますか?モデルはルールのコレクションですか?
基礎となる分布を常に想定しているわけではないため、この定義は完全には当てはまりません。では、実際にモデルとは何でしょうか?指定されたハイパーパラメーターを持つGBMをモデルと見なすことはできますか?モデルはルールのコレクションですか?
回答:
最近同じ質問に興味があり、機械学習には「モデル」の単一の定義がないことに気づきました。これは、特定のソフトウェアプログラムのドキュメント、ユーザーコミュニティで採用されているスラング、ジャーナルごとに大きく異なる可能性がある公開された学術論文で使用されている定義など、参照しているソースに大きく依存しています。さらに、そのような論文は機械学習の専門家だけでなく、機械学習技術(画像、さまざまな医療分野など)を適用する必要がある他の分野の専門家によって書かれていることを覚えておかなければなりませんでした。 。それらの多くは、「モデル」という用語を明示的に定義していません。この用語は、大まかに使用されています。ここでは、「モデル」のいくつかの異なる定義を示します。
•統計モデル、特に確率分布に関連する統計。
•回帰データと関連する統計。
•上記のNeil Slaterが言及した数学モデル。
•関係する列、そのデータ型、データソース、その他のメタデータなど、機械学習で使用されるデータモデル。私がリストした最初の3つとは異なり、この定義について数学的なことはまったくないため、これは特にトリッキーです。例については、SQL Serverの「マイニングモデル」のすべてのドキュメントを参照してください。これらは、機械学習の目的で二重の役割を果たします。
•上記のすべての定義が拡張され、方程式の上に構築された機械学習構造とニューラルネットの仕様などのメタデータが含まれる場合があります。他の場合では、これらは別個のエンティティと見なされます。
ソースによっては、上記のすべてが混在している場合があります。私がこのリストから外した「モデル」の他の定義があると私は確信しています。それは問題をさらに複雑にするでしょう。このあいまいさに対処するために、著者が「モデル」という用語を使用するときはいつでも、著者の意図を理解できるように自分を訓練しようとしています。場合によっては、作成者が作業するコンテキストまたはフィールドに基づいて判断するのが簡単なこともありますが、それを理解する前に、記事またはドキュメントを深く読む必要があります。もっと明確にしたいのですが、実際にはあいまいな言葉です。これに対する簡単で万能な答えは決してありません。お役に立てば幸いです。
トムミッチェルの機械学習の定義が気に入っています。
コンピュータープログラムは 、Pで測定されるTのタスクでのパフォーマンスがエクスペリエンスEで向上する場合、タスクTの一部のクラスとパフォーマンスメジャーPに関してエクスペリエンス Eから学習すると言われています。
したがって、この定義を考えると、モデルはクラスTを実行した後に獲得した経験であると言う必要があります。
Amazon Machine Learningに関する記事から
MLモデルのトレーニングプロセスでは、MLアルゴリズム(つまり、学習アルゴリズム)に学習データを提供します。 The term ML model refers to the model artifact that is created by the training process.
大まかに言えば、モデルはあるものまたはプロセスの単純化です。たとえば、地球の形状は実際には球ではありませんが、地球を設計している場合は、それを1つの球として扱う場合があります。同様に、ユニバースが決定論的であると仮定すると、顧客がWebサイトで製品を購入するかどうかを決定するいくつかの自然なプロセスがあります。そのプロセスに近いものを作成する場合があります。これは、顧客に関する情報を提供でき、顧客が製品を購入すると考えているかどうかを通知します。
「機械学習モデル」は、機械学習システムによって構築されたモデルです。
(これは厳密な答えではないことをお詫びしますが、これがまだ役立つことを願っています。)