他のファイルからの論文を読むとき、私は同様の質問をしました。そして、これに関連する多くの質問をしました。たとえば、教育データマイニングコミュニティでの
質問です。ロジスティック損失の代わりに確率で平方損失を使用するのはなぜですか?
ここで私は多くの個人的な意見を提示します。
多くの実際のユースケースでは、損失関数はあまり重要ではないと感じています。一部の研究者は、二乗損失についてより詳しく知っており、そのシステムを構築しますが、実際に機能し、現実の問題を解決します。研究者は、ロジスティック損失またはヒンジ損失を決して知らず、それを試してみたいと思うかもしれません。さらに、彼らは最適な数学モデルを見つけることに興味がないかもしれませんが、誰も以前に解決しようとしなかった本当の問題を解決したいです。
これは別の例です。私の質問に対するこの答えを確認すると、それらはすべて似たようなものです。0-1損失を近似するために分類で異なる損失関数を選択することの影響は何ですか
さらなる考え:機械学習の研究では、選択するモデルとモデルの最適化方法に多くの時間がかかる場合があります。これは、機械学習の研究者が、より多くのデータを収集したり、より多くの指標を取得したりする能力を持っていない可能性があるためです。そして、機械学習の研究者の仕事は、特定の現実世界の問題をより良く解決するのではなく、より良い数学を得ることです。
一方、現実の世界では、データが優れていれば、あらゆるものに勝ります。したがって、ニューラルネットワークまたはランダムフォレストを選択することはそれほど重要ではありません。これらのモデルはすべて、現実世界の問題を解決するためのツールとして機械学習を使用したい人に似ています。数学やツールの開発に興味のない人は、特定の分野の知識を使用してシステムを改善するためにより多くの時間を費やす可能性があります。
コメントで述べたように。そして、もし人が数学をだらしなくても、彼/彼女はまだ何か動くものを作ることができます。