損失関数と決定関数の違いは何ですか?


回答:


45

決定機能は、入力としてデータセットを受け取り、出力として決定を与える関数です。何を決定できるかは、目の前の問題に依存します。例は次のとおりです。

  • 推定問題:「決定」は推定です。
  • 仮説検定の問題:帰無仮説を棄却するか否かを決定します。
  • 分類の問題:新しい観測(または複数の観測)をカテゴリに分類することが決定されます。
  • モデル選択の問題:決定は、候補モデルの1つを選択することです。

通常、問題に対して使用できる決定関数の数は無限です。例えば、10個の観測に基づいてスウェーデンの男性の身長を推定することに興味がある場合、次の決定関数d x)のいずれかを使用できます。バツ=バツ1バツ2バツ10dバツ

  • サンプル平均:dバツ=110=110バツ
  • サンプルの中央値:dバツ=中央値バツ
  • サンプルの幾何平均:dバツ=バツ1バツ1010
  • :常に1を返すこと関数、にかかわらずの値のX。馬鹿げていますが、それでも有効な決定関数です。dバツ=1バツ

これらの決定関数のどれを使用するかをどのように決定できますか?1つの方法は、可能なすべての決定に関連する損失(またはコスト)を記述する損失関数を使用することです。異なる決定関数は、さまざまなタイプのミスにつながる傾向があります。損失関数は、どのタイプの間違いをもっと気にする必要があるかを教えてくれます。最適な決定関数は、予想される損失が最小になる関数です。予想される損失が意味することは、設定によって異なります(特に、頻度統計またはベイジアン統計について話しているかどうか)。

要約すれば:

  • 決定関数は、データに基づいて決定を行うために使用されます。
  • 損失関数は、使用する決定関数を決定するために使用されます。

パラメトリック決定関数(例:ロジスティック回帰、しきい値決定)には、基本的に各パラメーターの組み合わせに対して1つの可能な関数があり、損失関数を使用して最適な関数を見つけます。一般的な例:勾配降下を使用してパラメーター空間を探索する場合、パラメーターに関して損失を導き出し、損失の(局所的な)最小値まで下がります。
-pixelou

7

損失関数は、ある意味で最適なモデルを得るために最小化されるものです。モデル自体には、予測に使用される決定関数があります。

たとえば、SVM分類子の場合:

  • Lwξ=12w2+Cξ
  • fバツ=wTバツ+b

ノルムは距離に等しくないのですか、それともここで何かを混同しますか...だから、決定関数は常にモデルを修正しようとする実際の値と「比較」するために使用する損失関数の一部ですか?そして、目標はこの「差異」を最小限に抑えることですか?
www.pieronigro.de 14年

@Hiatus分離超平面のノルム(SVMのトレーニング時に最適化されています)は、決定関数では使用されません。超平面自体が使用されます。トレーニング中の規範の最小化は、基本的には正則化の形式です。
マーククレセン14年

特定の分類子に結び付けられていない、より一般的な答えを与える方が良いでしょう。
-smci
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.