私は機械学習の基本についてのチュートリアルに従っていますが、何かが機能またはラベルである可能性があると述べられています。
私が知っていることから、機能は使用されているデータのプロパティです。ラベルが何であるかわからない。言葉の意味はわかっているが、機械学習の文脈でそれが何を意味するのか知りたい。
私は機械学習の基本についてのチュートリアルに従っていますが、何かが機能またはラベルである可能性があると述べられています。
私が知っていることから、機能は使用されているデータのプロパティです。ラベルが何であるかわからない。言葉の意味はわかっているが、機械学習の文脈でそれが何を意味するのか知りたい。
回答:
簡単に言うと、特徴は入力です。ラベルが出力されます。これは分類と回帰の両方の問題に適用されます。
特徴は、入力セット内のデータの1列です。たとえば、誰かが選択するペットのタイプを予測しようとしている場合、入力機能には年齢、居住地域、家族の収入などが含まれる可能性があります。ラベルは犬、魚、イグアナ、ロックなどの最終的な選択です等
モデルをトレーニングしたら、それらの機能を含む新しい入力のセットをモデルに提供します。その人の予測された「ラベル」(ペットタイプ)を返します。
特徴:
機械学習機能では、トレーニングデータのプロパティを意味します。または、トレーニングデータセットの列名を言うこともできます。
これがトレーニングデータセットであるとします
Height Sex Age
61.5 M 20
55.5 F 30
64.5 M 41
55.5 F 51
. . .
. . .
. . .
. . .
そこでここではHeight
、Sex
およびAge
機能です。
ラベル:
トレーニング後にモデルから取得する出力は、ラベルと呼ばれます。
上記のデータセットをアルゴリズムにフィードし、性別を男性または女性として予測するモデルを生成するとします。上記のモデルではage
、height
などの機能を渡します。
したがって、計算後、性別は男性または女性として返されます。それはラベルと呼ばれています
手書きの写真を使用してアルファベットを検出する例を見てみましょう。これらのサンプル画像をプログラムにフィードし、プログラムは、取得した機能に基づいてこれらの画像を分類します。
このコンテキストでの機能の例は、次のとおりです。文字'C'
は、右向きの凹型のように考えることができます。
これらの機能をどのように保存するかという疑問が生じます。それらに名前を付ける必要があります。これが誕生したレーベルの役割です。このような機能には、他の機能と区別するためのラベルが付けられています。
したがって、機能を入力として提供すると、出力としてラベルを取得します。
ラベルは教師なし学習に関連付けられていません。
前提条件:基本統計とML(線形回帰)への露出
文で答えることができます-
それらは似ていますが、必要に応じて定義が変わります。
私の声明を説明させてください。データセットがあるとしましょうexercise.csv
。この目的のために、を検討してください。データセットの各列は、特徴と呼ばれます。性別、年齢、身長、心拍数、Body_temp、およびカロリーは、さまざまな列の1つです。各列は、個別の機能またはプロパティを表します。
User_ID Gender Age Height Weight Duration Heart_Rate Body_Temp Calories
14733363 male 68 190.0 94.0 29.0 105.0 40.8 231.0
14861698 female 20 166.0 60.0 14.0 94.0 40.3 66.0
11179863 male 69 179.0 79.0 5.0 88.0 38.7 26.0
理解を固め、パズルをクリアするために、2つの異なる問題(予測ケース)を取り上げます。
ケース1:このケースでは、性別、身長、体重を使用して、運動中に消費されるカロリーを予測することを検討します。その予測(Y)カロリーはここにラベルです。カロリーは、-x1:性別、x2:高さ、x3:重量などのさまざまな機能を使用して予測する列です。
CASE2:2番目のケースでは、GenderとWeightを機能として使用して、Heart_rateを予測できます。ここで、Heart_Rateは、機能を使用して予測されたラベルです-x1 :Genderおよびx2:Weight。
上記の説明を理解すれば、LabelやFeaturesと混同されることはもうありません。