機能とラベルの違いは何ですか?


100

私は機械学習の基本についてのチュートリアルに従っていますが、何かが機能またはラベルである可能性があると述べられています。

私が知っていることから、機能は使用されているデータのプロパティです。ラベルが何であるかわからない。言葉の意味はわかっているが、機械学習の文脈でそれが何を意味するのか知りたい。


機能は入力として使用されるフィールドであり、ラベルは出力として使用されます。簡単な例として、車の走行距離や年などに基づいて車を売るべきかどうかを予測する方法を考えてみましょう。はい/いいえがラベルですが、走行距離と年が特徴です。
amcneil206

回答:


199

簡単に言うと、特徴は入力です。ラベルが出力されます。これは分類と回帰の両方の問題に適用されます。

特徴は、入力セット内のデータの1列です。たとえば、誰かが選択するペットのタイプを予測しようとしている場合、入力機能には年齢、居住地域、家族の収入などが含まれる可能性があります。ラベルは犬、魚、イグアナ、ロックなどの最終的な選択です等

モデルをトレーニングしたら、それらの機能を含む新しい入力のセットをモデルに提供します。その人の予測された「ラベル」(ペットタイプ)を返します。


1
したがって、[年齢、居住地域、家族の収入]は「3つの特徴ベクトル」になります。Kerasでは、LSTMネットワークのNumPy配列は[サンプル、タイムステップ、3]になりますか?
naisanza 2017

1
@naisanza:それは確かに1つの可能性です。私はKerasに精通していませんが、この高レベルの組織は確かに有効な実装の始まりである可能性があります。
プルーン

機能と変数は同じものですか?
Debadatta

「ラベル」もコンテキストに依存することを述べたいと思います。たとえば、モデルのトレーニングでは、「ラベル付けされた」データを使用します。この場合、ラベルは出力データが比較されるグラウンドトゥルースです。
N.Atanasov

ワオ。すばらしい回答です。これにより、このトピックスペースに関する多くの疑問が解消されます。
Andrew Ray

31

特徴:

機械学習機能では、トレーニングデータのプロパティを意味します。または、トレーニングデータセットの列名を言うこともできます。

これがトレーニングデータセットであるとします

Height   Sex   Age
 61.5     M     20
 55.5     F     30
 64.5     M     41
 55.5     F     51
 .     .     .
 .     .     .
 .     .     .
 .     .     .

そこでここではHeightSexおよびAge機能です。

ラベル:

トレーニング後にモデルから取得する出力は、ラベルと呼ばれます。

上記のデータセットをアルゴリズムにフィードし、性別を男性または女性として予測するモデルを生成するとします。上記のモデルではageheightなどの機能を渡します。

したがって、計算後、性別は男性または女性として返されます。それはラベルと呼ばれています


5

ここに、概念を説明するためのより視覚的なアプローチがあります。写真に表示されている動物を分類したいとします。

動物の可能なクラスは、例えば猫や鳥です。その場合、ラベルは、機械学習アルゴリズムが予測する可能なクラスの関連付け(猫や鳥など)になります。

機能は、パターン、色、あなたのイメージ例えばfurr、羽、またはそれ以上の低レベルの解釈、ピクセル値の一部である形態です。

鳥 レーベル: Bird
Features: Feathers

ネコ

レーベル: Cat
特徴: Furr


5

手書きの写真を使用してアルファベットを検出する例を見てみましょう。これらのサンプル画像をプログラムにフィードし、プログラムは、取得した機能に基づいてこれらの画像を分類します。

このコンテキストでの機能の例は、次のとおりです。文字'C'は、右向きの凹型のように考えることができます。

これらの機能をどのように保存するかという疑問が生じます。それらに名前を付ける必要があります。これが誕生したレーベルの役割です。このような機能に、他の機能と区別するためのラベルが付けられています。

したがって、機能を入力として提供すると、出力としてラベルを取得します

ラベルは教師なし学習に関連付けられていません


4

前提条件:基本統計とML(線形回帰)への露出

文で答えることができます-

それらは似ていますが、必要に応じて定義が変わります。

説明

私の声明を説明させてください。データセットがあるとしましょうexercise.csv。この目的のために、を検討してください。データセットの各列は、特徴と呼ばれます。性別、年齢、身長、心拍数、Body_temp、およびカロリーは、さまざまな列の1つです。各列は、個別の機能またはプロパティを表します。

エクササイズ.csv

User_ID  Gender Age  Height  Weight Duration    Heart_Rate  Body_Temp   Calories
14733363 male   68  190.0   94.0    29.0           105.0    40.8        231.0
14861698 female 20  166.0   60.0    14.0            94.0    40.3        66.0
11179863 male   69  179.0   79.0    5.0             88.0    38.7        26.0

理解を固め、パズルをクリアするために、2つの異なる問題(予測ケース)を取り上げます。

ケース1:このケースでは、性別、身長、体重を使用して、運動中に消費されるカロリーを予測することを検討します。その予測(Y)カロリーはここにラベルです。カロリーは、-x1:性別、x2:高さ、x3:重量などのさまざまな機能を使用して予測する列です。

CASE2:2番目のケースでは、GenderとWeightを機能として使用して、Heart_rateを予測できます。ここで、Heart_Rateは、機能を使用し予測されたラベルです-x1 :Genderおよびx2:Weight

上記の説明を理解すれば、LabelやFeaturesと混同されることはもうありません。


3

簡単に説明した機能は、システムに入力した入力であり、ラベルは期待した出力です。たとえば、犬の身長や毛皮の色など、犬の多くの特徴を与えたので、計算すると、知りたい犬の品種が返されます。


0

気候を予測したい場合、与えられる特徴は過去の気候データ、現在の天気、気温、風速などであり、ラベルは月です。上記の組み合わせは、予測を導き出すのに役立ちます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.