例:仕事の説明に「英国のJavaシニアエンジニア」という文があります。
私は2つのカテゴリとして、それを予測することは、深い学習モデルを使用したい:English
とIT jobs
。従来の分類モデルを使用する場合softmax
、最後のレイヤーで機能を持つ1つのラベルのみを予測できます。したがって、2つのモデルのニューラルネットワークを使用して、両方のカテゴリで「はい」/「いいえ」を予測できますが、さらに多くのカテゴリがあると、コストがかかりすぎます。では、2つ以上のカテゴリを同時に予測するためのディープラーニングまたは機械学習モデルはありますか?
「編集」:従来のアプローチによる3つのラベルでは、[1,0,0]によってエンコードされますが、私の場合、[1,1,0]または[1,1,1]によってエンコードされます
例:3つのラベルがあり、文がこれらすべてのラベルに収まる場合。したがって、softmax関数からの出力が[0.45、0.35、0.2]である場合、3つのラベルまたは2つのラベルに分類する必要がありますか、それとも1つにすることができますか?それを行うときの主な問題は、1、2、または3つのラベルに分類するための適切なしきい値は何ですか?
softmax関数の代わりにシグモイド関数を使用する必要があります。複数のクラスをデータポイントに割り当てることができます。
—
NITISH MAHAJAN