出力変数が序数である場所を予測するために、ニューラルネットワークを設定しています。3つの可能な出力A <B <Cを使用して以下に説明します。
ニューラルネットワークを使用してカテゴリデータを出力する方法は非常に明白です。出力は最後の(通常は完全に接続された)レイヤーのソフトマックスであり、カテゴリごとに1つであり、予測カテゴリは最大の出力値を持つものです(これは多くの一般的なモデルのデフォルト)。序数値には同じ設定を使用しています。ただし、この場合、出力は意味をなさないことがよくあります。たとえば、AとCのネットワーク出力は高くてもBは低くなります。これは順序値には当てはまりません。
これには、出力をAの1 0 0、Bの1 1 0、Cの1 1 1と比較して損失を計算するというアイデアがあります。正確なしきい値は、別の分類器(たとえば、ベイジアンを使用して後で調整できます。 )しかし、これは、特定の間隔スケールを規定することなく、入力の順序付けの本質的なアイデアを捉えているようです。
この問題を解決する標準的な方法は何ですか?さまざまなアプローチの長所と短所を説明する研究や参考文献はありますか?