残念ながら、@ Sycoraxによって現在受け入れられている回答は、詳細ではありますが、正しくありません。
実際には、カテゴリのクロスエントロピーを通る回帰の典型的な例は、 - Wavenet -れている実施 TensorFlowに。
原則は、出力スペースを離散化し、モデルはそれぞれのビンのみを予測することです。サウンドモデリングドメインの例については、論文のセクション2.2を参照してください。したがって、技術的にモデルは分類を実行しますが、解決される最終的なタスクは回帰です。
明らかな欠点は、出力解像度が失われることです。ただし、これは問題ではない可能性があります(少なくとも、Googleの人工アシスタントが非常に人間味のある声で話したと思います)。または、最も可能性の高いビンとその2つの隣の間を補間するなど、いくつかの後処理をいじることができます。
一方、このアプローチでは、通常の単一線形単位の出力に比べてモデルがはるかに強力になります。つまり、マルチモーダル予測を表現したり、信頼性を評価したりできます。ただし、後者は他の手段で自然に実現できることに注意してください。たとえば、変分オートエンコーダーのように明示的な(ログ)分散出力を作成するなどです。
とにかく、このアプローチは、より多くの次元の出力にうまくスケーリングできません。出力レイヤーのサイズが指数関数的に増加し、計算とモデリングの両方の問題が発生するためです。