私はニューラルネットを構築して、さまざまな入力(サイズ、アートメディアなど)で芸術作品の価値を予測し、著者も入力として含めたいと思います(多くの場合、膨大な1つの芸術作品の価値を考慮します)。
私の現在の懸念は、著者の名前がNNの理想的な数値入力ではないことです(つまり、増加する整数値で各著者をコーディングするだけで、リストのさらに下の著者に間接的により多くの値を割り当てます-_-) 。私の考えは、データセット内のすべての著者に対して個別の入力を作成し、1つのホットエンコーディングを使用してNNへの入力をより適切に表すことでした。
ただし、このアプローチは、私のトレーニングデータに含まれていない作成者がNNへの入力として使用されている場合(つまり、新しい作成者)に問題が発生します。「他の著者」入力フィールドでこれを回避できますが、この入力のNNをトレーニングしなかったため、これが正確ではないのではないかと心配しています(評価付きのすべての芸術作品には著者がいます)。
私はこれまで十分に考えていませんでしたが、おそらく著者がいない評価と、著者との評価の2つのNNをトレーニングして、「著者のない評価」が十分に正確であるために十分なトレーニングデータがあることを確認しました。
実装に取り掛かる前に、私はまだ最高のNNアーキテクチャを概念化しようとしています。そのため、誰かが提案やコメントを持っている場合は、とても感謝しています!
前もって感謝します、ヴィンス
PS私はこれを、友達との小さな競争として、NNと従来の商業的評価手法を比較するためにやっています。保険数理科学よりもコンピュータサイエンスで勝利を収めるのを手伝ってください。