だから、私はニューラルネットワークがパターンを認識して入力を分類する方法を学び始めたばかりで、人工ニューラルネットワークが画像データを解析して画像を分類する方法を見ました(convnetjsを使ったデモ)、そしてそこのキー画像をダウンサンプリングし、各ピクセルがネットワークへの1つの入力ニューロンを刺激します。
しかし、文字列入力でこれが可能であれば、私は頭を包み込もうとしていますか?私が持っているユースケースは、ユーザーが見た映画の「推奨エンジン」です。映画には多くの文字列データ(タイトル、プロット、タグ)があり、その映画を説明するいくつかのキーワードにテキストを「ダウンサンプリング」することを想像できますが、この映画を説明する上位5語を解析しても、映画のセットを比較するために、すべての英語の単語に対して入力ニューロンが必要だと思いますか?入力ニューロンをセットで使用される単語だけに制限できますが、新しい映画を追加することで成長/学習できます(ユーザーは新しい単語で新しい映画を視聴します)。私が見たライブラリのほとんどは、システムのトレーニング後に新しいニューロンを追加することを許可していませんか?
文字列/単語/文字データをニューラルネットワークへの入力にマッピングする標準的な方法はありますか?または、ニューラルネットワークは、このような文字列データを解析するための適切なツールではありませんか(文字列データのパターンマッチングに適したツールは何ですか)。