LSTMレイヤーへの入力として、形状(99,13)の2Dマトリックスをフィードしているとします。n個のファイルがあり、それぞれに(99,13)サイズのベクトルが含まれています。特徴の数として13を、タイムステップとして99を検討することにしました。
(Kerasを使用して実装するときに、LSTMレイヤーを最初のレイヤーとして追加しました。そして、レイヤーのoutput_dimを100に設定しました)
しかし、上記のように入力すると、ネットワーク内で実際にどのように動作するかを理解できません。以下の質問がありますが、自分では答えられません。
- LSTMセルへの入力としてどのような値を提供しますか?(xt、セルへの入力として使用されるht-1は常にベクトルです?私の場合、xtは[1,13]の形をしていますか?)
- モード lの最初のレイヤーとしてLSTMレイヤーがあるとすると、それは最初の入力ベクトルを指定されたレイヤーのすべてのセルに供給しますか?(例:最初のレイヤーのすべてのn LSTMセルに(99フレームから)サイズ13の最初のフレームをフィードしますか?)同様に、各タイムステップで入力行列のすべての行をフィードし続けますか?
- LSTMセルは各タイムステップでどのような値を出力しますか?(セルの状態をノードからの正しい出力と見なしますか?それは単一の値ですか、それともベクトルですか?それがベクトルの場合、次元は何ですか?次元を推測できる方法はありますか?htをベクター)
- 特定のレイヤーのoutput_dim(出力次元)とはどういう意味ですか?常に次のレイヤーのノード数である必要がありますか?
これを保留にしたり、他のグループに誘導したりしないでください。これらの質問は機械学習とrnnに関連していると思います。私は研究論文を読みましたが、LSTMネットワーク内で実際にどのように機能するかについて明確なアイデアを得ることができませんでした。