- これは正しいです?
はい、図はどちらも正しいように見えます。両方の図を理解するための重要なことは、LSTMセルの入力と出力がベクトルであることです。
最初の図の円は、層に複数の個別の人工ニューロンが含まれているという概念を表しています。そのため、2番目の図はそれらのニューロンの1つの画像であると想定することができます。フォームの計算には複数の場所があるため、セル内には異なる役割を持つ複数の「ニューロン」またはサブレイヤーがおそらくありますf(Wx+b)少し異なる役割を果たします。「細胞」という用語は、このニューロンの構造を指すために使用されていると思います。私は「ニューロン」と言うときの省略形として、隠れ層の出力段階を思いがちです。
ただし、2番目の図では、示されているすべての演算がベクトルで機能します。最も重要なのは、2番目の図の左から右への矢印は、レイヤー全体のタイムステップからタイムステップへの隠れた状態のベクトルを表します。したがって、セル内の各ニューロンは、そのセル内の他のすべてのニューロンに繰り返し接続されます。これは、LSTMの場合の2倍です。これは、LSTMが内部セル状態と層出力の両方を持っているためです。
- セル内の各ユニットは他のユニットから独立していますか?または、彼らは情報を共有しますか?
図の説明と一致させるために、「ユニット」を、セルを構成するために使用される各タイプのニューロン/ゲートの1つのコレクションとして定義します。理論的には、相互に配線して単一のLSTMセルレイヤーを作成できますスカラーセルの状態と出力値。
これらの単位は、それぞれに独自の重みパラメータがあるという点で独立しています。入力とユニット間の接続、または状態をあるタイムステップから次のタイムステップに転送する再帰的接続には、共有パラメーターはありません。その意味で、ユニットは情報を共有しません。
ただし、接続は、各タイムステップで、セル内の他のすべてのユニットからの入力データと非表示状態と最後の出力からの出力が結合されて計算に使用されることを意味します。すべてのセルユニットは、新しい内部状態とその出力を、他のすべての出力の値とセル内の他のユニットからの内部状態に基づくことができます。この意味で、ユニットは情報を共有します。2つ目の図では単一のニューロンの配線図を考えることができるので、おそらくこの2つ目の問題が懸念されるのはあなたの質問からだと思いますが、上で説明したようにそうではありません。
- 次の構成があるとします。サンプル数= 1000タイムステップ数= 10フィーチャ数= 5この場合、セル内の各ユニットは、サイズ5のベクトルを入力として受け取りますか?
ほとんど。セル内の各ニューロンは5の入力を受け取りますx、および非表示レイヤー出力の入力、 h。したがって、LSTMセルサイズが10の場合、各ニューロンは15の結合ベクトルを取ります。さらに、2番目のセル状態ベクトルが維持され、図ではラベル付けされません。これは、ニューロンへの入力として直接使用されません(つまり、フォームのコンポーネント)f(Wx+b))、ただし他の値と相互作用し、さまざまなゲートを介してそれ自体を変更することができます。2番目の図では、左から右に行く一番上の矢印です。
しかし、1つのユニットの出力のサイズはどうなるでしょうか。1?
セル全体として、レイヤーを作成したサイズの出力が得られます。それは、図表番号2が示すことです。ただし、「ユニット」の実際の定義を使用すると、各ユニットの出力は、2つのスカラー値(非表示レイヤーの出力とセルの状態)になり、図に示すそれぞれのベクトルの一部になります。