ニューラルネットワークのサンプル、タイムステップ、機能の違い


17

LSTMニューラルネットワークに関する次のブログをご覧くださいhttp ://machinelearningmastery.com/understanding-stateful-lstm-recurrent-neural-networks-python-keras/

著者は、LSTMのさまざまな構成のために、入力ベクトルXを[サンプル、タイムステップ、フィーチャ]として再形成します。

著者は書いている

実際、文字のシーケンスは、個別の機能の1つのタイムステップではなく、1つの機能のタイムステップです。ネットワークにより多くのコンテキストを与えましたが、期待したほど多くのシーケンスを与えていません

これは何を意味するのでしょうか?

回答:


16

これは、関心のある[samples、time_steps、features]のすぐ下にあります。

X = numpy.reshape(dataX, (len(dataX), seq_length, 1))

サンプル-これはlen(dataX)、または所有するデータポイントの量です。

タイムステップ-これは、リカレントニューラルネットワークを実行するタイムステップの量に相当します。ネットワークに60文字のメモリを持たせたい場合、この数は60でなければなりません。

機能-これは、各タイムステップの機能の量です。画像を処理している場合、これはピクセルの量です。この場合、タイムステップごとに1つの機能があるようです。


1
X = numpy.reshape(dataX、(len(dataX)、3、1))とX = numpy.reshape(dataX、(len(dataX)、1、3))の違いを説明できますかlstm?
ジャイン

1
(len(dataX)、3、1)3回の反復でLSTMを実行し、形状(1)の入力ベクトルを入力します。(len(dataX)、1、3)は、1回の反復でLSTMを実行します。つまり、以前の反復からのフィードバックはないので、接続を繰り返してもまったく役に立たないということです。この場合、RNNへの入力形状は、形状(3)である
Joonatanサミュエル

「(len(dataX)、3、1)は3回の反復でLSTMを実行します」 そのためにエポックを使用しないでください。epoch = 3と同じ意味ですか?
ビプルジャイン

1
大まかな翻訳の1つの時代は、データセットのすべてのデータポイントで1回トレーニングしたことを意味します。トレーニング中にlen(dataX)の例を調べた場合、1エポックとしてカウントされます。ただし、RNNはデータを順次取り込みます。すべてのトレーニング例で、複数の反復にわたってデータをフィードする必要があります。たとえば、「car」という単語があり、反復するたびに1文字を送り、計算を完了させてから次の文字を送ります。「car」という単語の処理を完了するには、単語全体を1文字ずつ処理するために3回の反復が必要です。
ジョナタンサミュエル

@JoonatanSamuelこんにちは、私は多くの時間が経過したことを知っていますが、同じトピックを理解するのに多くの問題を抱えています。あなたの答えは非常に明確ですが、私はまだ少し混乱しています。数年間の各月の売上を説明する時系列があると想像してください(たとえば)。たとえば、len(data)= 3000、data.shape =(3000,1)を想像してください。したがって、3000か月が記録されています。次の予測:前のN個の観測を使用して次の観測(次の観測のみ)を予測する場合、LSTMへの入力データの形状はどうあるべきですか?たとえばt-n,..., t-2, t-1、予測に使用する場合t
-Euler_Salter

0

少し遅すぎますが、念のため。サンプルは、個々の訓練例を参照することができます。したがって、「batch_size」変数は、ニューラルネットワークに送信したサンプルの数です。つまり、ニューラルネットワークに一度にフィードするさまざまな例の数です。

TimeStepは時間の刻みです。各サンプルの時間の長さです。たとえば、サンプルには128時間ステップを含めることができ、各時間ステップは信号処理の30分の1秒になります。自然言語処理(NLP)では、設定に応じて、時間ステップを文字、単語、または文に関連付けることができます。

フィーチャは、各タイムステップでフィードするディメンションの数にすぎません。たとえば、NLPでは、wordは、word2vecを使用して300の機能で表すことができます。信号処理の場合、信号が3Dであるふりをしましょう。つまり、各軸の加速度計の測定値など、X、Y、Z信号があります。これは、各サンプルの各タイムステップで3つの機能が送信されることを意味します。ギヨーム

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.