使用する必要があるLSTMセルの最小、最大、および「妥当な」量に関する経験則(または実際の規則)はありますか?具体的には、TensorFlowとプロパティのBasicLSTMCellに関連していnum_units
ます。
私が定義する分類問題があると仮定してください:
t - number of time steps
n - length of input vector in each time step
m - length of output vector (number of classes)
i - number of training examples
たとえば、トレーニングの例の数は次の数よりも多い必要がありますか?
4*((n+1)*m + m*m)*c
c
セルの数はどこですか?これに基づいています:LSTMネットワークのパラメーターの数を計算する方法?私が理解しているように、これはパラメータの総数を与えるはずであり、トレーニング例の数よりも少なくなければなりません。
1
:私はうまくシーケンシャル深い学習モデルを比較するの話題だけでなく、ハイパーチューニングに対処し、この論文をチェックアウトしたいarxiv.org/pdf/1503.04069.pdf LSTMブロックの数を増やすと、隠されたあたりのことを、彼らは明白なことを示唆要約すると、レイヤーはパフォーマンスを向上させますが、リターンが減少し、トレーニング時間が増加します。
—
CubeBot88