私はディープラーニングに非常に慣れていないため、特にLSTMとBiLSTMとは何か、いつ使用するか(主なアプリケーション分野)を知りたいと思っています。LSTMとBILSTMがRNNよりも人気があるのはなぜですか?
これらのディープラーニングアーキテクチャを教師なしの問題で使用できますか?
私はディープラーニングに非常に慣れていないため、特にLSTMとBiLSTMとは何か、いつ使用するか(主なアプリケーション分野)を知りたいと思っています。LSTMとBILSTMがRNNよりも人気があるのはなぜですか?
これらのディープラーニングアーキテクチャを教師なしの問題で使用できますか?
回答:
RNN
以下のようなアーキテクチャLSTM
やBiLSTM
学習の問題は、あなたがビデオを持っているとあなたがすべてに約か、エージェントがテキストのイメージであり、であるあなたのための文書の行を読みたいということであるかを知りたい例えば、シーケンシャルであるところの場面で使用されていますテキスト形式ではありません。こちらをご覧になることを強くお勧めします。
LSTMs
また、双方向のバリアントは、アーキテクチャでゲートを使用する方法とタイミング、およびゲートを使用しないタイミングを学習しようとしたため、人気があります。以前のRNN
アーキテクチャでは、勾配の消失は大きな問題であり、これらのネットはあまり学習しませんでした。
双方向を使用LSTMs
して、最初から最後まで1回、最後から最初まで1回、元のデータを学習アルゴリズムに供給します。ここでは議論がありますが、タスクにもよりますが、通常は一方向のアプローチよりも速く学習します。
人間は毎秒ゼロから考え始めません。このエッセイを読むと、以前の単語の理解に基づいて各単語を理解します。すべてを捨てて、最初から考え直すことはありません。あなたの考えは固執します。
従来のニューラルネットワークではこれを行うことはできず、大きな欠点のようです。たとえば、映画のあらゆる時点で発生しているイベントの種類を分類したいとします。従来のニューラルネットワークが、映画の以前のイベントに関する推論をどのように使用して、後のイベントに知らせることができるかは不明です。
リカレントニューラルネットワークはこの問題に対処します。それらはループを備えたネットワークであり、情報を持続させることができます。
詳細については、 コーエンのブログをご覧ください。