データサイエンス sequence

2

1対多（たとえば、単一の画像の分類）と多対多（たとえば、画像シーケンスの分類）のシーケンスのラベル付けについて、Kerasコーディングの違いを解釈するのに苦労しています。2種類のコードが頻繁に表示されます。タイプ1では、TimeDistributedは次のように適用されません。 model=Sequential() model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1], border_mode="valid", input_shape=[1, 56,14])) model.add(Activation("relu")) model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1])) model.add(Activation("relu")) model.add(MaxPooling2D(pool_size=pool_size)) model.add(Reshape((56*14,))) model.add(Dropout(0.25)) model.add(LSTM(5)) model.add(Dense(50)) model.add(Dense(nb_classes)) model.add(Activation("softmax")) タイプ2は、TimeDistributedが次のように適用される場所です。 model = Sequential() model.add(InputLayer(input_shape=(5, 224, 224, 3))) model.add(TimeDistributed(Convolution2D(64, (3, 3)))) model.add(TimeDistributed(MaxPooling2D((2,2), strides=(2,2)))) model.add(LSTM(10)) model.add(Dense(3)) 私の質問は：タイプ1は1対多の種類であり、タイプ2は多対多の種類であるという私の仮定は正しいですか？それともTimeDistributed、この側面に関連性はありませんか？ 1対多または多対多のいずれの場合も、最後の密な層は1ノードの「長い」（順番に1つの値のみを放出する）と想定され、前の反復層は 1 対多の数を決定する責任があります。放出する値？または、最後の高密度層はN個のノードで構成されているはずN=max sequence lengthです。もしそうなら、 N個の並列「バニラ」推定器を使用して複数の出力を持つ同様の入力を生成できる場合、ここでRNN を使用するポイントは何ですか？ RNNのタイムステップ数を定義する方法は？それはどういうわけか出力シーケンスの長さと相関していますか、それとも単に調整するハイパーパラメータですか？ …

13 keras rnn lstm sequence

2

ベクター配列の分類

私のデータセットはベクターシーケンスで構成されています。各ベクトルには50の実数値の次元があります。シーケンス内のベクトルの数は、3〜5〜10〜15の範囲です。つまり、シーケンスの長さは固定されていません。かなりの数のシーケンス（ベクトルではありません！）には、クラスラベルが付けられています。私の仕事は、一連のベクトルが与えられたときに、シーケンス全体のクラスラベルが計算される分類子を学ぶことです。データの正確な性質はわかりませんが、シーケンスの性質は一時的なものではありません。それでも、ラベル（）を変更せずに、ベクトルをベクトルと交換することはできません。つまり、ベクトルの順序が重要です。ベクトル自体は比較可能です。たとえば、内積を計算し、この類似値を使用することは理にかなっています。バツ私バツ私x_iバツjバツjx_j私≠ j私≠ji \neq j 私の質問は、そのようなデータを分類するのに役立つツール/アルゴリズムは何ですか？更新：データには、1つまたは非常に少数のベクトルがクラスラベルに強く影響するという特性があります。考えられる解決策：いくつかの調査の後、Recurrent Neural Networks（RNN）はかなり自然に法案に適合しているように見えます。包括的な考え方は、コンテキストサイズを選択し、単語ベクトルを連結し、最大プーリングを実行し、それを古典的なNNを通じてフィードすることです。文内の可能なコンテキストウィンドウの位置ごとに、特徴ベクトルが作成されます。最終的な特徴ベクトルは、たとえば最大プーリングを使用して構築されます。逆伝播は、ネットワークのパラメータを調整するために行われます。私はすでにいくつかの肯定的な結果を得ました（GPUは必須です）。kkk

9 classification sequence

3

シーケンスデータのセグメンテーションのアルゴリズム

長さNのベクトルの大きなシーケンスがあります。これらのベクトルをMセグメントに分割するには、教師なし学習アルゴリズムが必要です。例えば： K平均法は、異なる場所からの類似した要素を単一のクラスターに入れるため、適切ではありません。更新：実際のデータは次のようになります。ここでは、3つのクラスターが表示されます。 [0..50], [50..200], [200..250] アップデート2：私は修正されたk-meansを使用して、この許容できる結果を得ました：クラスターの境界： [0, 38, 195, 246]

8 machine-learning clustering sequence

タグ付けされた質問 「sequence」

タグ付けされた質問「sequence」