私は「ディープランキングで細かい画像の類似性を学習する」という論文のネットワークアーキテクチャを持っていて、3つの並列ネットワークからの出力が線形埋め込み層を使用してどのようにマージされるのか理解できません。このレイヤーに記載されている唯一の情報は、
最後に、3つの部分からの埋め込みを正規化し、それらを線形埋め込みレイヤーと組み合わせます。埋め込みの次元は4096です。
作者がこのレイヤーについて話しているときに、作者が何を意味するのかを理解するのを手伝ってくれる人はいますか?
この質問に答えがないのは残念です。まったく同じ問題に悩まされているからです。あなたはそれを理解しましたか?
—
LKM
答えはわかりませんでしたが、3つの部分からの入力を連結して、4096個のノードを含む密な層に渡しました。
—
A.サム