私は画像認識のための畳み込みネットワークに取り組んでおり、さまざまなサイズの画像を入力できるかどうかは疑問に思っていました(ただし、それほど大きくはありません)。
このプロジェクト:https : //github.com/harvardnlp/im2markup
彼らが言う:
and group images of similar sizes to facilitate batching
したがって、前処理を行った後でも、画像のサイズは異なります。これは、式の一部を切り取らないため意味があります。
異なるサイズの使用に問題はありますか?ある場合、どのようにこの問題に取り組むべきですか(式がすべて同じ画像サイズに収まらないため)?
どんな入力でも大歓迎です