1つのニューラルネットワークで2種類のオブジェクトの認識を処理できますか、それとも2つの小さなネットワークに分割する必要がありますか?


9

特に、(限られたリソースを持つ)組み込みコンピュータは、交通カメラからのライブビデオストリームを分析し、通過する車のナンバープレート番号を含む適切なフレームを選択しようとします。プレートが見つかると、フレームがOCRライブラリに渡され、登録が抽出されてさらに使用されます。

私の国では、2種類のナンバープレートが一般的に使用されています。長方形(標準)と正方形です。実際には、長方形であるが「幅よりも高い」ので、登録が2行に分かれています。

(さらにいくつかのタイプがありますが、それらは無視してください。それらは小さな割合であり、通常、私たちの関心の外にある車両に属しています。)

限られたリソースと迅速なリアルタイム処理の必要性により、システムが処理できるネットワークの最大サイズ(セルと接続の数)は固定されています。

これを2つの小さなネットワークに分割し、それぞれが1種類の登録プレートを認識するようにするのが良いでしょうか。それとも、より大きな単一のネットワークが2つのタイプをより適切に処理するのでしょうか。

回答:


6

まあ、私はあなたがあなたのニューラルネットワークに与えている機能の種類を知りません。ただし、一般的には、単一のニューラルネットワークを使用します。ネットワークをトレーニングするためのリソースに制限はないようで、ネットワークを適用する際の唯一の問題はリソースです。

問題は、おそらく2つの問題に共通点があることです(たとえば、両方のタイプのプレートが長方形です)。つまり、2つのネットワークを使用する場合、それぞれが同じ副問題(共通部分)を再度解決する必要があります。1つのネットワークのみを使用する場合、問題の共通部分は解決するセル/重みが少なくなり、残りの重み/セルを使用して認識を向上させることができます。

結局、私があなたの立場にいたら、両方を試してみました。それが最善の解決策を本当に確かにする唯一の方法だと思います。理論的に言えば、いくつかの要因が含まれていない可能性があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.