タグ付けされた質問 「object-detection」

3
「セグメンテーション」や「シーンラベリング」と比較した「セマンティックセグメンテーション」とは何ですか?
セマンティックセグメンテーションは単なるPleonasmですか、それとも「セマンティックセグメンテーション」と「セグメンテーション」の間に違いがありますか?「シーンのラベル付け」または「シーンの解析」に違いはありますか? ピクセルレベルのセグメンテーションとピクセル単位のセグメンテーションの違いは何ですか? (サイド質問:この種のピクセル単位のアノテーションがある場合、オブジェクト検出を無料で取得しますか、それともまだ何かする必要がありますか?) 定義の出典を教えてください。 「セマンティックセグメンテーション」を使用するソース ジョナサンロング、エヴァンシェルハマー、トレヴァーダレル:セマンティックセグメンテーションのための完全たたみ込みネットワーク。CVPR、2015およびPAMI、2016 ホン、スンフン、ヒョンウ、ハンヒョンウ:「半教師付きセマンティックセグメンテーションのための分離されたディープニューラルネットワーク」。arXivプレプリントarXiv:1506.04924、2015。 V. Lempitsky、A。Vedaldi、およびA. Zisserman:セマンティックセグメンテーションのパイロンモデル。神経情報処理システムの進歩、2011年。 「シーンラベリング」を使用するソース Clement Farabet、Camille Couprie、Laurent Najman、Yann LeCun:シーンのラベル付けの階層的機能の学習。パターン分析および機械知能、2013年。 「ピクセルレベル」を使用するソース Pinheiro、Pedro O.、Ronan Collobert:「畳み込みネットワークによる画像レベルからピクセルレベルのラベリングへ」コンピュータビジョンとパターン認識に関するIEEE会議の議事録、2015年(http://arxiv.org/abs/1411.6228を参照) 「pixelwise」を使用するソース Li、Hongsheng、Rui Zhao、Xiaogang Wang:「ピクセルごとの分類のための畳み込みニューラルネットワークの非常に効率的な前方および後方伝播」arXivプレプリントarXiv:1412.4526、2014。 Google Ngram 「セマンティックセグメンテーション」は、「シーンのラベル付け」よりも最近使用されているようです。

2
AttributeError:モジュール 'tensorflow'に属性 'app'がありません
このチュートリアルに従って、テンソルフローを使用してカスタムオブジェクト検出に関するプロジェクトを行っています。 したがって、次のコマンドを使用して列車の画像のTFレコードを作成しようとしたとき python3 generate_tfrecord.py --csv_input=data/train_labels.csv --output_path=data/train.record 次のエラーが発生します。 Traceback (most recent call last): File "generate_tfrecord.py", line 23, in <module> flags = tf.app.flags AttributeError: module 'tensorflow' has no attribute 'app' このエラーを解決するにはどうすればよいですか?

2
画像内の複数の長方形を検出する
この画像でパイプの数を検出しようとしています。これには、OpenCVとPythonベースの検出を使用しています。同様の質問に対する既存の回答に基づいて、次の手順を思い付くことができました 画像を開く フィルターする エッジ検出を適用する 等高線を使用 カウントを確認する パイプの総数は〜909です我々はそれを手動でカウント与えるか、または4を取るとき。 フィルター適用後 import cv2 import matplotlib.pyplot as plt import numpy as np img = cv2.imread('images/input-rectpipe-1.jpg') blur_hor = cv2.filter2D(img[:, :, 0], cv2.CV_32F, kernel=np.ones((11,1,1), np.float32)/11.0, borderType=cv2.BORDER_CONSTANT) blur_vert = cv2.filter2D(img[:, :, 0], cv2.CV_32F, kernel=np.ones((1,11,1), np.float32)/11.0, borderType=cv2.BORDER_CONSTANT) mask = ((img[:,:,0]>blur_hor*1.2) | (img[:,:,0]>blur_vert*1.2)).astype(np.uint8)*255 このマスクされた画像が表示されます これは、表示される長方形の数の点でかなり正確に見えます。ただし、カウントして画像の上にバウンディングボックスをプロットしようとすると、多くの不要な領域も選択されます。円の場合、HoughCirclesには最大半径と最小半径を定義する方法があります。精度を向上させることができる長方形に似たものはありますか?また、私はこの問題への代替アプローチの提案を受け入れています。 ret,thresh = cv2.threshold(mask,127,255,0) contours,hierarchy …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.