タグ付けされた質問 「opencv」

OpenCV(オープンソースコンピュータービジョン)は、リアルタイムコンピュータービジョン用のライブラリです。このタグを使用するときは、使用しているOpenCVリリース(例:3.4.6)について言及し、必要に応じて言語固有のタグ(python、c ++など)を追加してください。

4
MNISTでトレーニングされたモデルの数字認識を改善するにはどうすればよいですか?
私は手書きの多桁認識に取り組んでいます JavaOpenCV、前処理とセグメンテーションのためのライブラリ、およびKeras認識のためにMNIST(精度0.98)でトレーニングされたモデルを使用、ます。 認識は、1つの点を除けば、かなりうまく機能しているようです。ネットワークでは、1(番号「1」)を認識できないことがよくあります。セグメンテーションの前処理/不適切な実装が原因で発生したのか、標準のMNISTでトレーニングされたネットワークが、テストケースのように見える一番のものが見当たらないのかわかりません。 以下は、前処理とセグメンテーション後の問題のある数字の様子です。 になり、として分類され4ます。 になり、として分類され7ます。 となり、次のように分類されます4ます。等々... これは、セグメンテーションプロセスを改善することで修正できるものですか?それとも、トレーニングセットを強化することによってですか。 編集:トレーニングセット(データ拡張)を強化することは間違いなく役立ちます。これは既にテストしていますが、正しい前処理の問題はまだ残っています。 私の前処理は、サイズ変更、グレースケールへの変換、2値化、反転、および膨張で構成されています。これがコードです: Mat resized = new Mat(); Imgproc.resize(image, resized, new Size(), 8, 8, Imgproc.INTER_CUBIC); Mat grayscale = new Mat(); Imgproc.cvtColor(resized, grayscale, Imgproc.COLOR_BGR2GRAY); Mat binImg = new Mat(grayscale.size(), CvType.CV_8U); Imgproc.threshold(grayscale, binImg, 0, 255, Imgproc.THRESH_OTSU); Mat inverted = new Mat(); Core.bitwise_not(binImg, inverted); Mat dilated …

3
opencvを使用して画像に存在するすべてのテキストの場所を取得する
テキスト(数字とアルファベット)を含むこの画像があります。この画像に存在するすべてのテキストと数字の場所を取得したい。また、すべてのテキストも抽出したいと思います。 画像の座標とすべてのテキスト(数字とアルファベット)を取得するにはどうすればよいですか。たとえば10B、44、16、38、22Bなど

3
OpenCVでテーブルゲームカードの画像からアートワークを抽出する
私はpythonで小さなスクリプトを書いて、アートワークのみを表すトランプの部分を抽出またはトリミングし、残りをすべて削除しようとしています。さまざまなしきい値処理方法を試しましたが、うまくいきませんでした。また、アートワークの位置は常に同じ位置またはサイズではなく、常にテキストと境界線のみの長方形の形であるので、アートワークの位置を手動で記録することはできません。 from matplotlib import pyplot as plt import cv2 img = cv2.imread(filename) gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) ret,binary = cv2.threshold(gray, 0, 255, cv2.THRESH_OTSU | cv2.THRESH_BINARY) binary = cv2.bitwise_not(binary) kernel = np.ones((15, 15), np.uint8) closing = cv2.morphologyEx(binary, cv2.MORPH_OPEN, kernel) plt.imshow(closing),plt.show() 現在の出力は私が得ることができる最も近いものです。私は正しい方法で、白い部分の周りに長方形を描くためにさらにラングリングを試すことができますが、それは持続可能な方法ではないと思います: 最後のメモとして、以下のカードを参照してください。すべてのフレームが正確に同じサイズまたは位置であるわけではありませんが、常にテキストと枠線のみのアートワークが存在します。厳密にカットする必要はありませんが、アートはカードの「領域」であり、テキストを含む他の領域に囲まれています。私の目標は、アートワークの領域をできるだけキャプチャすることです。

1
OCRのクリーニング画像
OCRの画像をクリアしようとしています:(行) 時々画像をさらに処理するためにこれらの行を削除する必要があり、かなり近づきつつありますが、多くの場合、しきい値がテキストから取りすぎています。 copy = img.copy() blur = cv2.GaussianBlur(copy, (9,9), 0) thresh = cv2.adaptiveThreshold(blur,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY_INV,11,30) kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (9,9)) dilate = cv2.dilate(thresh, kernel, iterations=2) cnts = cv2.findContours(dilate, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) cnts = cnts[0] if len(cnts) == 2 else cnts[1] for c in cnts: area = cv2.contourArea(c) if area > 300: x,y,w,h = …

2
2Dポイントを3D位置に変換する
私は知られているとの固定カメラを持っているcameraMatrixとdistCoeffs。私は、あまりにも固定されているチェス盤を持っている、とtransformし、rotationベクトルも使用して計算されていますsolvePnP。 次の図のように、チェス盤が配置されているのと同じ平面上にある2Dポイントの3D位置を取得するにはどうすればよいのでしょうか。 確かなことは、その点のZは0ですが、その点のXとYを取得する方法です。

2
JavaScriptを介してPythonAnywhereのOpenCVでWebカメラにアクセスする方法
私はDjangoでWebアプリケーションを開発しました。これは、トリガーされるとユーザーWebカメラを開いて顔を検出するOpevCVコードを含むビューメソッドを備えています。このアプリは私のローカルサーバーで正常に動作しますが、PythonAnywhereでホストした場合、PAホスティングではカメラが機能しないため、カメラが見つからないと表示されます。そのため、クライアントマシンを処理するJavaScriptを介してWebカメラを開き、そのホスティングをホストしているサーバーマシンにフィードを渡すようにと誰かから提案されました。しかし、私はPythonの新人なので、上記のタスクを実行する方法を理解できません。私はこのjsコードを見つけましたが、これを私のDjangoアプリに追加する方法と場所がわかりません。 JavaScriptでフィードを取得するためのコード var video = document.querySelector("#videoElement"); if (navigator.mediaDevices.getUserMedia) { navigator.mediaDevices.getUserMedia({video: true}).then(function(stream) { video.srcObject = stream; }).catch(function(err0r) { console.log("Something went wrong!"); }); } カメラを開いて顔を検出するための私のPythonコードは次のとおりです(ローカルサーバーで動作します) import cv2 cascade = cv2.CascadeClassifier('./haarcascade_frontalface_default.xml') cam = cv2.VideoCapture(0) while True: ret, frame = cam.read() frame = cv2.flip(frame, 1) if ret: gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) faces = cascade.detectMultiScale(gray, …

3
未定義のシンボル:__atomic_fetch_add_8
私のラズベリーpiのthonny python ideでpicameraをテストしようとしていますが、エラーが発生します。 Traceback (most recent call last): File "/home/pi/Documents/Camera_test.py", line 2, in <module> import cv2 File "/usr/lib/python3/dist-packages/thonny/backend.py", line 305, in _custom_import module = self._original_import(*args, **kw) File "/home/pi/.local/lib/python3.7/site-packages/cv2/__init__.py", line 3, in <module> from .cv2 import * File "/usr/lib/python3/dist-packages/thonny/backend.py", line 305, in _custom_import module = self._original_import(*args, **kw) ImportError: /home/pi/.local/lib/python3.7/site-packages/cv2/cv2.cpython-37m-arm-linux-gnueabihf.so: undefined symbol: …
8 python  opencv 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.