タグ付けされた質問 「image-processing」

デジタル画像処理に関連するもの、つまり、デジタル画像から情報を抽出または操作するために使用される理論と技術。

2
ImageMagickを使用して画像を「比較」する
2つの画像の違いを取得するにはどうすればよいですか?元の画像があります。元の画像の完全な複製に誰かが書いています。今、私はオリジナルを書かれたイメージと比較し、イメージ形式のライティングだけを抽出する必要があります。 例:私は家の写真を持っています。誰かがコピーを取って「Hello!」と書いた コピーに。どういうわけか2つの写真を比較し、家を削除して、「こんにちは」という言葉のイメージを残したいと思います。 これはImageMagickで可能ですか?画像間の統計的差異を取得する方法はあることは知っていますが、それは私が探しているものではありません。

11
顔認識ライブラリ[終了]
閉まっている。この質問はスタックオーバーフローのガイドラインを満たしていません。現在、回答を受け付けていません。 この質問を改善してみませんか?Stack Overflowのトピックとなるように質問を更新します。 6年前休業。 この質問を改善する 大学のプロジェクト用の無料の顔認識ライブラリを探しています。顔検出は探していません。実際の認識を探しています。つまり、特定の顔を含む画像、または特定の顔間の距離を計算するライブラリを検索します。 私は現在、顔の検出にOpenCVを使用しており、認識には大まかなEigenfaceアルゴリズムを使用しています。しかし、私は、自己記述型のEigenfaceアルゴリズムよりも優れたパフォーマンスを持つものがあるはずだと考えました。パフォーマンスとしての速度についてではなく、単純なEigenfaceアプローチよりも優れた結果をもたらすライブラリを探しています。 私はFaintを調べましたが、このライブラリは自分のアプリケーションではあまり再利用できないようです。 Python、Java、C ++、Cなどのライブラリに満足しています。現時点では、Windows専用の外部コードに依存しているため、Windowsマシンで実行できるのが最善です。

7
node.jsを使用した画像のダウンロード[終了]
休業。この質問には、より焦点を当てる必要があります。現在、回答を受け付けていません。 この質問を改善してみませんか?質問を更新して、この投稿を編集するだけで1つの問題に焦点を当てます。 2年前休業。 この質問を改善する node.jsを使用して画像をダウンロードするスクリプトを記述しようとしています。これは私がこれまでに持っているものです: var maxLength = 10 // 10mb var download = function(uri, callback) { http.request(uri) .on('response', function(res) { if (res.headers['content-length'] > maxLength*1024*1024) { callback(new Error('Image too large.')) } else if (!~[200, 304].indexOf(res.statusCode)) { callback(new Error('Received an invalid status code.')) } else if (!res.headers['content-type'].match(/image/)) { callback(new Error('Not an …

5
OpenCV2.0とPython2.6で画像のサイズを変更する方法
OpenCV2.0とPython2.6を使用して、サイズ変更された画像を表示したいと思います。私はhttp://opencv.willowgarage.com/documentation/python/cookbook.htmlの例を使用して採用しましたが、残念ながらこのコードはOpenCV2.1用であり、2.0では動作していないようです。ここに私のコード: import os, glob import cv ulpath = "exampleshq/" for infile in glob.glob( os.path.join(ulpath, "*.jpg") ): im = cv.LoadImage(infile) thumbnail = cv.CreateMat(im.rows/10, im.cols/10, cv.CV_8UC3) cv.Resize(im, thumbnail) cv.NamedWindow(infile) cv.ShowImage(infile, thumbnail) cv.WaitKey(0) cv.DestroyWindow(name) 使えないので cv.LoadImageM 使った cv.LoadImage 代わりに、他のアプリケーションでは問題ありませんでした。それにもかかわらず、cv.iplimageには属性の行、列、サイズはありません。誰でも私にヒントを与えることができますか、この問題を解決する方法は?ありがとう。

9
2つの画像を比較するアルゴリズム
2つの異なる画像ファイル(選択した形式にかかわらず)を考えると、1つが別の画像ファイルの違法コピーであるかどうかを予測するプログラムを作成する必要があります。コピーの作成者は、回転、ネガの作成、または些細な詳細の追加(および画像の寸法の変更)などを行う場合があります。 この種の仕事をするためのアルゴリズムを知っていますか?


9
テキストOpenCVの抽出
画像内のテキストの境界ボックスを見つけようとしていますが、現在このアプローチを使用しています。 // calculate the local variances of the grayscale image Mat t_mean, t_mean_2; Mat grayF; outImg_gray.convertTo(grayF, CV_32F); int winSize = 35; blur(grayF, t_mean, cv::Size(winSize,winSize)); blur(grayF.mul(grayF), t_mean_2, cv::Size(winSize,winSize)); Mat varMat = t_mean_2 - t_mean.mul(t_mean); varMat.convertTo(varMat, CV_8U); // threshold the high variance regions Mat varMatRegions = varMat > 100; このような画像が与えられると: それから私が示すとき私はvarMatRegionsこの画像を取得します: ご覧のように、テキストの左側のブロックとカードのヘッダーが少し組み合わされています。ほとんどのカードでは、この方法はうまく機能しますが、使用頻度の高いカードでは問題が発生する可能性があります。 …

13
tesseract OCRの精度を向上させる画像処理
私は文書をテキストに変換するためにtesseractを使用しています。ドキュメントの品質は非常に幅が広​​いので、どのような画像処理で結果が改善されるかについてのヒントを探しています。ピクセル化されたテキスト(FAXマシンによって生成されたテキストなど)は、テッセラクトの処理が特に困難であることに気づきました。おそらく、文字のギザギザのエッジすべてが形状認識アルゴリズムを混乱させます。 どんな種類の画像処理技術が精度を向上させるでしょうか?私はピクセル化された画像を滑らかにするためにガウスぼかしを使用していて、いくつかの小さな改善を見てきましたが、より良い結果をもたらすより具体的な手法があることを期待しています。白黒の画像に合わせて調整されたフィルターを言います。これにより、不規則なエッジが滑らかになり、その後にコントラストを高めて文字をよりはっきりさせるフィルターが続きます。 画像処理の初心者のための一般的なヒントはありますか?

14
高品質の画像スケーリングライブラリ[終了]
閉まっている。この質問はスタックオーバーフローのガイドラインを満たしていません。現在、回答を受け付けていません。 この質問を改善してみませんか?Stack Overflowのトピックとなるように質問を更新します。 5年前休業。 この質問を改善する Photoshopと同じ品質レベルで画像をC#でスケーリングしたい。これを行うために使用できるC#画像処理ライブラリはありますか?

9
base 64文字列を画像に変換して保存する
これが私のコードです: protected void SaveMyImage_Click(object sender, EventArgs e) { string imageUrl = Hidden1.Value; string saveLocation = Server.MapPath("~/PictureUploads/whatever2.png") ; HttpWebRequest imageRequest = (HttpWebRequest)WebRequest.Create(imageUrl); WebResponse imageResponse = imageRequest.GetResponse(); Stream responseStream = imageResponse.GetResponseStream(); using (BinaryReader br = new BinaryReader(responseStream)) { imageBytes = br.ReadBytes(500000); br.Close(); } responseStream.Close(); imageResponse.Close(); FileStream fs = new FileStream(saveLocation, FileMode.Create); BinaryWriter …

8
RGBをグレースケール/強度に変換する
RGBからグレースケールに変換する場合、チャネルR、G、Bに特定の重みを適用する必要があると言われています。これらの重みは、0.2989、0.5870、0.1140です。 その理由は、これらの3つの色に対する人間の知覚/感受性が異なるためだと言われています。これらはNTSC信号の計算に使用される値であるとも言われます。 しかし、ウェブ上でこれについての適切なリファレンスは見つかりませんでした。これらの値のソースは何ですか? これらの以前の質問も参照してください:こことここ。

3
MaxHeight制約とMaxWidth制約で画像を均等にサイズ変更
を使用しSystem.Drawing.Imageます。 画像の幅または高さが最大値を超える場合は、それに比例してサイズを変更する必要があります。サイズ変更後、幅も高さも制限を超えていないことを確認する必要があります。 幅と高さは、自動的に最大値と最小値(最大サイズ)を超えないようにサイズ変更され、比率も維持されます。



3
足を並べ替える方法は?
で、私の前の質問私は優秀な答えだ足がプレッシャープレートを打つところ、私は検出助けたが、今はそれらに対応する足に、これらの結果をリンクするために苦労しています: 足に手動で注釈を付けました(RF =右前、RH =右後、LF =左前、LH =左後)。 ご覧のとおり、繰り返しパターンがはっきりとあり、ほとんどすべての測定でそのパターンが再現されます。これは、手動で注釈が付けられた6つの試験のプレゼンテーションへのリンクです。 私の最初の考えは、次のようにヒューリスティックを使用してソートを行うことでした。 前足と後足の間の重量負担は約60〜40%です。 後足の表面は一般的に小さくなっています。 足は(しばしば)空間的に左と右に分かれています。 ただし、私は自分のヒューリスティックについて少し懐疑的です。思いもよらなかったバリエーションに遭遇するとすぐに失敗するからです。彼らはまた、おそらく独自のルールを持っている下手な犬からの測定に対処することができません。 さらに、ジョーによって提案された注釈は時々めちゃくちゃになり、足が実際にどのように見えるかを考慮に入れません。 足のピーク検出についての質問で受け取った回答に基づいて、足を分類するためのより高度なソリューションがあることを願っています。特に、圧力分布とその進行は、指紋のように、足ごとに異なるためです。発生順に並べ替えるのではなく、これを使用して足をクラスタリングできる方法があるといいのですが。 したがって、対応する足で結果を並べ替えるより良い方法を探しています。 挑戦する人のために、各足の圧力データ(測定によってまとめられています)とその場所(プレート上の場所と時間内の場所)を表すスライスを含むすべてのスライスされた配列を含む辞書をピクルスにしました。 明確にするために、walk_sliced_dataは、測定の名前である['ser_3'、 'ser_2'、 'sel_1'、 'sel_2'、 'ser_1'、 'sel_3']を含む辞書です。各測定値には、抽出された影響を表す別の辞書[0、1、2、3、4、5、6、7、8、9、10](「sel_1」の例)が含まれています。 また、足が部分的に(空間または時間内で)測定されている場合などの「誤った」影響は無視できます。それらはパターンの認識を助けることができるので有用ですが、分析されません。 そして、興味がある人のために、私はプロジェクトに関するすべての更新をブログに保管しています!

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.