タグ付けされた質問 「image-processing」

デジタル画像処理に関連するもの、つまり、デジタル画像から情報を抽出または操作するために使用される理論と技術。

3
Node.JSでサーバー側の画像操作にどのライブラリを使用すればよいですか?[閉まっている]
現在のところ、この質問はQ&A形式には適していません。事実、参考文献、専門知識によって回答が裏付けられることを期待していますが、この質問は、討論、議論、投票、または拡張ディスカッションを求める可能性があります。この質問を改善でき、再開できると思われる場合は、ヘルプセンターにアクセスしてください。 7年前休業。 Node.JS wiki で利用可能なライブラリの非常に大きなリストを見つけましたが、どれがより成熟していてパフォーマンスが優れているのかわかりません。基本的に私は次のことをしたいです: 外部ソースからサーバーにいくつかの画像をロードする それらを1つの大きなキャンバスに配置します それらを少し切り取り、マスクする 1つまたは2つのフィルターを適用する 最終的な画像のサイズを変更し、リンクを与える ノードパッケージがLinux とWindowsの両方で動作する場合の大きなプラス。

4
数百万のピクセルを持つ2Dボックス化されていないピクセル配列には、どのHaskell表現が推奨されますか?
Haskellの画像処理の問題に取り組みたい。私は、数百万ピクセルのモノクロ(ビットマップ)とカラー画像の両方を扱っています。いくつか質問があります。 Vector.Unboxedとの間でどちらを選択すればよいUArrayですか?どちらもボックス化されていない配列ですが、Vector抽象化は特にループフュージョンを中心に宣伝されているようです。でVector常により良いですか?そうでない場合、いつどの表現を使用すればよいですか? カラー画像の場合、16ビット整数のトリプルまたは単精度浮動小数点数のトリプルを格納したいと思います。この目的のために、どちらVectorかUArray使いやすいですか?より高性能ですか? モノクロイメージの場合、ピクセルごとに1ビットのみを保存する必要があります。複数のピクセルを1つの単語にパックすることによってここで私を助けることができる事前定義されたデータ型はありますか、それとも私一人でですか? 最後に、私の配列は2次元です。「配列の配列」(またはベクトルのベクトル)としての表現によって課される追加の間接参照を処理できると思いますが、インデックスマッピングをサポートする抽象化を好みます。誰でも標準ライブラリやHackageから何かを推薦できますか? 私は関数型プログラマーであり、突然変異の必要はありません:-)

4
アップロードする前に画像のプレビューを表示する
私のHTMLフォームでは、たとえばfileタイプのファイルを入力しています。 <input type="file" multiple> 次に、その入力ボタンをクリックして複数のファイルを選択しています。フォームを送信する前に、選択した画像のプレビューを表示したいと思います。HTML 5でそれを行う方法

6
メモリに画像を読み込まずに画像サイズを取得する
次の方法でPILを使用して画像サイズを取得できることを理解しています from PIL import Image im = Image.open(image_filename) width, height = im.size ただし、画像をメモリにロードせずに画像の幅と高さを取得したいと思います。それは可能ですか?私は画像サイズの統計のみを行っており、画像の内容は気にしません。処理を高速化したいだけです。


4
コマンドラインで画像をマージする方法は?[閉まっている]
閉まっている。この質問はスタックオーバーフローのガイドラインを満たしていません。現在、回答を受け付けていません。 この質問を改善してみませんか?Stack Overflowのトピックとなるように質問を更新します。 昨年休業。 この質問を改善する CSS Spriteテクニックを試して、いくつかのサムネイルを単一の画像としてロードしたいと思います。そのため、サーバー内のオフラインで1つのファイルにいくつかのサムネイルを「マージ」する必要があります。 同じサイズのサムネイルが10個あるとします。Linuxコマンドラインからそれらを「マージ」することをどのように提案しますか?

2
平均シフトを使用した画像セグメンテーションの説明
誰かがMean Shiftセグメンテーションが実際にどのように機能するかを理解するのを手伝ってくれませんか? ここに私がちょうど作った8x8の行列があります 103 103 103 103 103 103 106 104 103 147 147 153 147 156 153 104 107 153 153 153 153 153 153 107 103 153 147 96 98 153 153 104 107 156 153 97 96 147 153 107 103 153 153 147 156 153 153 …

1
画像からASCIIアートへの変換
プロローグ この主題は時々ここでStack Overflowに表示されますが、通常は書き方が悪い質問であるため削除されます。私はそのような多くの質問を見て、追加の情報が要求されたときにOP(通常は低担当者)から沈黙しました。時々、入力が私にとって十分である場合、私は回答で応答することを決定し、通常はアクティブなときに1日あたり数回の賛成票を獲得しますが、数週間後に質問が削除/削除され、すべてが始まり。そこで、このQ&Aを書いて、答えを何度も書き換えることなく直接質問を参照できるようにすることにしました… もう1つの理由は、このメタスレッドが私をターゲットにしているためです。追加の入力を受け取った場合は、コメントしてください。 質問 C ++を使用してビットマップイメージをASCIIアートに変換するにはどうすればよいですか? いくつかの制約: グレースケール画像 等幅フォントの使用 シンプルに保つ(初心者レベルのプログラマーには高度なものを使用しない) これは関連するWikipediaページのASCIIアートです(@RogerRowlandに感謝します)。 ここでは、迷路とASCIIアートの変換に関する Q&Aが類似しています。

2
画像をPILからopenCV形式に変換します
画像をPILからOpenCVフォーマットに変換しようとしています。私はを使用していOpenCV 2.4.3ます。これが私が今まで試したことです。 >>> from PIL import Image >>> import cv2 as cv >>> pimg = Image.open('D:\\traffic.jpg') #PIL Image >>> cimg = cv.cv.CreateImageHeader(pimg.size,cv.IPL_DEPTH_8U,3) #CV Image >>> cv.cv.SetData(cimg,pimg.tostring()) >>> cv.cv.NamedWindow('cimg') >>> cv.cv.ShowImage('cimg',cimg) >>> cv.cv.WaitKey() しかし、画像はCV形式に変換されていないと思います。ウィンドウには大きな茶色の画像が表示されます。画像からフォーマットPILへの変換でどこが間違っていCVますか? また、cv.cv関数にアクセスするために入力する必要があるのはなぜですか?

8
写真の紙の角を検出するアルゴリズム
写真の請求書/領収書/用紙のコーナーを検出する最良の方法は何ですか?これは、OCRの前に、後続の遠近補正に使用されます。 私の現在のアプローチは: RGB>グレー>しきい値付きキャニーエッジ検出>膨張(1)>小さいオブジェクトの削除(6)>境界オブジェクトのクリア>凸領域に基づいて大きいブログを選択 > [コーナー検出-実装されていません] このタイプのセグメンテーションを処理するには、より堅牢な「インテリジェント」/統計的アプローチが必要だと思います。トレーニングの例はあまりありませんが、おそらく100枚の画像をまとめることができます。 幅広いコンテキスト: 私はプロトタイプにmatlabを使用しており、OpenCVおよびTesserect-OCRでシステムを実装する予定です。これは、この特定のアプリケーションで解決する必要がある多くの画像処理問題の最初のものです。だから私は自分のソリューションを展開し、画像処理アルゴリズムに慣れるようにしています。 アルゴリズムで処理したいサンプル画像は次のとおりです:挑戦したい場合は、大きな画像がhttp://madteckhead.com/tmpにあります。 (ソース:madteckhead.com) (ソース:madteckhead.com) (ソース:madteckhead.com) (ソース:madteckhead.com) 最良の場合、これは次のようになります。 (ソース:madteckhead.com) (ソース:madteckhead.com) (ソース:madteckhead.com) ただし、他の場合は簡単に失敗します。 (ソース:madteckhead.com) (ソース:madteckhead.com) (ソース:madteckhead.com) 素晴らしいアイデアをありがとうございます。大好き! 編集:ハフ変換の進行状況 Q:ハフラインをクラスター化してコーナーを見つけるアルゴリズムは何ですか?回答からのアドバイスに従って、ハフ変換を使用し、ラインを選択し、フィルタリングすることができました。私の現在のアプローチはかなり粗雑です。私は、請求書が常に画像とずれて15度未満になると仮定しました。これが当てはまる場合、行に対して妥当な結果が得られます(以下を参照)。しかし、コーナーを推定するためにラインをクラスター化(または投票)するための適切なアルゴリズムについて完全に確信はありません。ハフ線は連続していません。そして、ノイズの多い画像では、平行な線が存在する可能性があるため、線の起点メトリックからの何らかの形または距離が必要です。何か案は? (ソース:madteckhead.com)

3
「セグメンテーション」や「シーンラベリング」と比較した「セマンティックセグメンテーション」とは何ですか?
セマンティックセグメンテーションは単なるPleonasmですか、それとも「セマンティックセグメンテーション」と「セグメンテーション」の間に違いがありますか?「シーンのラベル付け」または「シーンの解析」に違いはありますか? ピクセルレベルのセグメンテーションとピクセル単位のセグメンテーションの違いは何ですか? (サイド質問:この種のピクセル単位のアノテーションがある場合、オブジェクト検出を無料で取得しますか、それともまだ何かする必要がありますか?) 定義の出典を教えてください。 「セマンティックセグメンテーション」を使用するソース ジョナサンロング、エヴァンシェルハマー、トレヴァーダレル:セマンティックセグメンテーションのための完全たたみ込みネットワーク。CVPR、2015およびPAMI、2016 ホン、スンフン、ヒョンウ、ハンヒョンウ:「半教師付きセマンティックセグメンテーションのための分離されたディープニューラルネットワーク」。arXivプレプリントarXiv:1506.04924、2015。 V. Lempitsky、A。Vedaldi、およびA. Zisserman:セマンティックセグメンテーションのパイロンモデル。神経情報処理システムの進歩、2011年。 「シーンラベリング」を使用するソース Clement Farabet、Camille Couprie、Laurent Najman、Yann LeCun:シーンのラベル付けの階層的機能の学習。パターン分析および機械知能、2013年。 「ピクセルレベル」を使用するソース Pinheiro、Pedro O.、Ronan Collobert:「畳み込みネットワークによる画像レベルからピクセルレベルのラベリングへ」コンピュータビジョンとパターン認識に関するIEEE会議の議事録、2015年(http://arxiv.org/abs/1411.6228を参照) 「pixelwise」を使用するソース Li、Hongsheng、Rui Zhao、Xiaogang Wang:「ピクセルごとの分類のための畳み込みニューラルネットワークの非常に効率的な前方および後方伝播」arXivプレプリントarXiv:1412.4526、2014。 Google Ngram 「セマンティックセグメンテーション」は、「シーンのラベル付け」よりも最近使用されているようです。

13
PHPで画像のサイズを変更する
フォームを介してアップロードした画像を自動的に147x147pxにサイズ変更するPHPコードを書きたいのですが、どうすればよいかわかりません(私は比較的PHPの初心者です)。 これまでのところ、画像は正常にアップロードされ、ファイルタイプは認識され、名前は整理されていますが、サイズ変更機能をコードに追加したいと思います。たとえば、2.3MB、1331x1331のサイズのテスト画像があり、コードでサイズを小さくしたいと思います。画像のファイルサイズも大幅に圧縮されると思います。 これまでのところ、私は次のものを持っています: if ($_FILES) { //Put file properties into variables $file_name = $_FILES['profile-image']['name']; $file_size = $_FILES['profile-image']['size']; $file_tmp_name = $_FILES['profile-image']['tmp_name']; //Determine filetype switch ($_FILES['profile-image']['type']) { case 'image/jpeg': $ext = "jpg"; break; case 'image/png': $ext = "png"; break; default: $ext = ''; break; } if ($ext) { //Check filesize if ($file_size …

11
多くの画像の類似性を比較するための画像指紋
すべての画像を他のすべての画像と非常に高速に比較するには、多くの画像(既存の約100.000、1日あたり新しい1000、RGB、JPEG、最大サイズ800x800)のフィンガープリントを作成する必要があります。ほぼ同じような画像も認識される必要があるため、バイナリ比較メソッドを使用できません。 最善の方法は既存のライブラリですが、既存のアルゴリズムへのヒントも私に役立ちます。

17
2つの画像間の類似性を測定するにはどうすればよいですか?[閉まっている]
閉まっている。この質問はスタックオーバーフローのガイドラインを満たしていません。現在、回答を受け付けていません。 この質問を改善してみませんか?Stack Overflowのトピックとなるように質問を更新します。 2年前休業。 この質問を改善する 1つのアプリケーション(Webページの場合もある)のスクリーンショットを以前に撮ったスクリーンショットと比較して、アプリケーションが正しく表示されているかどうかを確認します。アスペクトが少し異なる可能性があるため、完全一致の比較は必要ありません(Webアプリの場合、ブラウザーによっては、一部の要素が少し異なる場所にある可能性があります)。スクリーンショットがどの程度類似しているかの目安になります。 すでにそれを行うライブラリ/ツールはありますか?どのように実装しますか?

12
ほぼ重複する画像の検出[終了]
休業。この質問には、より焦点を当てる必要があります。現在、回答を受け付けていません。 この質問を改善してみませんか?質問を更新して、この投稿を編集するだけで1つの問題に焦点を当てます。 2年前休業。 この質問を改善する 与えられた画像のセットを互いに類似度で並べ替えるにはどうすればよいですか。 現時点では、2つの画像間のヒストグラム分析を行うシステムを持っていますが、これは非常にコストのかかる操作であり、やり過ぎに思われます。 最適には、各画像にスコア(たとえば、RGB平均などの整数スコア)を与えるアルゴリズムを探しており、そのスコアで並べ替えることができます。同一のスコアまたは隣同士のスコアは重複の可能性があります。 0299393 0599483 0499994 <- possible dupe 0499999 <- possible dupe 1002039 4995994 6004994 画像あたりのRGB平均は最低ですが、同様のものはありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.