信号処理

5

TeXスタック交換については、この質問の段落で「川」を検出する方法について議論してきました。。この文脈では、川はテキスト内の単語間スペースの偶発的な整列から生じる空白のバンドです。これは読者にとって非常に注意をそらす可能性があるため、悪い川はタイポグラフィの悪さの症状であると考えられています。川のあるテキストの例はこれです。2本の川が斜めに流れています。これらの川を自動的に検出することに関心があり、それらを回避することができます（おそらくテキストを手動で編集することによって）。RaphinkはTeXレベル（グリフの位置と境界ボックスのみを知っている）である程度進歩していますが、川を検出する最良の方法は画像処理を使用することだと確信しています（グリフの形状は非常に重要であり、TeXでは利用できないため）。上記の画像から川を抽出するさまざまな方法を試しましたが、少量の楕円形のぼかしを適用するという私の単純なアイデアは十分ではないようです。私もいくつか試しましたラドンハフ変換ベースのフィルタリングですが、これらのいずれにもアクセスできませんでした。川は人間の目/網膜/脳の特徴検出回路に非常に見えており、何らかの形でこれを何らかのフィルタリング操作に変換できると思いますが、機能させることはできません。何か案は？具体的には、上記の画像で2つの河川を検出する操作を探していますが、他の誤検出はあまりありません。編集： Endolithは、TeXではグリフの位置、間隔などにアクセスできるため、画像処理ベースのアプローチを追求している理由を尋ねました。実際のテキストを調べるアルゴリズムを使用する方がはるかに高速で信頼性が高いかもしれません。物事を別の方法で行う理由は、その形がグリフの大きさは川の目立ち方に影響を与える可能性があり、テキストレベルでは、この形状（フォント、合字などに依存）を考慮することは非常に困難です。グリフの形状がどのように重要であるかの例については、次の2つの例を検討してください。それらの違いは、いくつかのグリフをほぼ同じ幅の他のグリフに置き換えたことです。それらも同様に良い/悪い。ただし、最初の例の川は2番目の例よりもはるかに悪いことに注意してください。

175 image-processing

8

フーリエ変換がなぜそれほど重要なのですか？

信号処理を議論するとき、誰もがフーリエ変換について議論します。信号処理がなぜそれほど重要であり、信号について何を教えてくれますか？デジタル信号処理にのみ適用されますか、それともアナログ信号にも適用されますか？

129 fourier-transform

6

画像の場合、周波数領域は何を示していますか？

私は画像の周波数領域について学んでいました。波の場合の周波数スペクトルを理解できます。波に存在する周波数を示します。我々はの周波数スペクトルを描く場合cos(2πft)cos⁡(2πft)\cos(2\pi f t)、私たちはでインパルス信号を取得−f−f-fと+f+f+f。また、対応するフィルターを使用して特定の情報を抽出できます。しかし、画像の場合、周波数スペクトルは何を意味しますか？OpenCVで画像のFFTを取得すると、奇妙な画像が表示されます。この画像は何を示していますか？そして、そのアプリケーションは何ですか？私はいくつかの本を読みましたが、それらは物理的な意味よりも多くの数学的な方程式を与えます。だから誰も画像処理でそれを簡単に適用して画像の周波数領域の簡単な説明を提供できますか？

110 image-processing frequency-spectrum dft

9

負の周波数の物理的意義は何ですか？

これは私のDSP理解のチェダーチーズブロックの穴の1つでしたが、負の周波数を持つことの物理的な解釈は何ですか？ある周波数で物理的なトーンがあり、それがDFTされている場合、正と負の両方の周波数で結果が得られます。これはなぜ、どのように発生しますかどういう意味ですか？編集：2011年10月18日。私は自分で答えを提供しましたが、負の周波数が存在しなければならない理由の根を含むように質問を拡大しました。

83 frequency

6

フーリエ変換を行う前に、なぜ信号をゼロパッドする必要があるのですか？

前の質問への回答では、1 入力信号をゼロで埋めます（波の少なくとも半分が「空白」になるように最後にゼロを追加します）この理由は何ですか？

77 fft zero-padding

4

フーリエ変換とコサイン変換の違いは何ですか？

音声認識では、フロントエンドは一般に信号処理を行って、オーディオストリームからの特徴抽出を可能にします。このプロセスでは、離散フーリエ変換（DFT）が2回適用されます。最初はウィンドウ処理後です。このメルビニングが適用された後、別のフーリエ変換が行われます。しかし、2番目の操作にDFTではなく離散コサイン変換（DCT）を使用することは、音声認識プログラム（たとえば、CMU Sphinxの既定のフロントエンド）で一般的であることに気付きました。これら2つの操作の違いは何ですか？なぜ初めてDFTを行い、次にDCTを2回目にするのですか？

75 dct dft

3

FFTビンをゼロにすることでフィルタリングするのはなぜ悪い考えですか？

FFTを実行し、いくつかのビンをゼロにしてからIFFTを実行することで、信号をフィルタリングするのは非常に簡単です。例えば： t = linspace(0, 1, 256, endpoint=False) x = sin(2 * pi * 3 * t) + cos(2 * pi * 100 * t) X = fft(x) X[64:192] = 0 y = ifft(X) 高周波成分は、この「ブリックウォール」FFTフィルターによって完全に除去されます。しかし、これは良い方法ではないと聞いたことがあります。なぜ一般に悪い考えですか？それが大丈夫か良い選択かという状況はありますか？ [ pichenettesが示唆するとおり ]

72 fft filters

4

システムの「インパルス応答」と「周波数応答」とはどういう意味ですか？

誰もが簡単な英語で周波数応答とインパルス応答の違いを述べることができますか？

71 frequency impulse-response linear-systems frequency-response

4

商用アプリケーションで使用できるSIFT / SURFの無料の代替品は何ですか？

私の知る限り、SURFとSIFTはどちらも特許で保護されています。商用アプリケーションで自由に使用できる代替方法はありますか？特許の詳細については、http：//opencv-users.1802565.n2.nabble.com/SURF-protected-by-patent-td3458734.htmlをご覧ください。

66 image-processing computer-vision local-features sift

9

ビジョンと画像処理で頻繁にHSV色空間を使用するのはなぜですか？

追跡、人間の検出などのために、あらゆる場所でHSV色空間が使用されているのがわかります。なぜだろうか。この色空間について、RGBを使用するよりも優れているのは何ですか？

64 image-processing computer-vision

6

人間が最大20 kHzの周波数の音しか聞こえない場合、なぜ音楽オーディオは44.1 kHzでサンプリングされるのですか？

一部の場所では、音楽はほとんど44.1 kHzでサンプリングされるのに対して、最大20 kHzしか聞こえないことを読みました。それはなぜです？

60 audio sampling nyquist

4

テレビの静的ノイズが常に白黒であるのはなぜですか？

1960年代以降（NTSCおよびPAL規格の導入後）に製造された最新のCathode Ray Tube（CRT）テレビは、色信号の回路ベースのデコードをサポートしていました。新しいカラーセットは、新しいテレビセットがその日の古い白黒放送と後方互換性を持つことを可能にするために作成されたことはよく知られています（また、他の多くのレガシー機能と宗教的に後方互換性があります）。新しい色標準では、より高い搬送周波数で色情報が追加されました（ただし、同じ明るさの期間）。カラー情報は各水平線の開始後に同期され、カラーバーストとして知られています。テレビにノイズを入力すると、テレビは白黒ノイズだけでなく、各フレームのある新しい水平線に色情報があるため、色ノイズも発生するようです。しかし、これはそうではありません。すべてのカラーテレビはまだ白黒のノイズを発しているからです。これはなぜですか？以下は、単一の水平スキャンの信号例です。そして、すべての水平スキャンが同じである場合の結果の画像です（バーが表示されます！）。

58 noise color analog video

8

相互相関を実装して、2つのオーディオファイルが似ていることを証明するにはどうすればよいですか？

2つのオーディオファイルを相互相関させて、それらが類似していることを証明する必要があります。2つのオーディオファイルのFFTを取得し、それらのパワースペクトル値を別々の配列に格納しています。それらを相互相関させて、それらが類似していることを証明するには、どのようにさらに進める必要がありますか？それを行うより良い方法はありますか？基本的なアイデアは、それを学び、適用するのに役立ちます。

58 audio fft waveform-similarity cross-correlation

8

フォローする価値のある優れた信号および画像処理ブログは何ですか？

画像や信号処理の研究に関する最新のニュースや論文の最新情報を入手できるサイトやブログがありますか、それともIEEE Transactions、Elsevierなどの「古典的な」プロバイダーを確認する必要がありますか？

54 image-processing

2

PSDを計算する多くの方法があるのはなぜですか？

Welchの方法は、均等にサンプリングされた時系列のパワースペクトル密度（PSD）を計算するための私の頼れるアルゴリズムでした。PSDを計算する方法は他にもたくさんあることに気付きました。たとえば、Matlabでは次のように表示されます。バーグ法を使用したPSD 共分散法を使用したPSD ピリオドグラムを使用したPSD 修正共分散法を使用したPSD マルチテーパー法（MTM）を使用したPSD ウェルチ法を使用したPSD Yule-Walker AR法を使用したPSD 短時間フーリエ変換を使用したスペクトログラムスペクトル推定これらのさまざまな方法の利点は何ですか？実用的な質問として、いつウェルチの方法以外のものを使用したいのですか？

53 frequency-spectrum power-spectral-density psd