信号処理

信号、画像およびビデオ処理の芸術および科学の実務家のためのQ&A

5
テキスト内の「川」の検出
TeXスタック交換については、この質問の段落で「川」を検出する方法について議論してきました。。 この文脈では、川はテキスト内の単語間スペースの偶発的な整列から生じる空白のバンドです。これは読者にとって非常に注意をそらす可能性があるため、悪い川はタイポグラフィの悪さの症状であると考えられています。川のあるテキストの例はこれです。2本の川が斜めに流れています。 これらの川を自動的に検出することに関心があり、それらを回避することができます(おそらくテキストを手動で編集することによって)。RaphinkはTeXレベル(グリフの位置と境界ボックスのみを知っている)である程度進歩していますが、川を検出する最良の方法は画像処理を使用することだと確信しています(グリフの形状は非常に重要であり、TeXでは利用できないため) 。上記の画像から川を抽出するさまざまな方法を試しましたが、少量の楕円形のぼかしを適用するという私の単純なアイデアは十分ではないようです。私もいくつか試しましたラドンハフ変換ベースのフィルタリングですが、これらのいずれにもアクセスできませんでした。川は人間の目/網膜/脳の特徴検出回路に非常に見えており、何らかの形でこれを何らかのフィルタリング操作に変換できると思いますが、機能させることはできません。何か案は? 具体的には、上記の画像で2つの河川を検出する操作を探していますが、他の誤検出はあまりありません。 編集: Endolithは、TeXではグリフの位置、間隔などにアクセスできるため、画像処理ベースのアプローチを追求している理由を尋ねました。実際のテキストを調べるアルゴリズムを使用する方がはるかに高速で信頼性が高いかもしれません。物事を別の方法で行う理由は、その形がグリフの大きさは川の目立ち方に影響を与える可能性があり、テキストレベルでは、この形状(フォント、合字などに依存)を考慮することは非常に困難です。グリフの形状がどのように重要であるかの例については、次の2つの例を検討してください。それらの違いは、いくつかのグリフをほぼ同じ幅の他のグリフに置き換えたことです。それらも同様に良い/悪い。ただし、最初の例の川は2番目の例よりもはるかに悪いことに注意してください。

8
フーリエ変換がなぜそれほど重要なのですか?
信号処理を議論するとき、誰もがフーリエ変換について議論します。信号処理がなぜそれほど重要であり、信号について何を教えてくれますか? デジタル信号処理にのみ適用されますか、それともアナログ信号にも適用されますか?

6
画像の場合、周波数領域は何を示していますか?
私は画像の周波数領域について学んでいました。 波の場合の周波数スペクトルを理解できます。波に存在する周波数を示します。我々はの周波数スペクトルを描く場合cos(2πft)cos⁡(2πft)\cos(2\pi f t)、私たちはでインパルス信号を取得−f−f-fと+f+f+f。また、対応するフィルターを使用して特定の情報を抽出できます。 しかし、画像の場合、周波数スペクトルは何を意味しますか?OpenCVで画像のFFTを取得すると、奇妙な画像が表示されます。この画像は何を示していますか?そして、そのアプリケーションは何ですか? 私はいくつかの本を読みましたが、それらは物理的な意味よりも多くの数学的な方程式を与えます。だから誰も画像処理でそれを簡単に適用して画像の周波数領域の簡単な説明を提供できますか?

9
負の周波数の物理的意義は何ですか?
これは私のDSP理解のチェダーチーズブロックの穴の1つでしたが、負の周波数を持つことの物理的な解釈は何ですか? ある周波数で物理的なトーンがあり、それがDFTされている場合、正と負の両方の周波数で結果が得られます。これはなぜ、どのように発生しますか どういう意味ですか? 編集:2011年10月18日。私は自分で答えを提供しましたが、負の周波数が存在しなければならない理由の根を含むように質問を拡大しました。
83 frequency 


4
フーリエ変換とコサイン変換の違いは何ですか?
音声認識では、フロントエンドは一般に信号処理を行って、オーディオストリームからの特徴抽出を可能にします。このプロセスでは、離散フーリエ変換(DFT)が2回適用されます。最初はウィンドウ処理後です。このメルビニングが適用された後、別のフーリエ変換が行われます。 しかし、2番目の操作にDFTではなく離散コサイン変換(DCT)を使用することは、音声認識プログラム(たとえば、CMU Sphinxの既定のフロントエンド)で一般的であることに気付きました。これら2つの操作の違いは何ですか?なぜ初めてDFTを行い、次にDCTを2回目にするのですか?
75 dct  dft 

3
FFTビンをゼロにすることでフィルタリングするのはなぜ悪い考えですか?
FFTを実行し、いくつかのビンをゼロにしてからIFFTを実行することで、信号をフィルタリングするのは非常に簡単です。例えば: t = linspace(0, 1, 256, endpoint=False) x = sin(2 * pi * 3 * t) + cos(2 * pi * 100 * t) X = fft(x) X[64:192] = 0 y = ifft(X) 高周波成分は、この「ブリックウォール」FFTフィルターによって完全に除去されます。 しかし、これは良い方法ではないと聞いたことがあります。 なぜ一般に悪い考えですか? それが大丈夫か良い選択かという状況はありますか? [ pichenettesが示唆するとおり ]
72 fft  filters 





4
テレビの静的ノイズが常に白黒であるのはなぜですか?
1960年代以降(NTSCおよびPAL規格の導入後)に製造された最新のCathode Ray Tube(CRT)テレビは、色信号の回路ベースのデコードをサポートしていました。新しいカラーセットは、新しいテレビセットがその日の古い白黒放送と後方互換性を持つことを可能にするために作成されたことはよく知られています(また、他の多くのレガシー機能と宗教的に後方互換性があります)。新しい色標準では、より高い搬送周波数で色情報が追加されました(ただし、同じ明るさの期間)。カラー情報は各水平線の開始後に同期され、カラーバーストとして知られています。 テレビにノイズを入力すると、テレビは白黒ノイズだけでなく、各フレームのある新しい水平線に色情報があるため、色ノイズも発生するようです。しかし、これはそうではありません。すべてのカラーテレビはまだ白黒のノイズを発しているからです。 これはなぜですか? 以下は、単一の水平スキャンの信号例です。 そして、すべての水平スキャンが同じである場合の結果の画像です(バーが表示されます!)。
58 noise  color  analog  video 

8
相互相関を実装して、2つのオーディオファイルが似ていることを証明するにはどうすればよいですか?
2つのオーディオファイルを相互相関させて、それらが類似していることを証明する必要があります。2つのオーディオファイルのFFTを取得し、それらのパワースペクトル値を別々の配列に格納しています。 それらを相互相関させて、それらが類似していることを証明するには、どのようにさらに進める必要がありますか?それを行うより良い方法はありますか?基本的なアイデアは、それを学び、適用するのに役立ちます。


2
PSDを計算する多くの方法があるのはなぜですか?
Welchの方法は、均等にサンプリングされた時系列のパワースペクトル密度(PSD)を計算するための私の頼れるアルゴリズムでした。PSDを計算する方法は他にもたくさんあることに気付きました。たとえば、Matlabでは次のように表示されます。 バーグ法を使用したPSD 共分散法を使用したPSD ピリオドグラムを使用したPSD 修正共分散法を使用したPSD マルチテーパー法(MTM)を使用したPSD ウェルチ法を使用したPSD Yule-Walker AR法を使用したPSD 短時間フーリエ変換を使用したスペクトログラム スペクトル推定 これらのさまざまな方法の利点は何ですか?実用的な質問として、いつウェルチの方法以外のものを使用したいのですか?

Licensed under cc by-sa 3.0 with attribution required.