タグ付けされた質問 「algorithms」

アルゴリズムは、信号を処理するための明確に定義された命令のステップの有限リストで表される方法です。

1
小さなシフトとスケールに不変のデータ分解方法?
次元を減らすために射影行列を推定するが、同じクラスからの元のデータのスケール、シフト、および回転がわずかに異なる場合に、ユークリッド距離の項で類似のベクトルを遠くに射影しない固有値に類似したデータ分解方法はありますか(2D場合)。 y= Ex ;y=Eバツ;y = E x; 例えば、ECG分類問題の例。有酸素運動の周期は異なります。さらに、スケールとシフトはビート検出の精度に依存します。したがって、同じクラスに属する循環器は、その変動のために遠くに投影される可能性があります。

5
カルマンフィルター-実装、パラメーター、チューニング
まず、カルマンフィルターを作成するのはこれが初めてです。 私は以前、次の質問を投稿しました。この投稿の背景を説明しているStackOverflowで、ノイズと速度値からの変動を除外します。これは私がフィルタリングしようとしている値の典型的なサンプルです。ここでは、必ずしも減少する必要はありません。しかし、変化率は通常、このようなものです X ------- Y 16 --- 233.75 24 --- 234.01 26 --- 234.33 32 --- 234.12 36 --- 233.85 39 --- 233.42 47 --- 233.69 52 --- 233.68 55 --- 233.76 60 --- 232.97 66 --- 233.31 72 --- 233.99 このチュートリアルに従って、カルマンフィルターを実装しました:カルマンフィルター(ダミー用)。 私の実装は次のようになります(疑似コード)。 //Standard deviation is 0.05. Used in calculation …

2
線形/ロジスティック回帰アプリケーションの例
信号処理(具体的には画像処理)への線形回帰またはロジスティック回帰の超単純なアプリケーションについて疑問に思っていましたか? 私は信号/画像処理の人々にいくつかの数学的な方法を説明するように求められた数学の男であり、彼らの分野に関連するいくつかの簡単な例を使用できるようにしたいのですが、画像処理についてはほとんど知りません。だから、私は複雑なものを探しているわけではありません(私は主題がわからないので、単純な方が良いです。これらのアルゴリズムの適用性を示すために何かを見つけたいと思っています)。 ご協力ありがとうございました!

3
指紋認識を始めるには?
私はMatlabとデジタル画像処理から始めました。指紋認証をしようとしています。私はこれについて多くの研究論文を見つけましたが、どこから始めればよいかわかりません。簡潔に言うと、指紋認識を行うための最も基本的なアプローチ/アルゴリズムは何ですか?

1
周波数変調合成アルゴリズム
私が読んだ内容に基づいて、FMサウンド合成のアルゴリズムを作成しました。正しくできたかどうかはわかりません。ソフトウェアシンセ楽器を作成する場合、関数を使用して発振器を生成し、変調器を使用してこの発振器の周波数をモジュール化できます。FM合成が正弦波の変調にのみ機能すると想定されているかどうかはわかりませんか? アルゴリズムは、計測器の波動関数と、周波数変調器の変調器インデックスおよび比率を使用します。各ノートでは、周波数を受け取り、キャリアと変調器の発振器の位相値を保存します。変調器は常に正弦波を使用します。 これは疑似コードのアルゴリズムです: function ProduceSample(instrument, notes_playing) for each note in notes_playing if note.isPlaying() # Calculate signal if instrument.FMIndex != 0 # Apply FM FMFrequency = note.frequency*instrument.FMRatio; # FM frequency is factor of note frequency. note.FMPhase = note.FMPhase + FMFrequency / kGraphSampleRate # Phase of modulator. frequencyDeviation = sin(note.FMPhase * PI)*instrument.FMIndex*FMFrequency …

2
勾配ベースのハフ変換を実装する方法
私はエッジ検出にハフ変換を使用しようとしています、そして基礎として勾配画像を使用したいと思います。 私はこれまでやっていること、画像所与のIサイズの[M,N]とその偏導関数gx、gy、各画素の勾配角度を計算することですthetas = atan(gy(x,y) ./ gx。同様に、勾配の大きさをとして計算しmagnitudes = sqrt(gx.^2+gy.^2)ます。 ハフ変換を作成するには、次のMATLABコードを使用します。 max_rho = ceil(sqrt(M^2 + N^2)); hough = zeros(2*max_rho, 101); for x=1:M for y=1:N theta = thetas(x,y); rho = x*cos(theta) + y*sin(theta); rho_idx = round(rho)+max_rho; theta_idx = floor((theta + pi/2) / pi * 100) + 1; hough(rho_idx, theta_idx) = hough(rho_idx, theta_idx) + …

1
LFOを使用してオシレーターピッチを変調するアルゴリズムのヘルプ
アナログシンセサイザーのソフトウェアエミュレーションを開発しています。LFOを使用してオシレーターのピッチを変調しようとしています。コンピューターのサウンドシステムに供給される各サンプルについて、メインオシレーターに入力する周波数を次のように計算しています(擬似コード)。 osc_frequency = note_frequency * (1 + tuning) * (1 + lfo_y * lfo_mod_depth) このステートメントの変数は次のとおりです。 note_frequency =再生する音の周波数(Hz) チューニング=オシレーターの再生ピッチのパーセントでの微調整(例:-0.02 = 2%離調) lfo_y = lfo波形の現在のy値(範囲は-1から1) lfo_mod_depth =オシレーターに適用する効果の深さ/強度(パーセント) ただし、この計算では望ましい結果は得られません。中心周波数を中心にロックされたピッチが上下に変化するのが聞こえると思います(演奏中のノート)。私が得ているのは、ピッチを「逃がす」モジュレーションエフェクトです。何が起こっているのか正確にはわかりませんが、次のように聞こえます。 変調強度は時間とともに増加します(変調が到達する高/低周波数マークは、ノートが長く保持されるほど高く/低くなります) 変調強度は時間とともに一定のままですが、中心周波数は増加しますが、変調はその周囲で振動します 私は正しいアプローチを使用していますか?そうでない場合、正しいアプローチはどうあるべきですか?これでどんな助けでも大歓迎です。

4
DSP用に最適化されたAnsi Cライブラリ
DSPは初めてですか?オープンソースDSPアルゴリズムの優れたリソースはどこにありますか? MATLABはプロトを作成するのに優れていますが、Cコーディングに移行すると、時間がかかり、多くの間違いを犯します。フィルターなどのさまざまな実装のためのCコードの適切なリポジトリーが必要だと思います。どのポインターも良いでしょう。
8 algorithms  c 

2
データの2Dマップの主な方向
それは非常に単純な質問かもしれません。コメント、ガイド、または完全な解決策をお願いします。ただし、不完全な解決策ではなく、斬新で実用的なアイデアを優先します。 -変動の主な方向、つまり次の図の例(北東、南西)の主対角線を見つける方法は? アルゴリズムやコーディングやスニペットのアイデアは大歓迎です。 更新: 承認された回答に記載されている手順は、最も単純な実装ではほぼPCA(主成分分析)であることがわかりました。PCAは非常によく機能しました。結果として生じる方向は、視覚的に予想できるものと完全に一致しています。

1
ビデオの半一定フレームから固定テンプレート画像を検出する
ビデオのさまざまな「状態」を検出するために、さまざまなビデオゲームを処理しようとしているビデオがいくつかあります。 私が取り組んでいる最初のゲームは、スーパーストリートファイター4のエディションです。 その中で、「vs」のキャラクター画面がいつ表示されるのかを検知したいと思います。ビデオの1フレームの例を次に示します。 (から取ら〜10秒マークのこの動画) 「vs」を検出できた場合、ビデオのフレームが「vs」画面であることを検出できるため、他の情報を探すことができます(今のところ、これを使用して試合が始まる直前の動画のタイムスタンプを検出します)。 とは言っても、ここで私が処理するビデオのフレームについて想定できることはこれです(これが唯一のビデオではなく、数万または数十万とは言わないまでも数千のビデオがありますが、処理におけるスケールの問題)多くのビデオは完全に異なるドメインです): 可能な限り最低解像度の画像を処理して、信頼性の高い結果を得ることが望ましい(低解像度=処理時間の高速化)。上の画像は480 x 270ピクセル(18のYouTubeビデオfmtから取得)ですが、サイズが異なる場合があります(fmt18のYouTubeビデオですが、サイズは640 x 360ピクセルです)。 ほとんどの動画は直接フィードされます ほとんどの動画は16:9のアスペクト比になります 赤みがかった背景はアニメーション化されますが、一般的にはそのオレンジ赤の色(炎)内にあります バージョンを示すために、「vs」の下部にフェードイン/アウトバッジが表示される場合があります(これは重要ですが、現時点では重要ではありません)。 (このビデオの〜3sマークから取得。また、上記は640 x 360ピクセルの解像度であることに注意してください) 「vs」のサイズと位置は、他の直接フィード動画に比例してほぼ同じになります(まだ確認していませんが、動かないことはわかっています)。 キャラクターは、両側に30を超えるプールから選択されます(つまり、フレームの領域は異なります)。 ビデオの長さは通常2〜4分で、4,000〜6,00フレームです。ただし、他のさまざまなゲームやライブアクションがカットされた長いビデオ(おそらく2時間)があるかもしれません。これらのビデオはそれほど重要ではありませんが、解決策から、特定のゲームが全体の大きなビデオのどこにポップアップ表示されるかがわかったら、すばらしいです。 キャプチャのネイティブ解像度は720pなので、「vs」のベースラインイメージは、「ネイティブ」サイズと見なされるサイズで取得できます。 最終的に、私はコードに.NETで、このパイプラインを探していますが、それはありませんスーパー重要なのは、概念実証のは、私が翻訳し、.NETのためにそれを最適化することができるように含まれる技術の理解だけでなく、ここではより重要です同じジャンルの他のゲームの他のビデオ(もし私が重要な弁別器を見つけることができれば、そしてUltimate Marvel対Capcom 3、Street Fighter x Tekken、BlazBlue:Continuum Shiftなど)のビデオも同様です。 私もMathematicaに足を踏み入れており、ホームバージョン8.0を持っているので、その環境での概念実証も歓迎されます。

5
ハイダイナミックレンジ用の高速かつ正確な畳み込みアルゴリズム(FFTなど)
FFTベースのたたみ込みでは、1の根の周りのすべてを評価するため、浮動小数点の解像度が制限されているようです。 1014101410^{14}このPythonコードの-factorエラー: from scipy.signal import convolve, fftconvolve a = [1.0, 1E-15] b = [1.0, 1E-15] convolve(a, b) # [ 1.00000000e+00, 2.00000000e-15, 1.00000000e-30] fftconvolve(a, b) # [ 1.00000000e+00, 2.11022302e-15, 1.10223025e-16] この問題の影響を受けない高速畳み込みアルゴリズムはありますか? または、直接(2次時間)畳み込みが正確な解を得る唯一の方法ですか? (そのような小さい数が切り落とさないように十分重要であるかどうかは私のポイントの外です。)

2
Photoshop CCで詳細を保持するアップサンプリングの基本的なアルゴリズムは何ですか?
Photoshop CCのディテールを維持するアップサンプリングアルゴリズムは本当に素晴らしいです。ほぼリアルタイムで詳細を保持しながら、あらゆる画像を拡大できます。そして、それがどのように実装されているのか、本当に疑問に思います。 私はキーワードで論文を検索することから始めましたsingle image super resolution。そして、現在の最先端のアルゴリズムは、欠けている高周波情報を推測するために訓練された外部データベースを必要とするようです。完全な辞書をトレーニングして配布するのは本当に難しいと思いますよね?また、画像ピラミッドを含む辞書をリアルタイムでトレーニングすることはできないと思います。 その後、アルゴリズムにimage upsampling比べて十分高速に見えるの領域に目を向けましたが、super resolution非常に多くのアルゴリズムがあり、私は完全に迷っています。 それで、誰かがそのツールをどのように実装できるかについて推測やヒントがありますか?ありがとう!

4
DSPの目的で、固定小数点演算でさまざまな数学関数を実装するための書籍/リソース
以下を詳細にカバーする本またはリソースを探しています。 DSPの目的で、固定小数点演算で数学関数(対数、指数、正弦、余弦、逆など)を実装する。 ルックアップテーブル、テイラーシリーズなどを使用するような手法 私はCプログラミングにかなり精通しており、効率的な方法でさまざまな数学関数を実装する方法についてのアルゴリズムにもっと興味があります。

2
加法性ホワイトガウスノイズを伴う未知の矩形パルスの持続時間
問題。 離散信号f[ 私]f[私]f[i](以下の例)。は加法性ホワイトガウスノイズを含む矩形パルスの形をしている ことが知られています。f[ 私]f[私]f[i] f[ i ] = s [ i ] + n [ i ]f[私]=s[私]+ん[私]f[i] = s[i] + n[i]、 s [ i ] = α (θ [ i −私1] - θ [ I -私2] )+ cs[私]=α(θ[私−私1]−θ[私−私2])+cs[i] = \alpha(\theta[i - i_{1}] - \theta[i - i_{2}]) + c、 私2>私1私2>私1i_{2} …

2
MP3エンコードアルゴリズムに関する参考資料
誰かがMP3アルゴリズムを段階的に説明し、明確に理解できるリファレンスがありますか? これらの参照は少し混乱しました: 修正離散コサイン変換を使用したオーディオ圧縮、MP3コーディング標準、Joebert S. Jacaba、2001 Theory Behind Mp3、Rassol Raissi、2002 手順を完全に理解するために、手動で紹介したリファレンスを読んだ後、ビットストリームをMP3にエンコードします。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.