信号処理 compression

1

ハフマンコーディングは、データ圧縮に使用されるエントロピーコーディングの広く使用されている方法です。これは、信号の統計について完全な知識があることを前提としています。ただし、ストリーミングメディアで使用され、信号の統計に関するすべてを知ることができないバージョンのハフマンコーディングがあります。これらの適応ハフマンエンコーダーはどのように機能しますか？

10 compression

1

線形予測コーディング（LPC）の背後にある理論

LPCの背後にある理論は何ですか？ LPCの特定の実装が、他の圧縮音声符号化方式よりも伝送または符号化エラーの量子化に対してより耐性があると言われているのはなぜですか？ LPCメソッドは、カルマンフィルターメソッドの使用と同様に、平滑化または短期の "予測"にも使用できますか？ LPCの使用はどのような条件または制約の下で有効ですか？

9 linear-systems voice compression linear-prediction

2

圧縮センシングとスパースコーディング

明らかに、「圧縮センシング」と呼ばれる同じフィールドを参照するために使用される異なる用語があります（このWikiページを参照）：圧縮センシング、圧縮サンプリング、またはスパースサンプリング。「スパースセンシング」についてはどうでしょうか。それにもかかわらず、インターネット検索の結果、「スパースコーディング」と呼ばれるものは、上で引用した他の用語の「圧縮センシング」フィールドを指していないようです。圧縮センシングとスパースコーディングの違いは本当にありますか？辞書学習についてはどうですか？

9 sampling compressive-sensing compression sparsity

2

フィルタリングされた信号とファイル圧縮のパラドックス

1.元の状況元の信号を、サンプルの数とチャネルの数をn含む列データマトリックスチャネルデータx:mxn (single)として持っm=120019ていn=15ます。また、フィルターされた信号をフィルターされた列データマトリックスとして持っていますx:mxn (single)。元のデータは主にランダムで、センサーピックアップからのゼロを中心にしています。の下でMATLAB、saveオプションなしでbutter、ハイパスフィルターとして、およびsingleフィルタリング後のキャストに使用しています。 save本質的にはバイナリHDF5フォーマットにGZIPレベル3 圧縮を適用するため、ファイルサイズは情報コンテンツの優れた推定値、つまりランダム信号では最大、一定信号ではゼロに近いと想定できます。元の信号を保存すると2MBのファイルが作成され、フィルタリングされた信号を保存すると、5MBのファイル（？！）が作成されます。 2.質問フィルター処理された信号に含まれる情報が少なく、フィルターによって削除されることを考えると、フィルター処理された信号のサイズが大きくなる可能性はありますか？ 3.簡単な例簡単な例： n=120019; m=15;t=(0:n-1)'; x=single(randn(n,m)); [b,a]=butter(2,10/200,'high'); xf=filter(b,a,x); save('x','x'); save('xf','xf'); 元の信号とフィルター処理された信号の両方に対して6 MBのファイルを作成します。これは、純粋なランダムデータを使用するため、以前の値よりも大きくなります。ある意味では、フィルター処理された信号がフィルター処理された信号よりもランダムであることを示します（？！）。 4.評価例以下を検討してください。ランダム信号から作成されたフィルターバツrバツrx_r ガウスノイズから〜N（0 、1 ）〜N（0、1）\sim N(0,1)、および一定の信号バツcバツcx_c に等しい 111。データ型、すなわちのみレットの使用を無視しdouble、データサイズを無視します。つまり、1 MBの1つの列データベクトルを使用します。 n = 125000ん=125000n=125000、 m = 1メートル=1m=1。考えてみましょう aaaテスト用のランダム性インデックスとしてのパラメータ：x = αバツr+ …

9 matlab filters compression

2

いくつかの典型的なロスレス圧縮比は何ですか？

クライアントが250 GBのファイルを送ろうとしました。データを共有するさまざまな方法を試みた後、彼は私にサイズがわずか4 GBの圧縮フォルダーを送った。それは圧縮が強すぎるように思えます-圧縮したときにサイズを20％以上縮小したことはないと思います。実際に見られる典型的なロスレス圧縮率は何ですか？（あるいは、範囲。）更新：実際の情報内容を推測することなしに言うことは不可能であることを私は理解しています。クライアントのデータを共有できません。しかし、XMLファイルを見ると、繰り返されるフレーズがたくさんあります。 <thing> <property="1" value="2" /> <property="3" value="4" /> <property="5" value="6" /> <property="7" value="8" /> <property="9" value="10" /> <property="11" value="12" /> <property="13" value="14" /> </thing> これはかなり圧縮できるようです。

8 compression information-theory

2

MP3エンコードアルゴリズムに関する参考資料

誰かがMP3アルゴリズムを段階的に説明し、明確に理解できるリファレンスがありますか？これらの参照は少し混乱しました：修正離散コサイン変換を使用したオーディオ圧縮、MP3コーディング標準、Joebert S. Jacaba、2001 Theory Behind Mp3、Rassol Raissi、2002 手順を完全に理解するために、手動で紹介したリファレンスを読んだ後、ビットストリームをMP3にエンコードします。

7 algorithms reference-request compression mp3

1

音声圧縮-LPCでは、線形予測フィルターは一般的なレベルでどのように機能しますか？

こんにちは、私はマルチメディアシステムコースを受講しており、火曜日の試験の準備をしています。一般的なレベルでLPC圧縮について理解しようとしていますが、線形予測フィルター部分で何が起こっているのか問題があります。これはこれまでのところ私の理解です： LPCは、アナログ信号をデジタル化し、セグメントに分割することによって機能します。各セグメントについて、信号の主要な特徴を決定し、これらを可能な限り正確にエンコードしようとします。主な機能は、信号のピッチ（つまり、基本的なフォルマント周波数）、信号のラウドネス、および音声が有声か無声かです。声道励起パラメータと呼ばれるパラメータも決定され、声道モデルで使用されて、音を生成した声道の状態をより適切にモデル化します。このデータはネットワークを介して渡され、受信側でデコードされます。信号のピッチは有声または無声シンセサイザーへの入力として使用され、ラウドネスデータはこの結果の信号の振幅をブーストするために使用されます。私のノートでは、声道モデルは線形予測フィルターを使用し、n番目のサンプルは、前のpサンプルとシンセサイザーからのエラー項の線形結合であると述べています。これは、エンコーダーとデコーダーの両方で最後のpサンプルの移動平均を維持することを意味しますか？エンコーダでこの平均信号と実際の信号の差に対応するデータのみを送信するようにするには、なぜこれらの以前のサンプルの線形結合なのですか？私の理解では、音のラウドネス、周波数、有声/無声の性質を抽出し、実際の信号と予測信号との差ができるだけ小さくなるようにそれらを選択することにより、これらの声道励起パラメータを生成します。確かに、これらの前のサンプルの平均が次のサンプルのより良い指標になるでしょうか？あなたがそれらを指摘することができれば私の理解に穴があればそれは素晴らしいでしょう！前もって感謝します！

7 audio speech voice compression linear-prediction

タグ付けされた質問 「compression」

タグ付けされた質問「compression」