タグ付けされた質問 「sox」

1
ギャップを残しながら、音声ファイルから無音を削除します
現在、シェルファイル内でこのコマンドを使用して、オーディオファイルから無音部分を削除しています。 ffmpeg -i $INFILE -af silenceremove=0:0:0:-1:1:${NOISE_TOLERANCE}dB -ac 1 $SILENCED_FILE -y これは、すべての無音を削除し、残りのオーディオを一緒に圧縮することを除いて、正常に機能します。 各オーディオの間に2〜3秒を残して、これをどのように行うことができますか 多くのオーディオを処理するため、ソリューションは非常に効率的である必要があり、ffmpegやsoxなど、LinuxとOSXの両方に簡単にインストールできるツールを使用する必要があります。

4
無音が検出されたらソックスの録音を終了する
soxを使用して会話を記録するスクリプトを書いています。今、録音を開始する前に、soxが音を検出するまで待つ必要があり、それを把握しました。しかし、少なくとも3秒間無音状態になったら終了するためにsoxも必要です。現状では、話を終えたら手動でsoxを強制終了する必要があります。そうでなければ、soxはさらに話をするまで再び待機し、出力ファイルに追加します(これは望んでいないことです)。現在使用している録音コマンドは次のとおりです。 rec /tmp/recording.flac rate 32k silence 1 0.1 3% -1 3.0 3% 繰り返しますが、わかりやすくするために、Soxは会話を開始するまで待機し、会話を停止するまで録音してから、soxプログラムを終了する必要があります。
16 scripting  audio  sox 

1
sox:無音でオーディオを分割しますが、尾を残します
soxが音声ファイルを無音で分割する機能が気に入っています。私が抱えている問題は、オーディオトラックが時々フェードアウトで終了するか、ノートがリバーブに減衰することです(soxが沈黙と間違えるような微妙なサウンド)。私はsoxコマンドを調整して無音でトラックを分割しようとしていますが、分割するたびに少し無音のままにしておきます。どうすればいいのか分かりません。ここに私がこれまでに持っているコマンドがあります: sox in.wav out.wav silence 1 2 0.5% 1 4.0 0.9% : newfile : restart これで何か助けていただければ幸いです!
9 sox 

3
生の(ヘッダーのない)オーディオファイルのエンコーディングは何ですか?
私はこれを行いました: me@riverbrain:~/sgf$ echo "test" | text2wave -otype raw -F 16000 >> test.raw これにより、ヘッダーのないオーディオファイルが生成されました。このファイルの素晴らしいところは、cat別の生のオーディオファイルと(テキストのように使用して)連結できることです。 もちろん、私には問題があります。問題は、まだプレイできないことです。 me@riverbrain:~/sgf$ play test.raw play FAIL formats: bad input format for file `test.raw': sampling rate was not specified また、サンプルレートを指定する場合 me@riverbrain:~/sgf$ play -r 16000 test.raw play FAIL formats: bad input format for file `test.raw': data encoding was not …
8 audio  sox 

3
Soxで多くのオーディオファイルのスペクトログラムを効率的に作成する方法は?
オーディオファイルがたくさんあるので、Soxを使用して個々のファイルごとにスペクトログラムを作成したいと思います。通常、単一のファイルの場合、私はこれを行います: sox audiofile.flac -n spectrogram ただし、このメソッドを複数のファイルに拡張する方法がわかりません。理想的には、出力.pngファイルにそれぞれのオーディオファイルに関連付けられたファイル名が必要です。例えばaudiofile1.pngのためaudiofile1.flac、audiofile2.png用audiofile2.flacというように。 誰もこれを行う方法を知っていますか?
3 audio  sox 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.