私の問題は、バックグラウンドノイズのエネルギーがわからないことです。そのため、エネルギーをしきい値処理することはできません。処理はリアルタイムで行われ、500msec程度で判断します。理想的には、私は静かな子音が無音でないと考えたいです。
6
完全な答えを出すのに十分な情報がありませんが、あなたの問題は音声アクティビティ検出と呼ばれています。これを行うための合意された最良の方法は1つではありません。見れば、おそらく多くの異なるアプローチに出くわすでしょう。おそらく、他の人がもう少し具体化できるかもしれません。
—
Jason R
@Michael Litvin、非線形フィルターのクラスがあります(「エネルギー検出」で「Teager-Kaiser」という名前で使用されます。「ボルテラカーネル」として知られているもののサブセットだと思います。申し訳ありませんが、何も提供できません。。あなたは、あなたが探しているものを見つけるかもしれないそれらの単語の周りを検索した場合より多くの情報が、私はTeager-カイザー方法はクジラの音はVSだけで、バックグラウンドノイズ始まる「とき」に使用されていることを知っている
—
スペイシー