つまり、人間の声は単一の正弦波ではなく、周波数の異なる無制限の正弦波の集まりではないことを知りました。
ウィキペディアによると、
声は、人間が声のひだを使って話したり、歌ったり、笑ったり、泣いたり、叫んだりして作った音で構成されています。その周波数の範囲は、約60〜7000 Hzです。
したがって、人間の声が複合信号である場合、60Hzから7KHzまでのさまざまな周波数範囲が含まれます。
同じ歌を一緒に歌っている人々のグループがいる場合、各人が独自の声の周波数の範囲を持っていると仮定します。
例えば、
人Aが次の周波数を持っている場合:100Hz、250HZ 6KHz、10Hz、87Hz、52Hz、2KHz .......
また、人物Bには、217Hz1、11Hz、12Hz、2323Hz、839Hz、4KHz、100Hz、10Hz ...があります。
上記の例のように、人Aと人Bの両方で類似している非常に多くの周波数が必要です。周波数100Hzと10Hzは2人の人の間で共通です。
私はテレビ番組名「フリンジ」を見ていました。そこでは、他の人の声もそこに存在している間に、オーディオファイルから特定の男の声を除外しました。
それで、すべての人に共通する周波数が非常に多い場合、人の周波数の振幅で何かをしなければならない場合、彼らは正確にどのようにして数百人の声から誰かの声をフィルタリングしますか?