鳥のさえずりを検出して分類するためにPythonでプロジェクトに取り組んでおり、waveファイルを周波数対時間データに変換する必要がある状況にいます。これはそれほど問題ではありませんでしたが、さまざまな音節をグループに分類できるようにするには、データが特定の形にクラスター化されるときに検出する何かを書く必要があります。データがどのように見えるかを理解するために、プロットしたときにデータがどのように見えるかのイメージを次に示します。
SciPyを使用してそれらの間のピアソン相関を実行できるように、個々の音節(両側に分離がある各形状)を取得して変数または独自のファイルに保存する方法が必要です。
また、私はPythonを好みますが、別の方法でコーディングできる場合は、他の言語でコーディングすることもできます。
ありがとう!