信号処理手法であるMel周波数Cepstrumは、機械学習タスクで使用するために楽曲から情報を抽出するためによく使用されます。この方法は短期間のパワースペクトルを与え、係数は入力として使用されます。
音楽検索システムの設計では、そのような係数は作品の特性と見なされます(明らかに一意である必要はありませんが、区別されます)。ネットワークでの学習により適した特性はありますか?エルマンネットワークのようなもので使用されている楽曲の低音進行のような時間的に変化する特性は、より効果的に機能しますか?
どの特性が、分類が行われる可能性のある十分に広範なセットを形成するでしょうか?