回答:
長い連続したオーディオ録音を取り、1人のスピーカーだけが話しているチャンクに分割するタスク-各スピーカーの音声特性に関する事前の知識なしで-は、「スピーカーダイアライゼーション」と呼ばれます。研究コードへのリンクはウィキペディアのページにあります。
各音声の以前の録音があり、分類をしたい場合、これは少し異なる問題です(話者認識または話者識別)。そのためのソフトウェアツールはこちらから入手できます(SphinxやHTKなどの汎用の音声認識パッケージは、それを行うように調整できるほど柔軟です)。