私は現在、次のコードでScikit Learnを使用しています:
clf = svm.SVC(C=1.0, tol=1e-10, cache_size=600, kernel='rbf', gamma=0.0,
class_weight='auto')
そして、7つの異なるラベルを持つデータのセットを当てはめて予測します。奇妙な出力が出ました。検証セットで予測ラベルを使用する相互検証手法に関係なく、常にラベル7になります。
完全なデフォルトパラメータ(svm.SVC()
)を含む他のいくつかのパラメータを試しますが、私が使用するカーネルメソッドがのrbf
代わりにあるpoly
か、linear
それが機能しない限り、poly
およびに対しては非常にうまく機能しlinear
ます。
その上、検証データの代わりに列車データの予測をすでに試みており、完全に適合しています。
誰かがこの種の問題を以前に見て、ここで何が起こっているのか知っていますか?
私はクラスの分布を詳細に見ることはありませんが、約30%は7、14%は4であるべきだと思います。
私は手動の1-vs-rest実装を試みても、まだ役に立ちません。