以下のコードを使用して不正を検出するための分類器(デシジョンツリー、ランダムフォレスト、ロジスティック回帰などの標準的な分類器のいずれか)があると仮定します。
library(randomForest)
rfFit = randomForest(Y ~ ., data = myData, ntree = 400) # A very basic classifier
Say, Y is a binary outcome - Fraud/Not-Fraud
今、私は目に見えないデータセットを予測しました。
pred = predict(rfFit, newData)
次に、分類に関する調査チームからフィードバックを取得しましたが、不正を非詐欺(つまり、1つの偽陰性)に分類するのを間違えたことがわかりました。とにかく、アルゴリズムに間違いがあることをアルゴリズムに理解させることができますか?つまり、アルゴリズムにフィードバックループを追加して、間違いを修正できるようにする方法はありますか。
私の頭の上から考えることができる1つのオプションはadaboost classifier
、新しい分類器が古い分類器の間違いを修正するようにを構築することです。または私はの何かを聞いたことがありますIncremental Learning
かOnline learning
。に既存の実装(パッケージ)はありR
ますか?
それは正しいアプローチですか?または、モデルを最初から構築する代わりに微調整する他の方法はありますか?